目录
————————————————Take Me Hand ————————————————
正文开始——
1. 结构体类型的声明
结构体是一种类型,类似于 int、char、double 等,只不过结构体类型是一种自定义类型。
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
1.1. 结构的一般声明
1 struct tag 2 { 3 member-list;(成员列表) 4 }variable-list;(变量列表) 5 struct student 6 { 7 char name[20]; 8 int age; 9 char sex; 10 }; //此处分号很重要
1.2. 结构的特殊声明
1 //匿名结构体类型 2 struct 3 { 4 member-list; 5 }x; 6 7 8 struct 9 { 10 member-list; 11 }*p;
上面的结构体没有类型名,故称为匿名结构体类型,其中成员变量相同。分别创建了x,*p这两个结构体变量,思考下面的代码是否合理?
1 p = &x;
答案是:不合理。编译器会认为上面的匿名结构体是两种不同的类型。
同时还要注意:匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用一次。
2. 结构体变量的创建和初始化
3. 结构体的自引用
在结构体中包含一个类型为该结构体本身的成员是否可以呢?
比如,定义一个链表的节点,在这个节点处能够找到下一个节点的位置及其数据。
1 struct Node 2 { 3 int data; 4 struct Node next; 5 };
答案是:no。如果可以的话 ,sizeof(struct Node)的大小是多少?如果一个结构体中再包含一个同类型的结构体变量,这样结构体变量的大小就会无穷大,不合理。
1 struct Node 2 { 3 int data; 4 struct Node* next; 5 };
【注意】
在结构体自引用的过程中,夹杂了 typedef 对匿名结构体类型重命名,这里需要注意。
1 typedef struct 2 { 3 int data; 4 Node* next; 5 }Node;
这里对结构体进行了重命名(Node),但是在匿名结构体内部提前使用 Node 类型来提前创建成员变量,这不可以。所以定义结构体不要使用匿名结构体。
1 typedef struct Node 2 { 3 int data; 4 struct Node* next; 5 }Node;
4. 结构体内存对齐
结构体的大小是多少呢?
在计算其大小之前,我们要了解什么是结构体内存对齐。
4.1. 对其规则(面试考点)
- 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数=编译器默认的一个对齐数与该成员变量大小的较小值。VS默认的对齐数为8,Linux中gcc没有默认对齐数,对齐数就是成员自身的大小。
- 结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数中最大的)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
练习:
4.2. 为什么存在内存对齐?
4.2.1. 平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处去取某些特定类型的数据,否则抛出硬件异常。
4.2.2. 性能原因
数据结构(尤其是栈)应该尽可能的在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要做两次内存访问;而对齐的内存只需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的 double 类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被放在两个8字节内存块中。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
我们在设计结构体时,既要满足对齐,又要节省空间,我们可以让占用空间小的成员尽量集中在一起
4.3. 修改默认对齐数
#pragma 这个预处理指令,可以改变编译器的默认对齐数。
结构体在对齐方式不合适时,我们可以自己更改默认对齐数。
5. 结构体传参
1 struct S 2 { 3 int data[1000]; 4 int num; 5 } 6 7 struct S s={{1,2,3,4},1000}; 8 9 //结构体传参 10 void print1(struct S s) 11 { 12 printf("%d\n",s.num); 13 } 14 //结构体传址调用 16 void print1(struct S *ps) 17 { 18 printf("%d\n",ps->num); 19 } 20 21 int main() 22 { 23 print1(s); 24 print2(&s); 25 retrun 0; 26 }
上面的 print1 和 print2 这两个函数哪个好呢?
首选 print2函数。
- 函数传参的时候,参数是需要压栈,会有时间的空间的系统开销。
- 如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。
6. 结构体实现位段
6.1. 什么是位段?
位段的声明和结构是类似的,有两个不同。
- 位段的成员必须是 int、unsigned int 或 signed int,在C99中位段成员的类型也可以选择其他类型。
- 位段的成员名后边有一个冒号和一个数字。
比如:
1 struct A 2 { 3 int _a:2; 4 int _b:5; 5 int _c:10; 6 int _d:30; 7 }
A就是一个位段类型。
那位段所占内存的大小是多少呢?
6.2. 位段的内存分配
- 位段的成员可以是 int、signed int、unsigned int 或者 char 等类型。
- 位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
冒号后面的数指的是二进制的比特位,例如,a后面的3,指的是把3转换二进制后只能存储3个比特位。
1 struct S 2 { 3 char a:3; 4 char b:4; 5 char c:5; 6 char d:4; 7 } 8 struct S s={0}; 9 s.a=10; 10 s.b=12; 11 s.c=3; 12 s.d=4;
6.3. 位段的跨平台问题
- int 位段被当做有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出现问题)
- 位段中的成员在内存中从左向右分配,还是从右向左分配,标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
【总结】跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台问题的存在。
6.4. 位段的应用
在网络协议中,IP数据报的格式,我们可以看到其中很多的属性只需要几个bit位就能描述,这里使用位段,能够实现想要的效果,也节省了空间,这样网络传输的数据报大小也会较小一些,对网络的畅通是有帮助的。
6.5. 位段使用的注意事项
位段中几个成员共用一个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配一个地址,一个字节内部的bit位是没有地址的。
所以不能对位段的成员使用&操作符,这样就不能使用 scanf 直接给位段的成员输入值,但是可以先输入放在一个变量中,然后赋值给位段的成员。
1 struct A 2 { 3 int _a:3; 4 int _b:5; 5 int _c:3; 6 int _d:9; 7 } 8 9 int main() 10 { 11 struct A sa = {0}; 12 scanf("%d",&sa._b); //错误示范 13 14 //正确做法 15 int b = 0; 16 scanf("%d",&b); 17 sa._b = b; 18 return 0; 19 }
完——
————————————————Take Me Hand ————————————————
期待我们下一次的相遇!再见——