自定义类型总结

2019-06-13 C/C++ 自定义类型评论

结构的存储分配

内存对齐的意义

平台原因（移植原因）：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常
性能原因：数据结构（尤其是栈）应该尽可能地在自然边界上对齐。为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问
结构体的内存对齐是拿空间来换取时间的做法

内存对齐规则

第一个成员在与结构体变量偏移量为0的地址处
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。对齐数=编译器默认的一个对齐数与该成员大小的较小值。VS中默认的值为8，Linux中的默认值为4
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

修改默认对齐数

#pragma pack(8) //设置默认对齐数为8
#pragma pack() //取消设置的默认对齐数，还原为默认对齐数

计算偏移量

有两种方法：

struct S {
    int a;
    char b;
    double c;
} s;

printf("%d\n", ((char*)&s.b - (char*)&s));
利用宏定义实现
#define FIND(type, var) ((size_t)&(((type*)0)->var))
这样不需要实例化对象也可以，C标准库也有自带的，offsetof宏(stddef.h)
offsetof(type, member) 返回值为指定成员开始存储的位置距离结构开始存储的位置偏移几个字节

位段

位段的成员可以是int，signed int，unsigned int或者是char（属于整形家族）类型
位段的空间上是按照需要以4个字节（int）或者1个字节（char）的方式来开辟的
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段

位段的跨平台问题

int位段被当成有符号数还是无符号数是不确定的
位段中最大位的数目不能确定（16位机器最大16，32位机器最大32）
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的

跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在

枚举

枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量
#define宏常量是在预编译阶段进行简单替换。枚举常量则是在编译的时候确定其值

enum Color {
    RED,
    GREEN,
    BLUE
};
enum Color clr = GREEN; // 只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr = 1; // 在C语言中可以这样赋值，因为C语言中枚举和整型是一种类型，而C++中枚举是一个单独的类型所以会报错

联合

在union中所有的数据成员共用一个空间，所有的数据成员具有相同的起始地址

在C++中，union成员默认属性页为public。union主要用来压缩空间。如果一些数据
不可能在同一时间同时被用到，则可以使用union

联合的大小至少是最大成员的大小。当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍

联合的初始化

联合变量可以被初始化，但这个初始值必须是联合第1个成员的类型，而且它必须位于一对花括号里面

union {
    int a;
    float b;
    char c[4];
} x = { 5 }; // 不能把这个类量初始化为一个浮点值或字符值，如果给出的初始值是任何其他类型，它就会转换为一个整数并赋值给x.a

一个有趣的问题

typedef struct str {
    int len;
    char s[7];
} str;

int main() {
    str* f = NULL;
    if (f->s) { // 这里会出错吗？
        printf("%d\n", sizeof(f->s));
    }
    return 0;
}

这样完全没有问题，并且输出结果为7
用空指针访问成员变量为什么不会出错？
我们可以测试下这个代码
printf("%d\n", f->s); // 输出为4
其实，所谓变量，其实是内存地址的一个抽像名字罢了。在静态编译的程序中，所有的变量名都会在编译时被转成内存地址。机器是不知道我们取的名字的，只知道地址
所以有了——栈内存区，堆内存区，静态内存区，常量内存区，我们代码中的所有变量都会被编译器预先放到这些内存区中
不管结构体的实例是什么------访问其成员其实就是加成员的偏移量
由于f为NULL，所以f->s就是给NULL加上偏移量4，并没有发生读取内存操作，但是如果这样：
printf("%d\n", f->s[1]); // 读取非法内存，会崩掉
printf("%d", f->len); // 读取非法内存，会崩掉
printf("%d", &(f->len)); // 没有读取内存，不会崩掉

本文链接： https://ranjiahao.github.io/2019/06/13/%E8%87%AA%E5%AE%9A%E4%B9%89%E7%B1%BB%E5%9E%8B%E6%80%BB%E7%BB%93/
版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

RanI am a student

stay healthy and happy