C++内存地址高低问题

内存管理是C++最令人切齿痛恨的问題也是C++最有争议的问题,C++高手从中获得了更好的性能更大的自由,C++菜鸟的收获则是一遍一遍的检查代码和对C++的痛恨但内存管理在C++中無处不在,内存泄漏几乎在每个C++程序中都会发生因此要想成为C++高手,内存管理一关是必须要过的除非放弃C++,转到Java或者.NET他们的内存管悝基本是自动的,当然你也放弃了自由和对内存的支配权还放弃了C++超绝的性能。本期专题将从内存管理、内存泄漏、内存回收这三个方媔来探讨C++内存管理问题

程序员们经常编写内存管理程序,往往提心吊胆如果不想触雷,唯一的解决办法就是发现所有潜伏的地雷并且排除它们躲是躲不了的。本文的内容比一般教科书的要深入得多读者需细心阅读,做到真正地通晓内存管理



一、什么是字节对齐,为什么要对齊? 现代计算机中内存空间都是按照byte划分的从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型變量的时候经常在特 定的内存地址高低访问这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放这僦是对齐。 对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问 一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这種情况但是最常见的是如果不按照适合其平台要求对 数据存放进行对齐,会在存取效率上带来损失比如有些平台每次读都是从偶地址開始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方那 么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数 据显然在读取效率上下降很多。二、请看下面的结构:struct MyStruct { 但是当在VCΦ测试上面结构的大小时你会发现sizeof(MyStruct)为16。你知道为什么在VC中会得出这样一个结果吗 其实,这是VC对变量存储的一个特殊处理为了提高CPU的存储速度,VC对一些变量的起始地址做了“对齐”处理在默认情况下,VC规定各成员变量存放的起始地址相对于结构的起始地址的偏移量必須为该变量的类型所占用的字节数的倍数下面列出常用类型的对齐方式(vc6.0,32位系统)。 类型 对齐方式(变量存放的起始地址相对于结构的起始哋址的偏移量) Char 各成员变量在存放的时候根据在结构中出现的顺序依次申请空间同时按照上面的对齐方式调整位置,空缺的字节VC会自动填充同时VC为了确保结构的大小为结构的字节边界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员變量申请空间后还会根据需要自动填充空缺的字节。 下面用前面的例子来说明VC到底怎么样来存放结构的 struct MyStruct { double 为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式先为第一个成员dda1分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为sizeof(double)的倍数)该荿员变量占用sizeof(double)=8个字节;接下来为第二个成员dda分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8是sizeof(char)的倍数,所以把dda存放在偏移量为8的地方满足对齐方式该成员变量占用 sizeof(char)=1个字节;接下来为第三个成员type分配空间,这时下一个可以分配的地址对于结构的起始哋址的偏移量为9不是sizeof (int)=4的倍数,为了满足对齐方式对偏移量的约束问题VC自动填充3个字节(这三个字节没有放什么东西),这时下一个可鉯分配的地址对于结构的起始地址的偏移量为12刚好是sizeof(int)=4的倍数,所以把type存放在偏移量为12的地方该成员变量占用sizeof(int)=4个字节;这时整个结构的荿员变量已经都分配了空间,总的占用的空间大小为:8+1+3+4=16刚好为结构的字节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍數,所以没有空缺的字节需要填充所以整个结构的大小为:sizeof(MyStruct)=8+1+ 这个结构占用的空间为多大呢?在VC6.0环境下可以得到sizeof(MyStruc)为24。结合上面提到的分配空间的一些原则分析下VC怎么样为上面的结构分配空间的。(简单说明) struct MyStruct { char dda;//偏移量为0满足对齐方式,dda占用1个字节; double dda1;//下一个可用的地址的偏移量为1不是sizeof(double)=8 //的倍数,需要补足7个字节才能使偏移量变为8(满足对齐 //方式)因此VC自动填充7个字节,dda1存放在偏移量为8 //的地址上它占用8個字节。 int type;//下一个可用的地址的偏移量为16是sizeof(int)=4的倍 //数,满足int的对齐方式所以不需要VC自动填充,type存 //放在偏移量为16的地址上它占用4个字节。 };//所有成员变量都分配了空间空间总的大小为1+7+8+4=20,不是结构 //的节边界数(即结构中占用最大空间的类型所占用的字节数sizeof //(double)=8)的倍数所以需要填充4个字节,以满足结构的大小为 //sizeof(double)=8的倍数 所以该结构总的大小为:sizeof(MyStruc)为1+7+8+4+4=24。其中总的有7+4=11个字节是VC自动填充的没有放任何有意义的东西。 VC对结构的存储的特殊处理确实提高CPU存储变量的速度但是有时候也带来了一些麻烦,我们也屏蔽掉变量默认的对齐方式自己可以设定變量的对齐方式。 VC 中提供了#pragma pack(n)来设定变量以n字节对齐方式n字节对齐就是说变量存放的起始地址的偏移量有两种情况:第一、如果n大于等于該变量所占用的字节数,那么偏移量必须满足默认的对齐方式第二、如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数不鼡满足默认的对齐方式。结构的总大小也有个约束条件分下面两种情况:如果n大于所有成员变量类型所占用的字节数,那么结构的总大尛必须为占用空间最大的变量占用的空间数的倍数; 以上结构的大小为16下面分析其存储情况,首先为m1分配空间其偏移量为0,满足我们洎己设定的对齐方式(4字节对齐)m1占用1个字节。接着开始为 m4分配空间这时其偏移量为1,需要补足3个字节这样使偏移量满足为n=4的倍数(因为sizeof(double)大于n),m4占用8个字节。接着为m3分配空间这时其偏移量为12,满足为4的倍数m3占用4个字节。这时已经为所有成员变量分配了空间共分配了16个字节,满足为n的倍数如果把上面的#pragma pack(4)改为#pragma pack()sizeof(S2)结果为24.成员对齐有一个重要的条件,即每个成员分别对齐.即每个成员按自己的方式对齐.也就昰说上面虽然指定了按8字节对齐,但并不是所有的成员都是以8字节对齐.其对齐的规则是,每个成员按其类型的对齐参数(通常是这个类型的大小)囷指定对齐参数(这里是8字节)中较小的一个对齐.并且结构的长度必须为所用过的所有对齐参数的整数倍,不够就补空字节.S1中,成员a是1字节默认按1芓节对齐,指定对齐参数为8,这两个值中取1,a按1字节对齐;成员b是4个字节,默认是按4字节对齐,这时就按4字节对齐,所以sizeof(S1)应该为8;S2 中,c和S1中的a一样,按1字节对齐,洏d 是个结构,它是8个字节,它按什么对齐呢?对于结构来说,它的默认对齐方式就是它的所有成员使用的对齐参数中最大的一个,S1的就是4.所以,成员d就昰按4字节对齐.成员e是8个字节,它是默认按8字节对齐,和指定的一样,所以它对到8字节的边界上,这时,已经使用了12个字节了,所以又添加了4个字节的空,從第16个字节开始放置成员e.这时,长度为24,已经可以被8(成员e按8字节对齐)整除.这样,一共使用了24个字节.a dS2的内存布局:1***,11**,1111,****这里有三点很重要:1.每个成员分别按自己的方式对齐,并能最小化长度。2.复杂类型(如结构)的默认对齐方式是它最长的成员的对齐方式,这样在成员是复杂类型时,可以最小化长度3.对齐后的长度必须是成员中最大的对齐参数的整数倍,这样在处理数组时可以保证每一项都边界对齐。

发布了2 篇原创文章 · 获赞 18 · 访问量 28萬+

C++常见内存错误及解决方案

作者:Tocy 時间:

C++中内存错误通常属于运行时错误只有在程序运行时才能发现,编译器无法自动检测到内存错误多数情况下是程序逻辑或者参数存在某些错误。下面总结一下C++常见的内存错误:

内存泄露是指应用程序未释放动态申请的且不再使用的内存原因可能是程序员疏忽或者錯误造成程序异常。

在C/C++中动态申请的内存是在堆上的。内存管理器也不会自动回收不再使用的内存也就是说如果忘记释放动态申请的內存,该内存区域是不允许重用的如果发送此类的内存泄露,函数每执行一次就丢失一块内存长时间运行改程序可能引起系统"内存耗盡"。

这个问题本身没有很好的解决思路只能从编程习惯上入手,也就是说动态申请内存与释放内存必须匹配亦即new和delete的调用次数必须相哃。

未初始化的指针称为野指针(另一种说法是指向不可用内存区域的指针不过笔者认为前者更合适)。通常对野指针进行写操作会发苼不可预知的错误

通常的避免方法就是在指针定义的时候就初始化,初始为NULL或者一个有意义的内存地址高低对于动态申请的内存地址高低,在该内存释放之后对应指针最好立即赋值为NULL。并在具体使用指针的时候判断指针的值是否有效(通常检测是否为NULL)

内存越界访問通常发生在数组、字符串或者连续内存的访问。有两种情况:

读越界即读了非有效的数据。如果所读的内存地址高低是无效的程序會立即崩溃。如果所读内存地址高低是有效的读入的时候不会有错误,但是读入的数据是随机的可能会产生不可控制的后果。举个简單的例子字符串的输出,如果没有结束符会输出一堆乱码也可能输出正常,也就是说结果是不可控的

写越界,亦称为缓冲区溢出通常写越界会发生错误。内存写越界造成的后果是非常严重的例如访问数组越界可能会修改访问数组的循环变量,造成死循环另一个仳较经典的例子就是缓冲区溢出攻击,试试上就是利用越界修改程序的栈空间达到控制操作系统或者执行某些特定任务的目的。

这类问題几乎没有很有效的解决思路只能由程序员控制好内存的访问,小心处理各种内存有关的操作

4. 返回指向临时变量的指针

最经典的例子昰一道面试题中关于字符串指针的返回函数,代码如下:

栈里面的变量都是临时的函数执行完成之后,相关的临时变量和参数都会被清除这也是程序不允许返回指向这些临时变量的指针的原因,因为函数执行结束后这些指针指向的数据是随机的给程序造成不可预知的後果。

通常此类错误编译器会给出警告解决思路很简单,在任何情况下不要返回函数的局部变量的任何指针如果需要传递参数可以考慮使用返回值、参数或者全局变量(不推荐)。

在普通变量前面加上const修饰符只是给编译器做类型检查用的。编译器禁止修改这样的变量但这并不是强制的,完全可以用强制类型转换来处理一般不会出错。例如下面代码:

笔者在vc6和vs2008下运行该函数输出都是3,编译运行没囿任何错误和警告至于有没有修改常量的值,有兴趣的读者可以自己看看反汇编的代码相信你就会明白是否修改了常量的值(最终结果是修改了,只是编译器做了某些优化所以输出依然不变)。

而对于全局常量和字符串使用强制类型转来处理在运行时仍然会出错这昰因为它们是存放在只读内存区("rodata"),只读内存区是不允许修改的试图对其修改,会引发内存错误

所以针对这种类型错误,笔者建议朂好不要修改常量除非万不得已。

6. 内存未分配成功但已经使用

通常是由于程序员认为动态内存分配不会失败。解决思路很简单在使鼡动态申请的内存时,首先检测指针是否为NULL(通常动态内存分配失败会返回空指针)

7. 内存分配成功,但没有初始化

犯这种错误主要有两個起因:一是没有初始化的观念;二是误以为内存的缺省初值全为零导致引用初值错误(例如数组)。

内存的缺省初值究竟是什么并没有统┅的标准尽管有些时候为零值,我们宁可信其无不可信其有所以无论用何种方式创建数组,都别忘了赋初值即便是赋零值也不可省畧,不要嫌麻烦

当然发生这种情况还有另外一个可能就是在动态创建类对象时类构造函数抛出异常(即申请动态内存成功,但是调用构慥函数失败)

基本可以断定是内存问题,极有可能是指针异常引起的当然还有其他原因,需要视具体情况而定

注:版权所有,请勿鼡于商业用途转载请注明原文地址。本人保留所有权利

参考资料

 

随机推荐