我的一些粗浅理解,如下,理解错了,欢迎大家指正 编译器维护一个符号映射表: 3栏(或3个字段): 1。类型栏(变量类型或函数类型) 2。名字栏(变量名或函数名) 3。地址栏(是相对地址,加载后,由操作系统重新调整,成员变量类型的这一栏就放偏移值) 每声明定义一个变量或成员函数时,编译器就生成一个映射元素, 类型栏、名字栏在编译时由编译器负责填写, 地址栏在连接时由连接器负责填写(地址都为相对地址,在加载后,由操作系统调整,也就是地址重定位) 如: int a; A varA; 生成的两条映射表记录为:
名字栏 | 类型栏 | 地址栏 a | int | (由连接器填写)指向a的声明定义处 varA | A | (由连接器填写)指向varA的声明定义处
有关编译器动态绑定技术,请看如下列:
class a { public: virtual fun1(); void fun2(); /* 出现virtual 关键字,编译器为该类创建虚表
索引 | 函数指针 0 | 指向 a::fun1()定义处
出现成员函数声明,编译器填写映射表 名字栏 | 类型栏 | 地址栏 a::fun2() | a::fun2 | (由连接器填写)指向a::fun2()定义处 */ } //b继承自a class b :public a { public: virtual fun1(); void fun3(); /* 虚函数fun1(): 重新定义,创建虚表,并继承了父类的虚表项, 修改了虚表中第一项(“a::fun1()函数”)的指针,使指向自己定义b::fun1()函数 索引 | 函数指针 0 | 指向 b::fun1()定义处
出现成员函数fun3()声明,映射表中增加一栏:
名字栏 | 类型栏 | 地址栏 b::fun3() | b::fun3 | 指向b::fun3()定义处
从父类中继承的成员函数fun2() 映射表中增加一栏:记录从a继承的fun2()函数 名字栏 | 类型栏 | 地址栏 b::fun2() | a::fun2 | 指向父类a::fun2()定义处 */ } //c继承自a class c :public a { public: virtual fun1(); void fun4(); /* 虚函数fun1(): 重新定义,创建虚表,并继承了父类的虚表项, 修改了虚表中第一项(“a::fun1()函数”)的指针,使指向自己定义c::fun1()函数 索引 | 函数指针 0 | 指向 c::fun1()定义处
出现 成员函数fun4(),映射表中增加一栏: 名字栏 | 类型栏 | 地址栏 c::fun4() | c::fun4 | 指向c::fun4()定义处
从父类中继承的成员函数fun2() 映射表中增加一栏:记录从a继承的fun2()函数 名字栏 | 类型栏 | 地址栏 c::fun2() | a::fun2 | 指向父类a::fun2()定义处 */ } 调用 main() { b var1; c var2; a* p; p = &var1; var1.fun2(); /* var1.fun2()调用,静态绑定: 编译到此处时,编译器到映射表中找名字栏,找到b::fun2()名字(由于var1为b类型),其对应的类型栏为“函数类型,类型名为a::fun2(因为此函数由a类型定义)”,其地址栏的指针值为“指向a::fun2()定义处”,所以,此处函数调用,被编译器替换为“转向:地址栏的指针值”,实际上可理解为是修改指令记数器的值为“地址栏的指针值” */ */p->fun2(); /*p->fun2(),静态绑定:这个容易理解,编译时,是找“a::fun2()”名字(因为p是a类型) */ p->fun2(),静态绑定:这个容易理解,编译时,是找“a::fun2()”名字(因为p是a类型) */ p->fun3();
/* p->fun3(),这个调用,可能要发生编译错误,因为类型a没有声明和定义fun3()函数,找不到a::fun3()名字,只有b::fun3()名字 */ p->fun1(); /* p->fun1();fun1()是个虚函数,同理,编译到此处时,编译器是不是也到映射表中找“a::fun1()”名字呢?不是的。 因为,在映射表中,是找不到a::fun1()”这个名字的,因为,fun1()名字声明前有关键字"virtual", 在类声明和定义时,编译器,为每个出现virtual关键字的类,维护一个全局数据结构“虚表”
虚表: 1。索引;2。函数指针(这值在子类重写虚函数后,发生相应变化) 所以上面调用,在编译器发现调用的是“虚函数”时, 编译器做了如下处理:
将p->fun1() 替换为:p->vptr[offset],
vptr名字为虚表指针: 由编译器维护(上面提到),每个含虚函数的类,其生成对象,在内存中,首先的四个字节就是vptr,这个值是静态的,同一个类型的所有对象的vptr值相同,指向同一个虚表; offset值随虚函数声明次序而定,如果第一个声明,索引则为0,出现在虚表的第一项,第二个声明则为1,以次。。。(此时offset 为 0 即是:p->vptr[0]) p为基类,可指向子类的任何对象 (附加: 1。类型转换实际是:内存切割,管辖内存从大变小,从大变小,现实世界中,是允许,在C++中,也是允许的;编译器不允许基类对象向子类对象的转化,因为从小变大,会导致内存访问越界。 2。指针的类型,实际上决定了通过该指针能访问的内存范围 ),
所指向对象的类型不同,vptr不同 所以,p->vptr[0],函数调用地址值在编译时,是不可能确定,主要因为 p指针所指向对象不能确定(p是指向b,还是指向c?还是其他。。,但offset是可以确定的) 从而,vptr值不能确定, 直到程序运行时,p->vptr[0]调用的函数地址,视p所指向对象类型而定 如果p指向b子类,则p指向内存中的首4字节的vptr指向b的虚表,虚表第一项的指针指向自己函数定义的地址处 如果p指向c子类,则。。。。 这种直到运行时,才能确定函数调用地址的方式,即为:“动态绑定” */ p = &var2; p->fun1();//动态绑定,同上 p->fun2();//静态,同上
虚表: 1。索引;2。函数指针(这值在子类重写虚函数后,发生相应变化) 所以上面调用,在编译器发现调用的是“虚函数”时, 编译器做了如下处理:
将p->fun1() 替换为:p->vptr[offset],
vptr名字为虚表指针: 由编译器维护(上面提到),每个含虚函数的类,其生成对象,在内存中,首先的四个字节就是vptr,这个值是静态的,同一个类型的所有对象的vptr值相同,指向同一个虚表; offset值随虚函数声明次序而定,如果第一个声明,索引则为0,出现在虚表的第一项,第二个声明则为1,以次。。。(此时offset 为 0 即是:p->vptr[0]) p为基类,可指向子类的任何对象 (附加: 1。类型转换实际是:内存切割,管辖内存从大变小,从大变小,现实世界中,是允许,在C++中,也是允许的;编译器不允许基类对象向子类对象的转化,因为从小变大,会导致内存访问越界。 2。指针的类型,实际上决定了通过该指针能访问的内存范围 ),
所指向对象的类型不同,vptr不同 所以,p->vptr[0],函数调用地址值在编译时,是不可能确定,主要因为 p指针所指向对象不能确定(p是指向b,还是指向c?还是其他。。,但offset是可以确定的) 从而,vptr值不能确定, 直到程序运行时,p->vptr[0]调用的函数地址,视p所指向对象类型而定 如果p指向b子类,则p指向内存中的首4字节的vptr指向b的虚表,虚表第一项的指针指向自己函数定义的地址处 如果p指向c子类,则。。。。 这种直到运行时,才能确定函数调用地址的方式,即为:“动态绑定” */ p = &var2; p->fun1();//动态绑定,同上 p->fun2();//静态,同上
p = &var2; p->fun1();//动态绑定,同上 p->fun2();//静态,同上
p->fun4(); //编译出错,因为fun4()非虚函数,编译器在映射表中找不到a::fun4()名字, //除非强行转换:((c*)p)->fun4(), }
|