@fuheimao
2019-06-23T14:25:32.000000Z
字数 2149
阅读 930
C++
很久没写博客了,那这次就写一篇稍微硬核一点的……写得有点杂乱×
int arr[10];
当提到arr到底是什么的时候,一些人可能会说它是指向数组首元素的指针,即&arr[0]。但事实上,这种说法是不对的。
数组的类型就是数组。
也就是说,arr就是一个可以存放 10 个int的数组,其类型为int [10]。
但是在某些情况下,数组名会隐式类型转换为指向数组首元素的指针,例如:
std::cout << *(arr + 1);
上述代码中,arr即被转换为了int*,这句代码等价于:
std::cout << arr[1];
反过来,[]运算符其实会展开成那样。说到这里,就不得不提一下,arr[1]还可以写作1[arr]。因为前者会展开成*(arr + 1),后者会展开成*(1 + arr),这两个当然是一样的。
数组退化为指针时,会产生一些问题,比如丢失长度信息。
int sum(int* arr) {int length = sizeof(arr) / sizeof(int);int s = 0;for (int i = 0; i < length; ++i) {s += arr[i];}return s;}
上述函数的理想作用为对传入的arr数组进行求和,但由于传入参数时,数组退化为指针,已经丢失了长度信息,所以sizeof(arr)其实是一个int*所占的字节数。解决这个问题的方法有很多,例如再传入该数组的长度作为第二个参数。
既然arr是数组,那么&arr是什么呢?
&arr是arr这个数组的指针,类型为int (*)[10]。当arr退化为指针时,其值与&arr的值相同,不过由于它们的类型不同,对它们进行运算得到的结果也不同。我们知道,对于指针进行加减运算,其实是以该指针基类型所占的字节数为单位进行移动的。如arr + 1,则移动了 4 字节。而&arr的基类型为 10 个元素的int数组,那么&arr + 1自然会移动 40 字节。
你可能注意到int (*)[10]中的*是加了括号的,而这个括号也是必要的。如果不加,int* [10]则变成了int* pointer[10]中pointer的类型,即有 10 个int*元素的数组。
C++ 11引入了“序列 for 循环”,例如:
for (auto i : arr) {std::cout << i << " ";}
这样做就可以遍历arr中的每个元素。
假设你有一个奇葩的需求,比如要从arr[1]开始遍历,而且想用序列 for 循环,那该怎么办呢?
一位同学写出了如下的代码(当然是不对的):
for (auto i : arr + 1) {std::cout << i << " ";}
由于对arr进行了运算,它退化成了指针。而序列 for 循环依赖于std::begin()与std::end(),这两个函数仅对数组和容器有效。
指针之间是可以相互转换的。
我们可以通过恰当的类型转换来完成上述任务。
for (auto i : *(int (*)[9])(arr + 1)) {std::cout << i << " ";}
之前我们提到,数组首元素地址与数组地址值相同,现在我们需要从arr[1]开始遍历,那自然,从这里开始的数组有 9 个元素,数组地址与arr[1]地址相同,所以我们把arr + 1这个指针转换为数组指针,再解引用,即得到了这个数组,也就可以使用序列 for 循环语句了。
我们知道C++使用虚函数实现多态特性。对象中有一个虚函数表指针,而虚函数表中则存放了虚函数们的指针。有没有什么办法来验证呢?请看如下程序:
#include <iostream>using namespace std;class Test {public:virtual void fun1() {cout << "fun1 is called" << endl;}virtual void fun2() {cout << "fun2 is called" << endl;}};typedef void (*func)();int main() {Test t;cout << &t << endl;cout << (int*)(&t) << endl;cout << (int*)*(int*)(&t) << endl;func f1 = (func)*((int*)*(int*)(&t) + 0);func f2 = (func)*((int*)*(int*)(&t) + 1);f1();f2();return 0;}
为简单起见,在测试类中只有两个无参无返回值的虚函数。而func为指向无参无返回值的函数的指针类型。
一般情况下,虚函数表指针位于对象最开始。我们假设该程序为 32 位程序,即所有地址占 4 字节。那么虚函数表指针就位于对象开始 4 字节。
(int*)(&t)即将该对象指针转换为int*,解引用后获得该对象开始 4 字节的数据,即虚函数表指针的值,再将该值转换为int*,则(int*)*(int*)(&t)就是虚函数表首元素的地址了。我们令int* p = (int*)*(int*)(&t),现在就可以把p看成一个装着虚函数地址的数组了。*(p + 0)就是该数组第一个元素,即第一个虚函数fun1的地址,再把它转换为func类型,到此,我们就可以成功调用fun1了!由于p数组是连续的,*(p + 1)则是第二个虚函数fun2的地址。
思考:如果是 64 位程序,会有什么不同呢?
(本文完,想到啥再补充×)