C语言全方位讲解指针与地址和数组函数堆空间的关系
一、一种特殊的变量-指针
指针是C语言中的变量
- 因为是变量,所以用于保存具体值
- 特殊之处,指针保存的值是内存中的地址
- 内存地址是什么?
- 内存是计算机中的存储部件,每个存储单元有固定唯一的编号
- 内存中存储单元的编号即内存地址
需要弄清楚的事实
- 程序中的一切元素都存在于内存中,因此,可通过内存地址访问程序元素。
内存示例
获取地址
- C语言中通过 & 操作符获取程序元素的地址
- & 可获取变量,数组,函数的起始地址
- 内存地址的本质是一个无符号整数(4字节或8字节)
下面看一个简单的例子:
#include<stdio.h> int main() { int var = 0; printf("var value = %d\n", var); printf("var address = %p\n", &var); return 0; }
下面为输出结果:
注意事项
- 只有通过 内存地址+长度 才能确定一个变量中保存的值。
指针定义语法:
type *point;
- type - 数据类型,决定访问内存时的长度范围
- * 标志,意味着定义一个指针变量
- pointer 变量名,遵循C语言命名规则
例如:
int main() { char* pChar; short* pShort; int* pInt; float* pFloat; double* pDouble; return 0; }
指针内存访问:
* pointer
- 指针访问操作符(*)作用于指针变量即可访问内存数据
- 指针的类型决定通过地址访问内存时的长度范围
- 指针的类型统一占用 4 字节或 8 字节
即:sizeof(type*) == 4或 sizeof(type*) == 8
下面看一段代码,感受一下:
#include <stdio.h> int main() { int var = 0; int another = 0; int* pVar = NULL; printf("1. var = %d\n", var); printf("1. pVar = %p\n", pVar); pVar = &var; // 使用指针保存变量的地址 *pVar = 100; // *pVar 等价于 var , var = 100; printf("2. var = %d\n", var); printf("2. pVar = %p\n", pVar); pVar = &another; // 改变了 pVar 的指向,使得 pVar 保存 another 的地址 *pVar = 1000; // another = 1000; printf("3. another = %d\n", another); printf("3. pVar = %p\n", pVar); printf("4. add ==> %d\n", var + another + *pVar); // 100 + 1000 + 1000 ==> 2100 return 0; }
下面为输出结果:
注意 NULL 地址为 00000000
小结
- 指针是C语言中的变量(本质为容器)
- 指针专用于保存程序元素的内存地址
- 可使用 * 操作符通过指针访问程序元素本身
- 指针也有类型,指针类型由 数据类型+* 构成
二、深入理解指针与地址
灵魂三问
- 指针类型和普通类型之间的关系是什么?
- 何看待“内存地址+长度才能访问内存中的数据”?
- 不同类型的指针可以相互赋值吗?
初学指针的军规
- Type* 类型的指针只保存 Type 类型变量的地址
- 禁止不同类型的指针相互赋值
- 禁止将普通数值当作地址赋值给指针
注意:指针保存的地址必须是有效地址
下面看一段代码:
#include <stdio.h> int main() { int i = 10; float f = 10; int* pi = &f; // WARNING float* pf = &f; // OK printf("pi = %p, pf = %p\n", pi, pf); printf("*pi = %d, *pf = %f\n", *pi, *pf); pi = i; // WARNING *pi = 110; // OOPS printf("pi = %p, *pi = %d\n", pi, *pi); return 0; }
下面为输出结果:
这个程序犯了两个错误:
1、将不同类型的指针相互赋值,虽然 int 类型的指针变量保存的地址是对的,但是其所保存的值是错的。
2、 将普通数值当作地址赋值给指针,这会导致严重的错误,不能正确输出
编写函数交换两个变量的值
- 想要编写函数交换变量的值,那么,必须有能力在函数内部修改函数外部的变量!!!
看下面的代码:
#include <stdio.h> void func(int* p) { *p = 100; // 修改内存中 4 字节的数据,即:修改一个整型变量的值 } void swap(int* pa, int* pb) { int t = 0; t = *pa; *pa = *pb; *pb = t; } int main() { int var = 0; int a = 1, b = 2; printf("1. var = %d\n", var); func( &var ); printf("2. var = %d\n", var); printf("3. a = %d, b = %d\n", a, b); swap(&a, &b); printf("4. a = %d, b = %d\n", a, b); return 0; }
下面为输出结果:
小结论
可以利用指针从函数中“返回”多个值 (return只能返回一个值)!!
下面看一段代码:
#include <stdio.h> int calculate(int n, long long* pa, long long* pm) { int ret = 1; if( (1 <= n) && (n <= 20) ) { int i = 0; *pa = 0; *pm = 1; for(i=1; i<=n; i++) { *pa = *pa + i; *pm = *pm * i; } } else { ret = 0; } return ret; } int main() { long long ar = 0; long long mr = 0; if( calculate(5, &ar, &mr) ) printf("ar = %lld, mr = %lld\n", ar, mr); return 0; }
下面为输出结果:
这段代码中的子函数通过指针,计算了1加到5以及1乘到5的值,这就间接地通过指针从子函数“返回”多个值
小结
指针是变量,因此赋值时必须保证类型相同
指针变量保存的地址必须是有效地址
通过指针参数
- 一能够实现函数交换变量的值
- 一能够从函数中“返回”多个值
三、指针与数组(上)
问题
- 数组的本质是一片连续的内存,那么,数组的地址是什么?如何获取?
一些事实
- 使用取地址操作符&获取数组的地址
- 数组名可看作一个指针,代表数组中 0 元素的地址
- 当指针指向数组元素时,可进行指针运算(指针移动)
深入理解数组地址( int a[]= {1, 2, 3, 4, 5}; )
- &a 与 a 在数值上相同,但是意义上不同
- &a 代表数组地址,类型为:int(*)[5]
- a 代表数组0号元素地址,类型为: int*
- 指向数组的指针: int (*pName)[5] = &a;
下面看一段代码:
#include <stdio.h> int main() { int a[] = {1, 2, 3, 4, 0}; int* p = a; // a 的类型为 int*, &a[0] ==> int* int (*pa) [5] = &a; printf("%p, %p\n", p, a); p++; *p = 100; // a[1] = 100; printf("%d, %d\n", *p, a[1]); printf("%p, %p\n", &a, a); p = pa; // WARNING !!!! p = a; while( *p ) { printf("%d\n", *p); p++; } return 0; }
下面为运行结果:
需要注意的是,p 和 pa不是一个指针类型,所以令 p = pa 这种做法是不正确的。
注意
- 数组名并不是指针,只是代表了0号元素的地址,因此可以当作指针使用。
四、指针与数组(下)
指针与数组的等价用法
假如:
int a[ ] = {1, 2,3, 4,5}
int* p = a;
则以下等价:
a[i] <--> *(a + i) <--> *(p + i) <--> p[i]
下面看一段代码,加深理解:
#include <stdio.h> int main() { int a[] = {1, 2, 3, 4, 5}; int* p = a; int i = 0; // a[i] <==> *(a+i) <==> *(p+i) <==> p[i] for(i=0; i<5; i++) { printf("%d, %d\n", a[i], *(a + i)); } printf("\n"); for(i=0; i<5; i++) { printf("%d, %d\n", a[i], p[i]); } printf("\n"); for(i=0; i<5; i++) { printf("%d, %d\n", p[i], *(p + i)); } printf("\n"); printf("a = %p, p = %p\n", a, p); printf("&a = %p, &p = %p\n", &a, &p); return 0; }
下面为输出结果:
这里可以看到 a和 p的地址不同,因为它们是两个不同的指针变量。
字符串拾遗
- 字符串常量是 char* 类型,一种指针类型
指针移动组合拳:
int v = *p++;
解读:
指针访问操作符(*)和自增运算操作符(++) 优先级相同
所以,先从p指向的内存中取值,然后p进行移动
等价于:
int v = *p;
p++;
下面看一段代码,体会一下:
#include <stdio.h> int main() { int a[] = {1, 2, 3}; int* p = a; int v = *p++; char* s = NULL; printf("%p\n", "D.T.Software"); printf("%p\n", "D.T.Software"); printf("v = %d, *p = %d\n", v, *p); printf("First = %c\n", *"D.T.Software"); s = "D.T.Software"; while( *s ) printf("%c", *s++); printf("\n"); return 0; }
下面为输出结果:
因为D.T.Software 在全局数据区的起始地址一样,所以两次打印出来的地址一样。
小结
- 数组名可看作一个指针,代表数组中0元素的地址
- &a与a在数值上相同,但是意义上不同
- C语言中的字符串常量的类型是 char *
- 当指针指向数组元素时,才能进行指针运算
五、指针与函数
问题
- 函数调用时会跳转到函数体对应的代码处执行,那么,如何知道函数体代码的具体位置?
深入函数之旅
- 函数的本质是一段内存中的代码(占用一片连续内存)
- 函数拥有类型,函数类型由返回类型和参数类型列表组成
- 例:
函数申明 | 类型 |
int sum(int n); | int (int) |
void swap(int* pa, int* pb) | void (int*, int*) |
void g(void); | void (void) |
函数的一些事实
- 函数名就是函数体代码的起始地址(函数入口地址)
- 通过函数名调用函数,本质为指定具体地址的跳转执行
- 因此,可定义指针,保存函数入口地址
函数指针( Type func (Type1 a,Type2 b))
- 函数名即函数入口地址,类型为 Type(*)(Type1,Type2)
- 对于 func 的函数,&func 与 func 数值相同,意义相同
- 指向函数的指针:Type (*pFunc) (Type1, Type2) = func;
函数指针参数
- 函数指针的本质还是指针(变量,保存内存地址)
- 可定义函数指针参数,使用相同代码实现不同功能
注意
函数指针只是单纯的保存函数的入口地址
因此
- 只能通过函数指针调用目标函数
- 不能进行指针移动(指针运算)
下面看一段代码,理解一下:
#include <stdio.h> int add(int a, int b) { return a + b; } int mul(int a, int b) { return a * b; } int calculate(int a[], int len, int(*cal)(int, int)) { int ret = a[0]; int i = 0; for(i=1; i<len; i++) { ret = cal(ret, a[i]); } return ret; } int main() { int a[] = {1, 2, 3, 4, 5}; int (*pFunc) (int, int) = NULL; pFunc = add; printf("%d\n", pFunc(1, 2)); printf("%d\n", (*pFunc)(3, 4)); pFunc = &mul; printf("%d\n", pFunc(5, 6)); printf("%d\n", (*pFunc)(7, 8)); printf("1 + ... + 5 = %d\n", calculate(a, 5, add)); printf("1 * ... * 5 = %d\n", calculate(a, 5, mul)); return 0; }
下面为输出结果:
这里注意,只有调用的时候,才能确定 calculate() 子函数中的 cal 是什么函数。
再论数组参数
函数的数组形参退化为指针!因此,不包含数组实参的长度信息。使用数组名调用时,传递的是0号元素的地址。
void func(int a[ ]) <--> void func(int* a)
<--> void func (int a[1])
<--> void func (int a[10)
<--> void func(int a[100)
下面看一段代码:
#include <stdio.h> int demo(int arr[], int len) // int demo(int* arr, int len) { int ret = 0; int i = 0; printf("demo: sizeof(arr) = %d\n", sizeof(arr)); while( i < len ) { ret += *arr++; i++; } return ret; } int main() { int a[] = {1, 2, 3, 4, 5}; // int v = *a++; printf("return value: %d\n", demo(a, 5)); return 0; }
下面为输出结果:
定义的形参arr[]可以进行 *arr++ 的操作,这就说明函数的数组形参退化为指针,因为数组不可以进行 ++ 的运算。
小结
- 函数名的本质是函数体的入口地址
- 函数类型由返回类型和参数类型列表组成
- 可定义指向函数的指针:Type (*pFunc) (Type1,Type2);
- 函数指针只是单纯的保存函数的入口地址(不能进行指针运算)
六、指针与堆空间
再论内存空间
内存区域不同,用途不同
- 全局数据区:存放全局变量,静态变量
- 栈空间:存放函数参数,局部变量
- 堆空间:用于动态创建变量(数组)
堆空间的本质
- 备用的“内存仓库”,以字节为单位预留的可用内存
- 程序可在需要时从“仓库”中申请使用内存(动态借)
- 当不需要再使用申请的内存时,需要及时归还(动态还)
问题
- 如何从堆空间申请内存?如何归还?
预备知识-- void*
- void 类型是基础类型,对应的指针类型为 void*
- void* 是指针类型,其指针变量能够保存地址
- 通过 void* 指针无法获取内存中的数据(无长度信息)
void* 总结
- 不可使用void*指针直接获取内存数据。
- void*指针可与其它数据指针相互赋值。
下面看一段代码:
#include <stdio.h> int main() { char c = 0; int i = 0; float f = 2.0f; double d = 3.0; void* p = NULL; double* pd = NULL; int* pi = NULL; /* void* 指针可以保存任意类型的地址 */ p = &c; p = &i; p = &f; p = &d; printf("%p\n", p); // void* 类型的指针无法访问内存中的数据 // printf("%f\n", *p); /* void* 类型的变量可以直接合法的赋值给其他具体数据类型的指针变量 */ pd = p; pi = p; // void* 是例外,其他指针类型的变量不能相互赋值 // pd = pi; return 0; }
下面为输出结果:
注意几个问题:
1.void* 指针可以保存任意类型的地址
2.void* 类型的指针无法访问内存中的数据
3.void* 类型的变量可以直接合法的赋值给其他具体数据类型的指针变量
4.void* 是例外,其他指针类型的变量不能相互赋值
堆空间的使用
- 工具箱:stdlib.h
- 申请:void* malloc ( unsigned bytes )
- 归还:void free( void* p)
堆空间的使用原则
- 有借有还,再借不难(杜绝只申请,不归还)
- malloc申请内存后,应该判断是否申请成功
- free只能释放申请到的内存,且不可多次释放(free 释放的是堆空间的地址)
下面看一段代码感受一下:
#include <stdio.h> #include <stdlib.h> int main() { int* p = malloc(4); // 从堆空间申请 4 个字节当作 int 类型的变量使用 if( p != NULL ) // 如果申请失败 p 为 0 ,即:空值 { *p = 100; printf("%d\n", *p); free(p); } p = malloc(4 * sizeof(int)); if( p != NULL ) { int i = 0; for(i=0; i<4; i++) { p[i] = i * 10; } for(i=0; i<4; i++) { printf("%d\n", p[i]); } free(p); } return 0; }
下面为输出结果:
小结
- 堆空间是程序中预留且可用的内存区域
- void*指针只能能够保存地址,但无法获取内存数据
- void*指针可与其它数据指针相互赋值
- malloc申请内存后,应该判断是否申请成功
- free只能释放申请到的内存,且不可多次释放
七、指针专题经典问题剖析
多级指针
- 可以定义指针的指针保存其它指针变量的地址
如:
Type v;
Type *pv = &v;
Type** ppv = &pv;
type*** pppv = &ppv;
下面看一段代码:
#include <stdio.h> #include <stdlib.h> int main() { int a = 0; int b = 1; int* p = &a; int** pp = &p; **pp = 2; // a = 2; *pp = &b; // p = &b; *p = 3; // b = 3; printf("a = %d, b = %d\n", a, b); return 0; }
下面为输出结果:
*pp 就是取 pp 里面的内容,而 pp 里面存的内容是 p 的地址,所以 *pp 就相当于p 的内容,而 p 的内容就是 a 的地址,所以说 **p 就相当于 a,**p = 2 也就是把 2 赋值给 a,*pp = &b 即为 p = &b,所以 *p = 3,就是把 3 赋值给 b。
下面再看一段代码:
#include <stdio.h> #include <stdlib.h> int getDouble(double** pp, unsigned n) { int ret = 0; double* pd = malloc(sizeof(double) * n); if( pd != NULL ) { printf("pd = %p\n", pd); *pp = pd; ret = 1; } return ret; } int main() { double* p = NULL; if( getDouble(&p, 5) ) { printf("p = %p\n", p); free(p); } return 0; }
下面为输出结果:
这里特别注意:函数外的一个一级指针指向了这里申请的堆空间
再论二维数组
二维数组的本质是一维数组 ,即:数组中的元素是一维数组!!
因此:
int a[2][2];
a 就是 &a[0]
a[0] 的类型是 int[2]
可知 a 的类型是 int (*)[2]
下面看一段代码:
#include <stdio.h> #include <stdlib.h> int main() { int b[2][2] = {{1, 2}, {3, 4}}; int (*pnb) [2] = b; // b 的类型是 int(*)[2] *pnb[1] = 30; printf("b[0][0] = %d\n", b[0][0]); printf("b[0][1] = %d\n", b[0][1]); printf("b[1][0] = %d\n", b[1][0]); printf("b[1][1] = %d\n", b[1][1]); return 0; }
下面为输出结果:
pnb[0]是[1,2],pnb[1]经过赋值后是[30,4],所以*(pnb[1])就是取该数组所代表的第0个元素,也就是30。
下面再看一个代码:
#include <stdio.h> #include <stdlib.h> int* func() { int var = 100; return &var; } int main() { int* p = func(); // OOPS!!!! // p 指向了不合法的地址,这个地址处没有变量存在 // p 是一个野指针,保存不合法地址的指针都是野指针 printf("*p = %d\n", *p); *p = 200; // 改变 func 函数中局部变量 var 的值,是不是非常奇怪??? printf("*p = %d\n", *p); return 0; }
这段代码是有问题的, func() 函数执行后, var 这个变量就会被销毁,所以 p 指向了一个不合法的地址。
小结
- 可以定义指向指针的指针(保存指针变量的地址)
- 一维数组名的类型为Type* (变量地址类型)
- 二维数组名的类型为Type (*)[N](数组地址类型)
- 不要从函数中返回局部变量/函数参数的地址