Python使用struct库的用法小结

struct简介

看到struct这么英文单词，大家应该并不陌生，因为c/c++中就有struct，在那里struct叫做结构体。在Python中也使用struct，这充分说明了这个struct应该和c/c++中的struct有很深的渊源。Python正是使用struct模块执行Python值和C结构体之间的转换，从而形成Python字节对象。它使用格式字符串作为底层C结构体的紧凑描述，进而根据这个格式字符串转换成Python值。

准确地讲，Python没有专门处理字节的数据类型。但由于b'str'可以表示字节，所以，字节数组＝二进制str。而在C语言中，我们可以很方便地用struct、union来处理字节，以及字节和int，float的转换。

故提供一个库来做转换。

常用函数

struct.pack(format:str, v1, v2, …)

按format的格式打包v1、v2等参数

import struct
result = [1,2,3,4,5]
print([struct.pack('<B', x) for x in result])
# [b'\x01', b'\x02', b'\x03', b'\x04', b'\x05']

struct.unpack(format:str,buffer:bytes)

按format的格式解包buffer数据，注意结果是一个数组

import struct
result = bytes.fromhex('10002030000000')
print(struct.unpack('<BHI', result))
# (16, 8192, 48)

上代码是按小端序列进行解析的

10被解析成了16

0020被解析成了 0x00 + 0x20 * 256 = 32*256 = 8192

30000000被解析成了 0x30 + 0x0 * 256 + 0x0 * 16? + 0x0 * 256? = 48

struct.calcsize(format:str)

按format的格式计算这个格式本应该的大小

import struct
print(struct.calcsize('<BHI')) # 7

B是1个字节，H是2个字节，I是4个字节，共7个字节

format参数的用法

数据

Format	C Type	Python	字节数
x	pad byte	None	1
c	char	int	1
b	signed char	int	1
B	unsigned char	int	1
?	Bool	bool	1
h	short	int	2
H	unsigned short	int	2
i	int	int	4
I	unsigned int	int	4
l	long	int	4
L	unsigned long	int	4
q	long long	int	8
Q	unsigned long long	int	8
f	float	float	4
d	double	float	8
s	char[]	bytes	1
p	char[]	bytes	1
P	void *	int	0

描述符

Character	Byte order	Size	alignment
`@`	native	native	凑足4个字节
`=`	native	standard	不作变化
`<`	little-endian	standard	不作变化
`>`	big-endian	standard	不作变化
`!`	network (= big-endian)	standard	不作变化

频道导航