时间:2022-09-01 09:27:30 | 栏目:Python代码 | 点击:次
看到struct这么英文单词,大家应该并不陌生,因为c/c++中就有struct,在那里struct叫做结构体。在Python中也使用struct,这充分说明了这个struct应该和c/c++中的struct有很深的渊源。Python正是使用struct模块执行Python值和C结构体之间的转换,从而形成Python字节对象。它使用格式字符串作为底层C结构体的紧凑描述,进而根据这个格式字符串转换成Python值。
准确地讲,Python没有专门处理字节的数据类型。但由于
b'str'
可以表示字节,所以,字节数组=二进制str。而在C语言中,我们可以很方便地用struct、union来处理字节,以及字节和int,float的转换。故提供一个库来做转换。
按format的格式打包v1、v2等参数
import struct result = [1,2,3,4,5] print([struct.pack('<B', x) for x in result]) # [b'\x01', b'\x02', b'\x03', b'\x04', b'\x05']
按format的格式解包buffer数据,注意结果是一个数组
import struct result = bytes.fromhex('10002030000000') print(struct.unpack('<BHI', result)) # (16, 8192, 48)
上代码是按小端序列进行解析的
10被解析成了16
0020被解析成了 0x00 + 0x20 * 256 = 32*256 = 8192
30000000被解析成了 0x30 + 0x0 * 256 + 0x0 * 16? + 0x0 * 256? = 48
按format的格式计算这个格式本应该的大小
import struct print(struct.calcsize('<BHI')) # 7
B是1个字节,H是2个字节,I是4个字节,共7个字节
Format | C Type | Python | 字节数 |
---|---|---|---|
x | pad byte | None | 1 |
c | char | int | 1 |
b | signed char | int | 1 |
B | unsigned char | int | 1 |
? | Bool | bool | 1 |
h | short | int | 2 |
H | unsigned short | int | 2 |
i | int | int | 4 |
I | unsigned int | int | 4 |
l | long | int | 4 |
L | unsigned long | int | 4 |
q | long long | int | 8 |
Q | unsigned long long | int | 8 |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | bytes | 1 |
p | char[] | bytes | 1 |
P | void * | int | 0 |
Character | Byte order | Size | alignment |
---|---|---|---|
@ |
native | native | 凑足4个字节 |
= |
native | standard | 不作变化 |
< |
little-endian | standard | 不作变化 |
> |
big-endian | standard | 不作变化 |
! |
network (= big-endian) | standard | 不作变化 |