在pyton中,通过struct模块来对二进制进行转换,主要包括两大类函数,即用于打包的pack和用于解包的unpack。

其中,struct.pack的输入格式为struct.pack(format, v1, v2, ...),其中format为格式字符串,v1,v2..为将要转成bytes的字符。

例如

>>> import struct
>>> struct.pack('i', 15)
b'\x0f\x00\x00\x00'
>>> struct.pack('iii', 15, 16, 17)
b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00'
>>> struct.pack('b', 255)   #b格式的取值范围是-128到127
struct.error: byte format requires -128 <= number <= 127
>>> struct.pack('b', 200)
b'\xc8'
>>> struct.pack('b', 71)    #128以内可用ascii表示
b'g'

i代表int,15对应的二进制代码为f000,故其输出为b\x0f\x00\x00\x00。当格式字符串为iii时,说明要将三个数字以整数类型转化为二进制。

其中,格式化字符串中的每个字符都代表一种数据类型,其中整型相关的字符如下,左侧为带符号整型,右侧为无符号整型

  c语言类型   c语言类型 标准大小
b signed char b unsigned char 1
h short h unsigned short 2
i int i unsigned int 4
l long l unsigned long 4
q long long q unsigned long long 8
n ssize_t n size_t  

其他类型

格式 c 类型 python 类型 标准大小
x 填充字节  
c char 长度为1的字节串  
? _bool bool 1
e   float 2
f float float 4
d double float 8
s char[] 字节串  
p char[] 字节串  
p void* 整数  

struct中提供了获取标准大小的函数,calcsize:

>>> struct.calcsize('b')
1
>>> struct.calcsize('i')
4

除了声明被格式化时的数据类型,struct还可以指定对齐方式,例如

>>> struct.pack("i",15)
b'\x0f\x00\x00\x00'
>>> struct.pack(">i",15)    #小端序
b'\x00\x00\x00\x0f'
>>> struct.pack("<i",15)    #大端序
b'\x0f\x00\x00\x00'

其对应字符的含义分别为

@ = < > !
本机 本机 小端 大端 网络(大端)

其中默认为@,即本机字节顺序。

在熟悉了pack之后,与之对偶的unpack也就没啥难度了

>>> test = struct.pack("iii",125,1255,12555)
>>> struct.unpack("iii",test)
(125, 1255, 12555)

除了packunpackstruct模块还提供了c语言风格的一对函数pack_intounpack_from,二者的声明分别为

struct.pack_into(format, buffer, offset, v1, v2, ...)
struct.unpack_from(format, /, buffer, offset=0)

其中buffer表示缓冲流,在pack_into中,将v1,v2...offset的偏置打包入buffer中;在unpack_from中,将buffer中的数据从offset处依次取出。

struct中封装了用于二进制处理的类struct,按照以往经验,其pack函数的实现方法很有可能是下面这种

def pack(format,*args):
    return struct(format).pack(args)

其中struct的初始化方法就是输入一个格式化字符串,例如

>>> s = struct.struct("iii")
>>> s.pack(1,2,3)
b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注www.887551.com的更多内容!