在实际流量解析过程中一般使用
1.url编码解码-urllib
python使用urllib包来进行url编码和解码,对于python3:
1 2 3 4 5 6 7 8 9 10 11 12
| import urllib
rawurl="xxc=B&z0=GB2312&z1=%E4%B8%AD%E5%9B%BD"
url = url.unquote(rawurl)
url=urllib.parse.unquote(rawurl)
output: 'xxc=B&z0=GB2312&z1=中国'
|
2.字符串转十六进制
字符串转十六进制可以分为两种:1.对于已经是十六进制格式,但是已经被转为字符串,例如:””
3.原始字节串和十六进制字节串之间的转化—binascii
1 2 3 4 5 6 7 8 9 10
| import binascii
data_bytes = b"cfb5cdb3d5d2b2bbb5bdd6b8b6a8b5c4c2b7beb6a1a3" data_hex = b'\xcf\xb5\xcd\xb3\xd5\xd2\xb2\xbb\xb5\xbd\xd6\xb8\xb6\xa8\xb5\xc4\xc2\xb7\xbe\xb6\xa1\xa3'
binascii.hexlify(data_bytes)
binascii.unhexlify(data_bytes)
|