0%

流量解析过程中常用的一些工具

在实际流量解析过程中一般使用

1.url编码解码-urllib

​ python使用urllib包来进行url编码和解码,对于python3:

1
2
3
4
5
6
7
8
9
10
11
12
import urllib

rawurl="xxc=B&z0=GB2312&z1=%E4%B8%AD%E5%9B%BD"

#python2
url = url.unquote(rawurl)

#python3
url=urllib.parse.unquote(rawurl)

output:
'xxc=B&z0=GB2312&z1=中国'

2.字符串转十六进制

​ 字符串转十六进制可以分为两种:1.对于已经是十六进制格式,但是已经被转为字符串,例如:””

1
2
3
import binascii

#python3

3.原始字节串和十六进制字节串之间的转化—binascii

1
2
3
4
5
6
7
8
9
10
import binascii

data_bytes = b"cfb5cdb3d5d2b2bbb5bdd6b8b6a8b5c4c2b7beb6a1a3"
data_hex = b'\xcf\xb5\xcd\xb3\xd5\xd2\xb2\xbb\xb5\xbd\xd6\xb8\xb6\xa8\xb5\xc4\xc2\xb7\xbe\xb6\xa1\xa3'

#原始字节串==>十六进制字节串
binascii.hexlify(data_bytes)

#十六进制字节串==>原始字节串
binascii.unhexlify(data_bytes)