2.2.python第二章:字符编码

it2023-09-12  74

字符串编解码转化

文件(utf-8编码)----(读取:转换为unicode)—>记事本(文字等内容在内存中为unicode编码)-----(保存,转换为utf-8)----->文件(utf-8)

服务器(生成内容由Unicode转换utf-8传输)------>输出utf-8网页内容------->浏览器

print(ord('A'))# 65 print(ord('我'))# 25105 print(chr(65))# A print(chr(25105))# 我 # 字符需要传输和保存,需要我们对字符进行编解码,utf-8通用编解码 x = b'你好' # byte数组 print(x) # 报错bytes can only contain ASCII literal characters.中文超出了ascll码解码范围 # 在bytes中,无法显示ASC字符的字节,用\x##表示 print('你好'.encode('utf-8')) # b'\xe4\xbd\xa0\xe5\xa5\xbd' print(b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8'))#你好 在含有中文的内容处理中,尽量使用UTF8。 关于优化:中文较多用gbk,英文较多用utf-8,可以优化传输
最新回复(0)