2.2.python第二章：字符编码

it2023-09-12 123

字符串编解码转化

文件(utf-8编码)----(读取：转换为unicode)—>记事本(文字等内容在内存中为unicode编码)-----(保存，转换为utf-8)----->文件(utf-8)

服务器(生成内容由Unicode转换utf-8传输)------>输出utf-8网页内容------->浏览器

print(ord('A'))# 65 print(ord('我'))# 25105 print(chr(65))# A print(chr(25105))# 我 # 字符需要传输和保存，需要我们对字符进行编解码，utf-8通用编解码 x = b'你好' # byte数组 print(x) # 报错bytes can only contain ASCII literal characters.中文超出了ascll码解码范围 # 在bytes中，无法显示ASC字符的字节，用\x##表示 print('你好'.encode('utf-8')) # b'\xe4\xbd\xa0\xe5\xa5\xbd' print(b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8'))#你好在含有中文的内容处理中，尽量使用UTF8。关于优化：中文较多用gbk，英文较多用utf-8，可以优化传输

最新回复(0)