参考:https://www.mscto.com/python/616828.html
做爬虫时链接拼如汉字发现不能请求到正确的地址,以为是需要加cookie、换成get请求等,试了多次,发现是链接中汉字未转义。
例如将汉字“北京大学”转义成“%E5%8C%97%E4%BA%AC%E5%A4%A7%E5%AD%A6”后,url才能完成请求。
Python语法:
urllib.parse.quote() 转义汉字urllib.parse.unquote() 解析还原汉字
from urllib import parse
name = '北京大学'
name = urllib.parse.quote(name) # 将汉字转义
print(name)
# 输出 %E5%8C%97%E4%BA%AC%E5%A4%A7%E5%AD%A6
-