pandas to

it2023-01-14  58

操作流程

df.to_csv('out.csv', encoding="utf-8") 执行完之后,提示 UnicodeDecodeError: ‘utf-8’ codec can’t decode byte *** invalid start byte

错误原因

有些字符不是ASCII码,因此不能用utf-8进行编码

修改方法

df.to_csv('out.csv', sep='\t', encoding='utf-8') 一般情况下可以加上index=False来去除行号 df.to_csv('out.csv', sep='\t', encoding='utf-8'), index=False 还有一种可能需要以UTF_8 with BOM编码(微软产品能正确识别UTF_8 with BOM存储的中文文件)存储 data.to_csv('out.csv',encoding='utf_8_sig'), index=False

参考

https://stackoverflow.com/questions/16923281/writing-a-pandas-dataframe-to-csv-filehttps://stackoverflow.com/questions/41228697/pandas-to-csv-ascii-cant-encode-character
最新回复(0)