从报错讲起:
UnicodeDecodeError:'gbk'codeccan'tdecodebyte0xaainposition2:illegalmultibytesequence
出现这个错误一般是由于打开文件时,没有指定编码引起的,比如下面代码
withopen('../corpus.txt',mode='r')asf:
解决方法很简单,为其指定编码就行了
withopen('../corpus.txt',encoding='utf-8',mode='r')asf:
还有一个常见的问题就是,生成txt文件,查看内容时发现乱码,这可能与你在打开文件时没有指定编码方式有关
代码就像这样
output=open('context.txt','w')
解决的方式也很简单,只要在打开文件时,指定文件编码就行了
output=open('context.txt','w',encoding="utf-8")原文来自:https://www.py.cn
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容