知行编程网知行编程网  2022-11-24 08:00 知行编程网 隐藏边栏  28 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python读txt乱码如何解决的相关知识,希望可以帮到处于编程学习途中的小伙伴

python读取txt乱码的解决方法

从报错讲起:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence

出现这个错误一般是由于打开文件时,没有指定编码引起的,比如下面代码

with open('../corpus.txt', mode = 'r') as f:

解决方法很简单,为其指定编码就行了

with open('../corpus.txt', encoding='utf-8',  mode = 'r') as f:

还有一个常见的问题就是,生成txt文件,查看内容时发现乱码,这可能与你在打开文件时没有指定编码方式有关

代码就像这样

output = open('context.txt', 'w')

解决的方式也很简单,只要在打开文件时,指定文件编码就行了

output = open('context.txt', 'w', encoding="utf-8")

推荐学习《
》!

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享