导语:
本文主要介绍了关于python如何判断中文是否一致的相关知识,包括python中文字符串处理,以及python 中文识别这些编程知识,希望对大家有参考作用。
Python判断两个相等的中文字符串为假,设置两个要比较的字符串的unicode编码为'utf-8'并不能解决问题。具体原因如下:
1.首先检查要比较的两个字符串的编码格式,使用命令:
import chardet
......
string_code = chardet.detect(string_word)
比较两个字符串的编码结果,如下图所示:
一种编码格式是“UTF-8-SIG”,另一种编码格式是“utf-8”。两个字符串的编码格式不同,所以比较的结果不相等;
编码是'UTF-8-SIG',因为文件在存储时是用UTF-8格式编码的,如果文件以UTF-8不带BOM格式存储,读取的数据编码格式自然会变成'utf -8' .
2、文件重新存储为UTF-8无BOM格式,重新比较两个相等的字符串,返回值为True,即两个字符串相等。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ -= 在 python 中是什么意思08/17
- ♥ 如何计算python 10的阶乘08/14
- ♥ Python监控功能示例11/18
- ♥ 在哪里写python代码08/26
- ♥ 如何编写python循环11/06
- ♥ 如何在python中安装matplotlib08/25
内容反馈