知行编程网知行编程网  2022-10-10 09:00 知行编程网 隐藏边栏  130 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python如何判断中文是否一致的相关知识,包括python中文字符串处理,以及python 中文识别这些编程知识,希望对大家有参考作用。

python如何判断中文是否一致

Python判断两个相等的中文字符串为假,设置两个要比较的字符串的unicode编码为'utf-8'并不能解决问题。具体原因如下:

1.首先检查要比较的两个字符串的编码格式,使用命令:

import chardet
......
string_code = chardet.detect(string_word)

比较两个字符串的编码结果,如下图所示:

python如何判断中文是否一致

一种编码格式是“UTF-8-SIG”,另一种编码格式是“utf-8”。两个字符串的编码格式不同,所以比较的结果不相等;

编码是'UTF-8-SIG',因为文件在存储时是用UTF-8格式编码的,如果文件以UTF-8不带BOM格式存储,读取的数据编码格式自然会变成'utf -8' .

2、文件重新存储为UTF-8无BOM格式,重新比较两个相等的字符串,返回值为True,即两个字符串相等。

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享