知行编程网知行编程网  2022-12-26 16:00 知行编程网 隐藏边栏  7 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python chardet检测编码的相关知识,包括python 异常,以及python中文编码这些编程知识,希望对大家有参考作用。

python chardet检测编码

1.当我们得到一个字节时,我们可以对其进行检测和编码。使用chardet检测编码,只需要一行代码:

>>> chardet.detect(b'Hello, world!')
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

检测到的代码是 ascii。注意还有一个confidence字段,表示检测概率为1.0(即100%)。

2、检测GBK编码的中文

>>> data = '离离原上草,一岁一枯荣'.encode('gbk')
>>> chardet.detect(data)
{'encoding': 'GB2312', 'confidence': 0.7407407407407407, 'language': 'Chinese'}

检测到的编码是GB2312。请注意,GBK 是 GB2312 的超集。两者是相同的编码。正确检测的概率为 74%。语言字段指示的语言为“中文”。

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享