知行编程网知行编程网  2022-08-11 14:19 知行编程网 隐藏边栏  78 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python中unicode编码转换为中文的相关知识,包括python2编码unicode,以及python文件编码转换这些编程知识,希望对大家有参考作用。


在python中将unicode编码转换为中文


我们使用python中,遇到爬取网站情况,用到unicode编码,我们需要将它转换为中文,unicode编码转换为中文的方法有四种:

使用unicode_escape 解码、

使用encode()方法转换,再调用bytes.decode()转换为字符串形式、

使用json.loads 解码(为json 格式)、

使用eval(遇到Unicode时就是通过请求爬网)。详情请参阅这篇文章。






方法一:使用unicode_escape 解码

unicode = b'\\u4f60\\u597d'
re = unicode.decode("unicode_escape")
print(re)

返回:你好

方法二:使用encode()方法进行转换,然后调用bytes.decode()转换成字符串形式

s = r'\u4f60\u597d'
print(s.encode().decode("unicode_escape"))



方法三: 使用json.loads 解码(

为json 格式



str = '\u4eac\u4e1c\u653e\u517b\u7684\u722c\u866b'
 
print json.loads('"%s"' %str)



方法四:使用eval(遇到Unicode是通过requests在网上爬取的时候)

response = requests.get(url,headers=headers)
re = eval("u"+"\'"+response.text+"\'")
print(re)

以上就是小编整理的python中将unicode编码转换为中文的方法。希望对你有帮助~

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享