知行编程网知行编程网  2023-01-14 08:30 知行编程网 隐藏边栏  11 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python3如何中文转换编码?的相关知识,包括python3编码,以及python字符串编码转换这些编程知识,希望对大家有参考作用。

我相信你们都习惯使用中文。就算你的英语水平再好,毕竟中文更好用。但是,在计算机编程中,英语仍然是主要语言,这会给我们的实际操作带来一些麻烦。有时中文无法被计算机语言识别,从而导致错误。今天就python3中文转换url编码相关问题给大家带来实例讲解。

处理百度贴吧的东西。我想做一个关键字列表,每次需要的时候直接添加

只需转到列表即可。但是如果添加到中文列表中(比如'丽江'),url的地址码是'%E4%B8%BD%E6%B1%9F',所以需要


要做一个转换。这里我们就用到了模块urllib。

>>> import urllib
>>> data = '丽江'
>>> print data
丽江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'


那我们想转回去呢?

>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江


细心的同学会发现贴吧
url

出现的是%C0%F6%BD%AD,而不是'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他一般网站比如google都是utf8。所以可以使用下面的语句来实现。

>>> import sys,urllib
>>> s = '丽江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>

以上就是python3中文转换url编码的方法,是不是很实用~毕竟编程中转换中文不是一件容易的事情。学过的朋友赶紧保存起来,不然下次又要重新找办法了。

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享