Python 2.x获取操作系统的默认编码和UnicodeDecodeError处理

发表时间:2017-05-24 13:39 | 分类:Python | 浏览:91 次

之前有朋友反馈nagios微信报警插件在处理中文字符的时候会出现问题,因为时间关系这个问题就一直放着。今天抽空解决了下,已经可以正常使用了。具体代码可以详见github,我的github地址:https://github.com/zhangnq/nagios/tree/master/weixin 。这个主要是json库在调用dumps方法时出现了问题。现在加上一个获取操作系统编码的逻辑后测试正常。

在python 2.x中,出现json格式内容前的任何字符串会先decode成unicode格式,默认dumps使用utf8格式。但是如果当输入的字符串编码不是utf8,那么就会出现类似错误了。例如:

UnicodeDecodeError: 'utf8' codec can't decode byte 0xb2 in position 77: invalid start byte

如何获取操作系统的默认编码可以使用这个方法,例如:

sys.stdin.encoding

修改后的代码类似如下:

try:
    data=json.dumps(values)
except:
    import sys
    sys_encoding=sys.stdin.encoding
    data=json.dumps(values,encoding=sys_encoding)

在调用dumps方法的时候指定encoding为系统默认编码。

参考连接:

https://stackoverflow.com/questions/25203209/how-to-fix-json-dumps-error-utf8-codec-cant-decode-byte-0xe0-in-position-2

https://stackoverflow.com/questions/37506535/how-to-get-the-system-default-encoding-in-python-2-x

本文标签:

本文链接:http://www.sijitao.net/2584.html

欢迎您在本博客中留下评论,如需转载原创文章请注明出处,谢谢!

博客历程 留言本 文章归档 网站地图 谷歌地图 浙ICP备13025236号-1
托管于阿里云&七牛云 已加入博客联盟 浙公网安备 33021202000610号
Copyright © 2010-2017 虫虫开源 All Rights Reserved.