[关闭]
@StarSky 2017-05-08T12:48:02.000000Z 字数 517 阅读 470

2016-12-28 Python字符编码问题

工作日记 Python


str 乱码的问题遇到好几次( python2 的锅):
python 字符串 encode & decode 问题
python 编码处理
21 行 python 拼写检查(译文)
21 行 python 拼写检查(原文)
python 里很多函数都是针对的 unicode 类型的数据,使用时请注意,尽量统一使用 unicode 编码。
后来发现 python 自带的一个函数就超好用。。
比较两个字符串的相似度

字符与码值转换

chr()、unichr()和ord()

编码格式判断

import chardet
chardet.detect(rawdata)

重置utf-8编码

reload(sys)
sys.setdefaultencoding('utf-8')

可以将‘\\u’编码还原为unicode编码格式。不明所以。

str.decode('unicode-escape')

关于控制台输出时无误,重定向到 log 日志报 ascii 编码异常的问题遇到过好多次了,需要记一下。大概是说控制台默认 utf-8 编码,而重定向之后不设置默认编码格式的话按照 ascii 编码,遇到中文什么的马上就会报错了。
python print 重定向到文件时编码错误

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注