UnicodeDecodeError: 'utf8'编解码器无法解码位置0中的字节0xa5:无效的开始字节

我使用Python-2.6 CGI脚本，但在服务器日志中发现这个错误，而做json.dumps()，

Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(__getdata())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

在这里,

__get data()函数返回字典{}。

在发布这个问题之前，我已经提到了这个问题。

更新

下面一行是伤害JSON编码器，

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) # this is the culprit

我有个临时解决办法

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

但我不确定这是正确的做法。

当前回答

在读取csv时，我添加了一个编码方法:

import pandas as pd
dataset = pd.read_csv('sample_data.csv', header= 0,
                        encoding= 'unicode_escape')

2019-03-28 06:15:00

其他回答

我简单地通过在read_csv()命令中定义一个不同的编解码器包来切换:

Encoding = 'unicode_escape'

Eg:

import pandas as pd
data = pd.read_csv(filename, encoding= 'unicode_escape')

2018-05-26 01:15:05

试试下面的代码片段:

with open(path, 'rb') as f:
  text = f.read()

2017-09-07 09:39:27

您可以使用特定用法和输入的任何标准编码。

Utf-8是默认值。

iso8859-1在西欧也很流行。

例句:bytes_obj.decode(“iso8859-1”)

看:文档

2019-11-11 11:22:21

下面一行是伤害JSON编码器，

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

我有个临时解决办法

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

将此标记为正确的临时修复(不确定)。

2014-03-19 10:23:35

from io import BytesIO

df = pd.read_excel(BytesIO(bytes_content), engine='openpyxl')

为我工作

2021-01-02 00:13:36

UnicodeDecodeError: 'utf8'编解码器无法解码位置0中的字节0xa5:无效的开始字节

推荐文章

最新文章

标签