Python保存为json中文Unicode乱码解决json.dump()

作者

筋斗云

首页»
业界新闻»
新闻资讯»
Python保存为json中文Unicode乱码解决json.dump()

发布时间:2024-07-13 22:31

阅读量:0

保存为json中文Unicode乱码：

可以看到，中文字符没有乱码，只是出现了反斜杠，此时解决方法应考虑是否进行了二次序列化。

一、原因1

在dump时加入ensure_ascii=False 即可解决，即json.dump(json_data, f, indent=4, ensure_ascii=False)

二、原因2

json.dumps(data_dict, ensure_ascii=False)已经进行了序列化，在写入文件时，又采用json.dump(json_data, f, indent=4, ensure_ascii=False)方法导致二次序列化，改为f.write(json_data)即可。

import os import json import numpy as np  np.set_printoptions(linewidth=400)  data_list = [] result_list = [] is_duplicate = [] for filename in os.listdir("./log_data"):     print(filename)     with open("./log_data/" + filename, 'r', encoding="utf-8") as f:         line = f.readline()         while line:             data = line[line.find("【param】") + len("【param】") + 1:line.find("【result】") - 2]             result = line[line.find("【result】") + len("【result】") + 1:line.find(", 【headers】")]             data_list.append(data)             result_list.append(result)             line = f.readline()  effective_set = set() print(len(data_list)) for data in data_list:     try:         data_dict = json.loads(data)         trace_id = data_dict.pop("trace_id")         print(data_dict["match_start_date"])         effective_set.add(json.dumps(data_dict, ensure_ascii=False))     except:         pass         continue  print(len(effective_set))   n = 1 for json_data in effective_set:     if n <= 87:         with open("./log_data2json/" + f'{hash(json_data)}' + ".json", 'w', encoding="utf-8") as f:             # json.dump(json_data, f, indent=4, ensure_ascii=False)             f.write(json_data) # 避免二次序列化         n += 1 print(n)

json.dump()与json.dumps()的区别

json.dumps()：将Python字典转为字符串：

import json  # 定义 Python 对象 data = {     "name": "John",     "age": 30,     "city": "New York" }  # 将 Python 对象转换为 JSON 字符串 json_str = json.dumps(data)  # 打印 JSON 字符串 print(json_str)

json.dump将Python字典写入文件：

import json  # 定义 Python 对象 data = {     "name": "John",     "age": 30,     "city": "New York" }  # 打开文件并将 Python 对象写入文件 with open('data.json', 'w') as f:     json.dump(data, f)

json.load()与json.loads()的区别

json.load()读取文件，转化为字典：

with open('s.json', 'r') as f:     s1 = json.load(f) # dict

json.loads()将字符串转为字典：

s = '{"name": "wade", "age": 54, "gender": "man"}' type(json.loads(s))) # dict

总结

加s的（loads、dumps）操作的是字符串
不加s的（load、dump）操作的是文件，用于读写文件。

广告一刻

为您即时展示最新活动产品广告消息，让您随时掌握产品活动新动态！

弹性云特惠专区

轻量云年度专区

裸金属物理服务器

支持

资讯

Python保存为json中文Unicode乱码解决json.dump()

一、原因1

二、原因2

json.dump()与json.dumps()的区别

json.load()与json.loads()的区别

总结

相关阅读

广告一刻