当前位置:主页 > 软件编程 > Python代码 >

python封装json格式字符串并处理单双引号问题

时间:2023-03-02 09:35:15 | 栏目:Python代码 | 点击:

在使用python做web服务的时候会有数据交互的情况,大多数目前会采用json格式的数据来交互,接收者接收到标准的json格式数据后,会比较方便解析数据。

我这里有一个场景是将三个数组类型的数据封装成json格式的字符串并发送给消费方,三个数组类型的数据是:

print(boxes)
print(scores)
print(txts)
#以下是打印结果
#第一个:
[array([[292., 294.],
       [331., 293.],
       [349., 848.],
       [309., 850.]], dtype=float32), array([[339., 299.],
       [378., 298.],
       [392., 660.],
       [353., 662.]], dtype=float32)]
#第二个:
[0.9401206, 0.8182683]
#第三个:
['土地整治与土壤修复研究中心', '华南农业大学丨东图']

我这样封装成str格式:

txts_str = ""
for i in range(len(txts)):
	if (len(txts_str) == 0):
		txts_str = str(txts[i])
	else:
        #因为是字符串句子,选一个不常用的符号“|”做间隔
		txts_str = txts_str + "|" + str(txts[i])
 
txt_scores = ""
for i in range(len(scores)):
	if(len(txt_scores) == 0):
		txt_scores = str(scores[i])
	else:
		txt_scores = txt_scores + "|" + str(scores[i])
 
txt_boxes = ""
for i in range(len(boxes)):
	for j in range(len(boxes[i])):
		for k in range(len(boxes[i][j])):
			if (len(txt_boxes) == 0):
				txt_boxes = str(boxes[i][j][k])
			else:
				txt_boxes = txt_boxes + "," + str(boxes[i][j][k])
 
#打印一下
print(txt_boxes)
print(txts_str)
print(txt_scores)
 
#打印结果:
#292.0,294.0,331.0,293.0,349.0,848.0,309.0,850.0,339.0,299.0,378.0,298.0,392.0,660.0,353.0,662.0
#土地整治与土壤修复研究中心|华南农业大学丨东图
#0.9401206|0.8182683

封装成json:

 
#然后封装成json:
result_data = {"txt_boxes": txt_boxes, "txts": txts, "txt_scores": txt_scores}

发现是单引号的格式,并不是标准json:

#{'txt_boxes': '292.0,294.0,331.0,293.0,349.0,848.0,309.0,850.0,339.0,299.0,378.0,298.0,392.0,660.0,353.0,662.0', 'txts': ['土地整治与土壤修复研究中心', '华南农业大学丨东图'], 'txt_scor
es': '0.9401206|0.8182683'}

这样将单引号转为双引号

json.dumps(result_data)

发现json.dumps后中文格式不对了:

#{"txt_boxes": "292.0,294.0,331.0,293.0,349.0,848.0,309.0,850.0,339.0,299.0,378.0,298.0,392.0,660.0,353.0,662.0", "txts": "\u571f\u5730\u6574\u6cbb\u4e0e\u571f\u58e4\u4fee\u590d\u7814\u7a76\u4e2d\u5fc3|\u534e\u5357\u519c\u4e1a\u5927\u5b66\u4e28\u4e1c\u56fe", "txt_scores": "0.9401206|0.8182683"}

这是因为json.dumps 序列化时默认使用的ascii编码,想输出真正的中文需要指定ensure_ascii=False:

json.dumps(result_data,ensure_ascii=False)

结果是我们要的标准json格式了:

#{"txt_boxes": "292.0,294.0,331.0,293.0,349.0,848.0,309.0,850.0,339.0,299.0,378.0,298.0,392.0,660.0,353.0,662.0", "txts": ["土地整治与土壤修复研究中心|华南农业大学丨东图"], "txt_scores": "0.9401206|0.8182683"}

您可能感兴趣的文章:

相关文章