使用Python读写csv文件
时间:2022-09-28 09:39:37|栏目:Python代码|点击: 次
简介:CSV (Comma Separated Values) 格式是电子表格和数据库中最常见的输入、输出文件格式。又称逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。
数据较复杂的场景更推荐读写excel。
参考:Python:xlrd和xlwt模块操作Excel表格
特定规则:
开头是不留空,以行为单位。
可含或不含列名,含列名则居文件第一行。
一行数据不跨行,无空行。
以半角逗号(即,)作分隔符,列为空也要表达其存在。
列内容如存在半角引号(即"),替换成半角双引号("")转义,即用半角引号(即"")将该字段值包含起来。
文件读写时引号,逗号操作规则互逆。
内码格式不限,可为 ASCII、Unicode 或者其他。
不支持数字
不支持特殊字符
读取范例1:使用csv模块
# -*- coding: UTF-8 -*- import csv file = "demo.csv" with open(file, "r")as f: f_csv = csv.reader(f) for row in f_csv: print(row)
读取范例2:使用pandas模块,若内容存在中文需要增加encoding=“gbk”
import pandas as pd file = "demo.csv" data = pd.read_csv(file, encoding="gbk") print(data.head(2)) # 打印前2行 print("*" * 100) print(data.columns) # 返回全部列名 print("*" * 100) print(data.shape) # 返回csv文件形状 例如(4, 3) => 4行3列 print("*" * 100) print(data.loc[1:2]) # 打印第1到2行
写入范例1:请注意,会造成换行。
# -*- coding: UTF-8 -*- import csv csvFile = open("test.csv", "w") writer = csv.writer(csvFile) # 写入列名。 writer.writerow(["id", "name", "age"]) row1 = ["1001", "Tom", 30] row2 = ["1002", "David", 25] row3 = ["1003", "Lily", 20] row4 = ["1004", "韩梅梅", 15] writer.writerows([row1, row2, row3, row4]) csvFile.close()
写入范例2:使用newline=“”来解决换行问题
# -*- coding: UTF-8 -*- import csv import csv headers = ['id', 'name', 'age'] row1 = {"id": "1001", "name": "Tom", "age": 30} row2 = {"id": "1002", "name": "Lily", "age": 35} row3 = {"id": "1003", "name": "李雷", "age": 40} row4 = {"id": "1004", "name": "韩梅梅", "age": 45} rows = [row1, row2, row3, row4] with open('test2.csv', 'w', newline='')as f: f_csv = csv.DictWriter(f, headers) f_csv.writeheader() f_csv.writerows(rows)