如何使用pandas读取txt文件中指定的列(有无标题)

最近在倒腾一个txt文件，因为文件太大，所以给切割成了好几个小的文件，只有第一个文件有标题，从第二个开始就没有标题了。

我的需求是取出指定的列的数据，踩了些坑给研究出来了。

import pandas as pd
# 我们的需求是　取出所有的姓名
# test1的内容
'''
id name score
1  张三　100
2  李四 99
3  王五 98
'''
test1 = pd.read_table("test1.txt") # 这个是带有标题的文件
names = test1["name"] # 根据标题来取值
print(names)
'''
张三
李四
王五
'''

# test2的内容
'''
4  Allen　100
5  Bob 99
6  Candy 98
'''
test2 = pd.read_table("test2.txt", header=None) # 这个是没有标题的文件
names = test2[1] # 根据index来取值 
print(names)
'''
Allen
Bob
Candy
'''

补充知识：关于python中pandas读取txt文件注意事项

语法：pandas.read_table()

参数：

filepath_or_buffer 文件路径或者输入对象
sep 分隔符，默认为制表符
names 读取哪些列以及读取列的顺序，默认按顺序读取所有列
engine 文件路径包含中文的时候，需要设置engine = ‘python'
encoding 文件编码，默认使用计算机操作系统的文字编码
na_values 指定空值，例如可指定null,NULL,NA,None等为空值

常见错误：设置不全

import pandas
data = pandas.read_table(‘D/anaconda/数据分析/文本.txt',
engine=‘python')
print(data)

输出结果：

补全代码：

import pandas
data = pandas.read_table(‘D/anadondas/数据分析/文本.txt',
sep = ‘,' ,#指定分隔符‘,'，默认为制表符
names = [‘names',‘age'],#设置列名，默认将第一行数据作为列名
engine = ‘python',
encoding = ‘utf8'#指定编码格式)
print(data)

输出结果：

频道导航

如何使用pandas读取txt文件中指定的列(有无标题)

您可能感兴趣的文章: