Pandas中读取CSV文件、存储CSV文件操作、读取Excel文件

读取CSV文件

import pandas as pd

data=pd.read_csv('data.csv')
print(data)

读取CSV文件,不要标题

data=pd.read_csv('data.csv',header=None)
print(data)

读取CSV文件,自定义标题行

data=pd.read_csv('data.csv',names=['user_id','user_name','user_gender'])
print(data)

读取CSV文件,指定索引列。读取csv文件并添加自定义标题行,修改user_id为列索引

data=pd.read_csv('data.csv',
    names=['user_id','user_name','user_gender'],
    index_col='user_id'
)
print(data)

读取csv文件,指定分隔符

data=pd.read_csv('data.csv',
    names=['user_id','user_name','user_gender'],
    sep=','
)
print(data)

读取csv文件,自动处理缺失的数据,默认缺失数据为NaN

data=pd.read_csv('data.csv',header=None)
print(data)

存储CSV文件

存储数据为CSV文件

data=DataFrame(data=np.random.randint(0,100,size=(5,4)),index=['a','b','c','d','e'],columns=['A','B','C','D'])
data.to_csv('./random.csv')

读取Excel文件

首先需要安装xlrd模块,使用pip命令安装即可!

file=pd.ExcelFile('student.xlsx')
data=file.parse('student') # Excel表的名称,默认Shee1
print(data)

发表评论