> 运动
padas读取文件的方法(pythopadas读取文件)
导语:Pandas基础之文件的读取和写入
1.文件的读取
Pandas的文件输入有赖于xlrd、xlwt、openpyxl这三个第三方的库,如果读取失败可尝试先安装这几个库;
在数据分析的过程中对于数据的读取和写入是必不可少的,这里我们主要学习csv、 txt、 excel的读取和写入。
1.1文件的读取
csv、txt、excel文件分别可以使用read_csv()、read_table()、read_exece来读取,其中传入的参数都是文件的相对或者绝对路径。
其中的一些公共参数,header设置为None时表示第一行不作为列名,index_col表示把某一列或某几列作为索引;usecols表示读取列的集合,默认是所有的列;parse_dates表示需要转化为时间的列,nrows表示读取的数据行数。
header:
index_col:
usecol:
parse_dates:
nrows:
在读取txt文件的时候可能会遇到分隔符不是空格的情况,read_table()中是有一个分割参数sep,可以实现对分隔符号的自定义,sep中使用的是正则表达式。
2.数据的写入
通常使用to_csv()、to_excel()写入数据,如果想要快速的转化为markdown和latex可以使用to_markdown()、和to_latex(),但需要额外安装tabulate包。
一般情况下,pandas会在数据写入时包含当前的数据索引,但我们在输出的时候其实并不需要整数索引,此时可以将index设置为False,可以在输出时去掉索引。
pandas中没有定义to_table()函数,但是to_csv()可以将数据保存为txt文件,并且可以自定义分隔符。
本文内容由快快网络小璎整理编辑!