搜索
写经验 领红包

金母鸡科技(方言金母鸡什么意思)

导语:金母鸡量化教学场:pandas—数据挖掘的Python库

如果你想充分发挥Python的强大作用,如果你想成为一名好的Python量化师,你应该先学好Pandas。今天就来了解什么是Pandas。

与numpy 易于处理同种类型数据不同,pandas更加的适合处理不同类型的数据,类似于excel表格,每行每列都有相应的名称。特点是拥有便捷的数据处理能力、独特的数据结构、读取文件方便、封装了matplotlib的画图和numpy的计算

pandas主要的数据结构为series和dataframe。

一、Series

Series类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 定义为一维的数组型python对象,不仅具有值序列而且还包含相应的数据标签index。默认的索引下标为从0到n-1。可以通过values 和index 属性来索引series 对象。也可以将其认为是字典类型的一种变体,因为series 相应的索引值和数据值按位置配对。

二、DataFrame

DataFrame 是一个表格型的数据结构,类似于excel表格,具有行列索引。也可将其看做矩阵化的数据表,可以包含不同数据类型的数据。每列可以是不同的值类型(数值、字符串、布尔型值)。

DataFrame 既有行索引也有列索引,它可以被看做由Series组成的字典。二维的DataFrame 通过分层索引可以实现更高维的索引。

三、Pandas画图

用Pandas画图前,需要了解一下它的基础操作:

对象:plot(x=None,y=None,kind=‘line’)

x和y表示标签或者位置,默认为None

kind:表示绘图的类型,默认为line,折线图

line:折线图

bar/barh:柱状图

hist:直方图

pie:饼状图

area:区域图

scatter:散点图

四、Pandas文件的读取和存储

pandas支持的常用文件类型包括:HDF5、CSV、SQL、XLS、JSON等。

(1)CSV

pd.read_csv(‘filepath_or_buffer’, usecols=[]) 读取csv文件数据。

filepath_or_buffer:文件路径Sep:分隔符,默认为’,’usecols:指定读取的列名,列表形式

df.to_csv(path_or_buf,columns=[],index=True,mode=‘w’) 将数据存储到csv文件中。

path_or_buf:文件存放的路径sep:分隔符,默认为’,’columns:列,列表形式mode:‘w’:重写,‘a’:追加header:是否写进列索引值index:是否写进行索引,默认True写进行索引,会将行索引变成一列数据encoding:编码格式,默认为None

HDF5

读取HDF5文件(.h5)需要安装tables模块。

pd.read_hdf(path_or_buf, key=None) 读取HDF5文件

path_or_buf:文件路径key:读取的键

df.to_hdf(path_or_buf, key) 写入HDF5文件

path_or_buf:文件路径key:写入文件时,必须指定一个键

(3)JSON

pd.read_jsonf(path_or_buf, orient=None,typ=‘frame’,lines=False) 读取json文件

path_or_buf:文件路径orient:指定数据存储的json形式 ,{‘split’,‘records’,‘index’,‘columns’,‘valuse’}typ:默认frame,指定转换成的对象类型Series或者DataFramelines:默认False,按照每行读取json

pd.to_jsonf(path_or_buf, orient=None,lines=False) 存储json文件

path_or_buf:文件路径orient:指定数据存储的json形式lines:默认False,一个对象存储为一行。一般设置为Ture

免责声明:本文由原创用户编辑投稿,若来源犯您的合法权益,请与我们取得联系,我们更正修改。2023年04月08日由小娴整理编辑!