说明
1、根据索引匹配的广播机制,这里的广播机制与numpy广播机制大不相同。
2、与numpy只支持数字索引相比,pandas的两种数据结构都支持标签索引,包括bool索引。
3、与SQL的join和groupby功能相比,pandas可以轻松实现SQL的两个核心功能。事实上,大多数SQL和DML操作都可以在pandas中实现。
4、与Excel的数据透视表功能相比,Excel中最强大的数据分析工具之一是数据透视表,这在pandas中也很容易实现。
5、具有正则表达式的字符串向量化操作,通过函数操作pandas中的一列字符串,以及大部分具有正则表达式的接口。
向量化处理接口具有丰富的时间序列。
包括基本统计量、分组统计分析等常用的数据分析和统计功能。
无论是series还是dataframe,集成matplotlib的常用可视化接口都支持面向对象的绘图接口。
实例
importnumpyasnp importpandasaspd #创建符合正态分布的10只股票5天涨跌数据 stock_change=np.random.normal(0,1,(10,5)) pd.DataFrame(stock_change) #添加行索引 stock=["股票{}".format(i)foriinrange(10)] pd.DataFrame(stock_change,index=stock) #添加列索引 date=pd.date_range(start="20200101",periods=5,freq="B") data=pd.DataFrame(stock_change,index=stock,columns=date) #属性 print(data.shape) print(data.index) print(data.columns) print(data.values) data.T#行列转置 #方法 data.head(3)#开头3行 data.tail(2)#最后2行
以上是python中pandas功能特征的介绍,希望对大家有所帮助。更多Python学习指导:python基础教程
本文教程操作环境:windows7系统Python 3.9.1,DELL G3电脑。