本文教程操作环境:windows7系统Python 3.9.1,DELL G3电脑。
1、pandas.merge
它是pandas的全功能、高性能的内存连接操作,在习惯上与SQL等关系数据库非常相似。
将数据连接到数据中的特定字段,是 类似SQL的DataFrame表连接操作。
2、Merge的默认合并方法
基于表内的merge index-on-index 和 index-on-column(s) 合并,但默认是基于index合并。
3、使用语法
pandas.read_sql(sql,con,index_col=None,coerce_float=True,params=None,parse_dates=None, columns=None,chunksize=None)
4、使用参数
sql:SQL命令字符串;
con:连接sql数据库,engine,通常可以使用SQLalchemy或pymysql等包来构建;
index_col: 选择一列作为index作为index;
coerce_float:非常有用,直接用float型读取数字字符串;
parse_dates:将一列日期字符串转换为datetime数据;
columns:要选的列;
chunksize:如果提供了一个整数值,则返回一个generator,每次输出的行数是提供的值的大小。
5、使用实例
importpandas; frompandasimportread_csv; items=read_csv( "E:\\pythonlearning\\datacode\\firstpart\4\4.12\data.csv", sep='|', names=['id','comments','title'] ); prices=read_csv( "E://pythonlearning//datacode//firstpart//4/4.12/data.csv", sep='|', names=['id','oldPrice','nowPrice'] ); itemPrices=pandas.merge( items, prices, left_on='id', right_on='id' );#以'id'列出基准,合并数据框
以上是python中的pandass.使用merge的方法,希望对你有所帮助~