在pandas中join()方法很神奇,join()方法虽然是连接方法,但是因为pandas有两个数据结构,join()方法对两个数据结构有不同的连接方法:1、将Series中每个元素的字符串连接起来,按照指定的分隔符。DataFrame通过索引或指定列连接。
方法1:根据指定的分隔符串联Series中各元素的字符。
importpandasaspd s=pd.Series(['A','B','C','Aaba','Baca','CABA','dog','cat']) print(s.str.join(",")) 0A 1B 2C 3A,a,b,a 4B,a,c,a 5C,A,B,A 6d,o,g 7c,a,t dtype:object
方法二:DataFrame通过索引或指定列连接。
'''两边的key可以用来set_index''' df_set_index=df_AA.set_index('zh').join(df_ZZ.set_index('en'),how='outer', lsuffix='_A',rsuffix='_Z') '''或设置后df中的key,通过on与指定的左df中的列合并,返回的index不变''' df_set_index_on=df_AA.join(df_ZZ.set_index('en'),on='zh',how='outer', lsuffix='_A',rsuffix='_Z')
以上就是在pandas中join()两种应用方法,其中Join()怒视在Series中很常用,但也要知道哦~
(推荐操作系统:windows7系统,Python 3.9.1,DELL G3电脑。)