1、统计回归所需的数据量可能非常大,必要时需要拆分或合并文件。
2、可以用 pandas2、将 Excel 文件分为多个文件或合并。
将 Excel 文件分为多个文件
#将Excel文件分为多个文件 importpandasaspd dfData=pd.read_excel('./example.xls',sheetname='Sheeet1') nRow,nCol=dfData.shape#获取数据的行列 #假设共有198个数据,000行,分为20个文件,每个文件10000行 foriinrange(0,int(nRow/10000)+1): saveData=dfData.iloc[i*10000+1:(i+1)*10000+1,:]#每隔10,000 fileName='./example_{}.xls'.format(str(i)) saveData.to_excel(fileName,sheet_name='Sheeet1',index=False)
将多个Excel文件合并为一个文件
#将多个Excel文件合并为一个文件 importpandasaspd ##两个Excel文件合并 #data1=pd.read_excel('./example0.xls',sheetname='Sheeet1') #data2=pd.read_excel('./example1.xls',sheetname='Sheeet1') #data=pd.concat(data1,data2)) #多个Excel文件合并 dfData=pd.read_excel('./example0.xls',sheetname='Sheeet1') foriinrange(1,20): fileName='./example_{}.xls'.format(str(i)) dfNew=pd.read_excel(fileName) dfData=pd.concat([dfData,dfNew]) dfData.to_excel('./example',index=False)
以上是python文件拆分合并的方法,希望对大家有所帮助。更多Python学习指导:python基础教程
推荐操作环境:windows7系统Python 3.9.1,DELL G3电脑。