有若干个Excel文档每个文档格式一致及第一行为文件标题第二行为表格表头表头不完全一致。现需要将他们合并。合并规则为去掉每个文档的第一行以第二行为表头将每个文档的第三行及以后的内容合并到一个Excel sheet中并在第一列添加文档名称。步骤1.将需要合并的数据放进同一个文件夹中例如DL-25102-raw data。2.使用以下代码运行将路径改为上面建立的文件夹路径生成与文件夹同名的Excel合并文件import pandas as pd import glob import os # 配置路径 input_folder rD:\02数据处理\project-26001\project-26001-raw data output_file rD:\02数据处理\project-26001\project-26001-raw data.xlsx # 获取输入文件夹下所有 .xls 和 .xlsx 文件 file_list glob.glob(os.path.join(input_folder, *.xls)) \ glob.glob(os.path.join(input_folder, *.xlsx)) if not file_list: print(f错误在 {input_folder} 中没有找到任何 Excel 文件请检查路径。) exit(1) dataframes [] for file in file_list: df pd.read_excel(file, header1) df[Source_File] os.path.basename(file) dataframes.append(df) print(f已读取{os.path.basename(file)}共 {len(df)} 行) # 合并所有数据 merged_df pd.concat(dataframes, ignore_indexTrue, sortFalse) # 将 Source_File 列移动到第一列 cols [Source_File] [col for col in merged_df.columns if col ! Source_File] merged_df merged_df[cols] # 输出到目标文件 merged_df.to_excel(output_file, indexFalse) print(f合并完成总行数{len(merged_df)}已保存至{output_file})