使用python中的pandas,xlrd,openpyxl库完成合并excel中指定sheet的操作

# -*- coding: utf-8 -*- 
import xlrd
import pandas as pd
from pandas import dataframe
from openpyxl import load_workbook

#表格位置
excel_name = '1.xlsx'
# 获取workbook中所有的表格
wb = xlrd.open_workbook(excel_name)
#获取sheets
sheets = wb.sheet_names()

# 循环所需sheet
newdata = dataframe()
#in后()里填写需要合并的sheet页数
for i in (3,4,5):
  df = pd.read_excel(excel_name, sheet_name=(i-1), header = none,index_col=0,encoding='utf-8')
  newdata = newdata.append(df,ignore_index = false)
#保存为新的sheet,首先新建sheet,合并后的数据保存到新sheet中
writer = pd.excelwriter('1.xlsx',engin='openpyxl')
book = load_workbook(writer.path)
writer.book = book
#利用dataframe.to_excel保存合并后的数据到新的sheet,生成新的sheet命名为newdata
newdata.to_excel(excel_writer=writer,sheet_name="newdata")
writer.save()
writer.close()
print('处理完成!')

其中

df = pd.read_excel(excel_name, sheet_name=(i-1), header = none,index_col=0,encoding='utf-8')

需要指定 header = none,否则会出现如下warning:

futurewarning: sorting because non-concatenation axis is not aligned. a future version

of pandas will change to not sort by default.

并且生成的新sheet中的列会出现乱序以及unnamed列。

补充:pandas 中读取和写入csv文件时候出现unnamed:0的解决方案

在读取csv文件的时候,默认会自动添加新的一列,unnamed:0

解决方案:

read_csv()时候,设置index_col=0即可。

在写入csv文件的时候,默认会自动加入新的一列,unnamed:0

解决方案:

to_csv()时候,设置index=false。或者加上index=true, index_label=”id”

以上为个人经验,希望能给大家一个参考,也希望大家多多支持www.887551.com。如有错误或未考虑完全的地方,望不吝赐教。