python处理数据时,可以将数据保存至excel文件中,此处安利一个python利器,openpyxl,可以自动化处理数据值excel表格中。

1、安装

pip install openpyxl

2、使用

在使用前,需理清excel的几个概念

  • workbook:工作薄,即一个excel文件
  • worksheet:工作表,一个excel文件包含多个sheet,即包含多个工作表
  • colunm:列,excel中一竖列
  • row:行,excel中一横行
  • cell:单元格,组成工作表的最小单位

2.1 workbook对象

创建工作薄

from openpyxl import workbook

# 创建一个工作簿
w=workbook()

# 获取当前工作sheet
w_s=w.active
# 指定sheet的标题
w_s.title="demo1"

# 创建一个工作表,index指定创建的工作表的位置,默认在最后面,title指定工作表的名称
w_s=w.create_sheet(index=0, title="demo2")
# 指定sheet按钮的颜色
w_s.sheet_properties.tabcolor="ffa500"

# 保存文件
w.save('data/demo.xlsx')

其中当创建一个一个工作簿时,会默认创建一个名字为sheet的工作表。以下即上面代码所创建的excel工作簿(即excel文件)

加载工作簿

from openpyxl import load_workbook
# 打开一个工作簿,
w=load_workbook("data/demo.xlsx")

# 获取工作簿下所有工作表的名称,以下两种用法作用一样,官方推荐第一种第一种用法
sheet_names1=w.sheetnames
# sheet_names2=w.get_sheet_names()

# 指定当前工作表,以下两种用法作用一样,官方推荐第一种第一种用法
w_s1=w["demo1"]
# w_s2=w.get_sheet_by_name("demo2")

# 删除一个工作表
w.remove(w["demo2"])

sheet_names2=w.sheetnames

# 保存文件
w.save('data/demo.xlsx')

print(sheet_names1)
print(sheet_names2)

>>>输出结果
['demo2', 'demo1']
['demo1']

2.2 worksheet对象

常用属性

  • title:表格的标题
  • dimensions:表格的大小,这里的大小是指含有数据的表格的大小,即:左上角的坐标:右下角的坐标,
  • max_row:表格的最大行
  • min_row:表格的最小行
  • max_column:表格的最大列
  • min_column:表格的最小列
  • rows:按行获取单元格(cell对象) – 生成器
  • columns:按列获取单元格(cell对象) – 生成器
  • freeze_panes:冻结窗格,冻结单元格上边所有行和左边所有列,但单元格所在行列不冻结 ,在果冻页面时,冻结的行和列始终保持不动
  • values:按行获取表格的内容(数据) – 生成器

常用方法

  • iter_rows:按行获取所有单元格,内置属性有(min_row,max_row,min_col,max_col)
  • iter_cols:按列获取所有的单元格
  • append:在表格末尾添加数据,参数为一列表或者元祖
  • merge_cells:合并多个单元格
  • unmerge_cells:移除合并的单元格

现在有这样一个excel表格:

from openpyxl import load_workbook


w=load_workbook("data/猫眼电影.xlsx")
w_s=w[w.sheetnames[0]]                          # 选择第一个工作表
print("工作表标题:",w_s.title)
print("工作表最大行数:",w_s.max_row)
print("工作表最小行数:",w_s.min_row)
print("工作表的大小(左上角到右下角的坐标):",w_s.dimensions)
print("工作表最大列数:",w_s.max_column)
print("工作表最小列数",w_s.min_column)
w_s.freeze_panes="b2"                           # 冻结第一列和第一行,
# w_s.freeze_panes = 'b1'                       # 冻结列a
# w_s.freeze_panes = 'c1'                       # 冻结列a和b
# w_s.freeze_panes = 'c2'                       # 冻结行1和列a和列b
# w_s.freeze_panes = 'a1'                       # 无冻结
# w_s.freeze_panes = none                       # 无冻结
# w_s.freeze_panes = 'a2'                       # 设置第一行为冻结
w.save("data/猫眼电影.xlsx")

>>>输出结果
工作表标题: 猫眼电影
工作表最大行数: 101
工作表最小行数: 1
工作表的大小(左上角到右下角的坐标): a1:e101
工作表最大列数: 5
工作表最小列数 1

from openpyxl import load_workbook


w=load_workbook("data/猫眼电影.xlsx")
w_s=w[w.sheetnames[0]]                  # 选择第一个工作表

# 获取第一行所有cell,返回一个生成器
rows=w_s.iter_rows(min_row=1,max_row=1,min_col=1)

# 获取第一行的第一行到第五行的cell,返回一个生成器
cols=w_s.iter_cols(min_col=1,max_col=1,min_row=1,max_row=5)

for row in rows:
    print(row)
for col in cols:
    print(col)
# 写入一行数据
w_s.append([1,2,3,4,5])

# 合并单元格,a1至d1合并到a1
w_s.merge_cells('a1:d1')

# 拆分单元格,此处需要注意的是若先合并再拆分单元格,拆分后的单元格不再恢复拆分前的格式和数值
w_s.unmerge_cells('a1:d1')
w.save("data/猫眼电影.xlsx")

>>>输出结果
(<cell '猫眼电影'.a1>, <cell '猫眼电影'.b1>, <cell '猫眼电影'.c1>, <cell '猫眼电影'.d1>, <cell '猫眼电影'.e1>)
(<cell '猫眼电影'.a1>, <cell '猫眼电影'.a2>, <cell '猫眼电影'.a3>, <cell '猫眼电影'.a4>, <cell '猫眼电影'.a5>)

如下图,合并再拆分,cell之前的格式和值时不再存在。

2.3 cell对象

获取cell方法

1、通过坐标定位的方法

cell1=w_s["a"][:5]
cell2=w_s["a5"]

2、通过iter_rows()迭代方法,指定行列范围

rows = w_s.iter_rows(min_col=1, max_col=w_s.max_column, min_row=1, >max_row=1)
for row in rows:
   for cell in row:
       print(cell)
print("+"*20)
cols = w_s.iter_cols(min_row=1, max_row=5, min_col=1, max_col=1)
for col in cols:
   for cell in col:
       print(cell)

>>>输出结果
<cell '猫眼电影'.a1>
<cell '猫眼电影'.b1>
<cell '猫眼电影'.c1>
<cell '猫眼电影'.d1>
<cell '猫眼电影'.e1>
++++++++++++++++++++
<cell '猫眼电影'.a1>
<cell '猫眼电影'.a2>
<cell '猫眼电影'.a3>
<cell '猫眼电影'.a4>
<cell '猫眼电影'.a5>

3、通过指定具体行列方法

cell3=w_s.cell(row=1,column=1)

4、迭代全部行或列

for row in w_s.rows:
   for cell in row:
      cell.value=none
       
for column in w_s.columns:
   for cell in column:
       cell.value=none

5、迭cell赋值

cell.value=”xxx”

2.4 样式设置

目前官方提供的styles提供的样式有以下几块:

font: 来设置文字的大小,颜色和下划线等

patternfill: 填充图案和渐变色

border: 单元格的边框

alignment: 单元格的对齐方式等

font:

from openpyxl.styles import font
font = font(name='宋体',size = 11,bold=true,italic=true,strike=true,color='000000')
cell.font = font

设置字体为“宋体”,大小为11,bold为加粗,italic为斜体,strike为删除线,颜色为黑色

patternfill:

from openpyxl.styles import patternfill
fill = patternfill(fill_type = "solid", fgcolor="9aff9a")
cell.fill = fill

fill_type指定填充类型,fgcolor指定填充颜色(必须为rgb值,rgb颜色对照表)。另外需注意的是,fill_type若没有特别指定>类型,则后续的参数都无效,平时所用也是solid(完全填充,无渐变)和none最多,官方提供的还有
[‘none’, ‘solid”, ‘darkdown’, ‘darkgray’, ‘darkgrid’, ‘darkhorizontal’, ‘darktrellis’, ‘darkup’, ‘darkvertical’, ‘gray0625′, ‘gray125′, ‘lightdown’, ‘lightgray’, ‘lightgrid’, ‘lighthorizontal’, ‘lighttrellis’, ‘lightup’, ‘lightvertical’, ‘mediumgray’]

patternfill:

from openpyxl.styles import border,side

border = border(left=side(border_style='thin', color='000000'),
right=side(border_style='thin', color='000000'),
top=side(border_style='thin', color='000000'),
bottom=side(border_style='thin', color='000000'))
cell.border = border

官方提供的样式还有:

[‘dashdot’, ‘dashdotdot’, ‘dashed’, ‘dotted’, ‘double’, ‘hair’, ‘medium’, >‘mediumdashdot’, ‘mediumdashdotdot’, ‘mediumdashed’, ‘slantdashdot’, ‘thick’, ‘thin’]

alignment:

from openpyxl.styles import alignment

align = alignment(horizontal=‘left',vertical=‘center',wrap_text=true)
cell.alignment = align

horizontal: 水平方向对齐方式,左对齐left,居中center和右对齐right,分散对齐distributed,跨列居中centercontinuous,两端对齐justify,填充fill,常规general

vertical:垂直方向对齐方式,居中center,靠上top,靠下bottom,两端对齐justify,分散对齐distributed

wrap_text:自动换行

3、案例

掌握以上就基本平时够用了,自己写了一个案例。

现在有这样一个txt文件,需要把它写进excel文件中

代码如下:

from openpyxl import workbook
import json
from openpyxl.styles import font, patternfill, alignment, border, side

# 定义表头的样式
style_head = {
    "border": border(left=side(style='medium', color='ff000000'), right=side(style='medium', color='ff000000'),
                     top=side(style='medium', color='ff000000'), bottom=side(style='medium', color='ff000000')),
    "fill": patternfill("solid", fgcolor="9aff9a"),
    "font": font(color="1e90ff", bold=true),
    "alignment": alignment(horizontal="center", vertical="center")
}
# 定义表内容样式
style_content = {
    "border": border(left=side(style='thin', color='ff000000'), right=side(style='thin', color='ff000000'),
                     top=side(style='thin', color='ff000000'), bottom=side(style='thin', color='ff000000')),
    "alignment": alignment(horizontal='left', vertical='center'),
    "font": font(name="黑体")}


def get_data():
    with open("data/demo猫眼电影top100.txt", 'r', encoding='utf8') as f:
        # 迭代读取文件的每一行
        for line in f.readlines():
            # 将读取到的内容转化为python对象
            data = json.loads(line)
            yield data


def write_to_excel():
    # 创建一个工作簿
    w = workbook()
    # 获取当前工作表
    w_s = w.active
    # 更改当前工作表名称
    w_s.title = "猫眼电影"
    # 设置行的高度
    w_s.row_dimensions[1].height = 20
    # 设置列的宽度
    w_s.column_dimensions["b"].width = 15
    w_s.column_dimensions["c"].width = 35
    w_s.column_dimensions["d"].width = 24
    # 写入表头信息
    title = ["排名", "电影名", "链接", "上映时间", "评分"]
    w_s.append(title)
    # 迭代方式取出表头(第一行)每个cell,指定样式
    for row in w_s.iter_rows(max_row=1, min_col=1):
        for cell in row:
            cell.border = style_head["border"]
            cell.fill = style_head["fill"]
            cell.font = style_head["font"]
            cell.alignment = style_head["alignment"]
    # 从txt文件中获取相关数据
    datas = get_data()
    for data in datas:
        # 写入表内容
        w_s.append(list(data.values()))
    # 迭代方式取出表中每个cell,指定样式
    for row in w_s.iter_rows(min_row=2, min_col=1):
        for cell in row:
            cell.border = style_content["border"]
            cell.alignment = style_content["alignment"]
            cell.font = style_content["font"]
    # 保存excel文件
    w.save("data/猫眼电影.xlsx")


if __name__ == "__main__":
    write_to_excel()

完成后:

总结

到此这篇关于python利器openpyxl之操作excel表格的文章就介绍到这了,更多相关python openpyxl操作excel内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!