Python 处理Excel 文件, openpyxl 库的使用:

avatar
作者
筋斗云
阅读量:5

下载:

pip install openpyxl

 基本使用:

新建一个Excel 工作簿:

使用openpyxl 需要先导入一个Workbook 类, 使用它可以创建一个Workbook<工作簿>对象, 也就是创建一个Excel表文件, web.active 可用来激活一个工作表. 我们可以使用它创建的 Websheet<工作表> 对象来调用一些属性或者方法, 例如:wb.title 获取或者设置此表格的标题;

from openxl import Workbook  wb = Workbook()   ws = wb.active  ws.title = "Spider" print(ws.title)  wb.save("test.xlsx")

保存则直接调用创建的 工作簿对象中的 save() 方法即可,需要传递一个路径。

 打开一个Excel 工作簿:

打工作簿使用到openpyxl 提供的 load_workbook 方法即可打开一个工作簿

from openpyxl import Workbook, load_workbook  # 新建一个工作簿 # wb = Workbook() wb = load_workbook("spider.xlsx") # 激活此工作簿 ws = wb.active ws.title = "Spider_Demo" print(ws.title)  wb.save("spider.xlsx")

操作工作表:

 当我们创建出一个工作簿的时候,默认情况下它会自带一个 websheet<工作表>, 我们使用 wb.active 来激活这个默认的工作表就可以获取到 一个 Worksheet 的对象, 如果我们想再增加一个工作表, 则可以调用 Workbook<工作簿> 对象中的create_sheet 方法, 第一个参数传递的是工作表的Title, 第二个参数则是 索引, 这里的索引位置也是从 0 开始的, 对照Excel 表是这样的:

from openpyxl import Workbook   wb = Workbook() print(type(wb))  # 激活默认的工作表 ws1 = wb.active print(type(ws1))  ws2 = wb.create_sheet("Sheet2", 1) ws3 = wb.create_sheet("Sheet3", 2) #  查看所有工作表 print(wb.sheetnames)

同样的, 如果我们打开了一个 excel 文件,而这个文件中已经存在了 Sheet1   Sheet2  Sheet3 等工作表了, 那么我们可以使用 Workbook 对象,然后使用类似与字典取值的方式来获取一个工作表对象,  例如: ws3 = wb["Sheet3"]    这样会返回一个Websheet 对象。

如果我们想要移动一个工作表到其它的位置,例如:将Sheet3 移动到 Sheet2 的位置。

那么我们可以调用 Workbook 对象提供的 move_sheet() 方法, wb.move_sheet()

此方法第一个参数传递的是一个 Websheet 对象, 第二个参数传递的则是一个数字, 如果传递-1 负数, 则为向前移动一个位置, 如果传递的是正数  1  则为向后移动一个位置, 此形参默认值为 0

from openpyxl import Workbook, load_workbook   # wb = Workbook() wb = load_workbook("spider.xlsx")  wb.move_sheet("Sheet4", -2)  print(wb.sheetnames)  # ['Sheet1', 'Sheet4', 'Sheet2', 'Sheet3']

单元格:

一个工作簿中至少有一个工作表, 而一个工作表中,则有很多个单元格:

 使用 Worksheet 对象则可以对单元格进行一系列的操作, 例如 设置值,或者获取值等等。

打开excel观察一下,可以发现:目前选择的单元格为 第五行 第C 列, C5 单元格。

在程序中,可以使用Worksheet 对象, 来直接指定 c5 来设置值或者获取值, 例如:

ws["c5"] = "xxx",

但是官方不建议这么做, 官方提供了一个 cell() 方法, 用来专门处理单元格操作:

from openpyxl import Workbook  wb = Workbook()  ws = wb.active   cell = ws.cell(6 , 1, "999")  print(cell.value)  wb.save("testtest.xlsx")

而使用 Worksheet 对象调用cell() 方法, 第一个参数传递的是 行, 而第二个参数传递的则是 列, 第三个参数 则是要添加的值, 然后它会返回一个  Cell 对象, 然后就可以调用此对象的属性和方法来进行业务处理了,

例如获取 单元格的值: cell.value     获取坐标: cell.coordinate   获取当前单元个的行: cell.row

获取单元格的列: cell.column  等等

使用for 循环添加行和列:

使用for 循环来创建一个 15 行 10 列的单元格。

from openpyxl import Workbook  wb = Workbook()  ws = wb.active  x = 1  for row in range(1, 15+1):     for col in range(1, 10+1):          ws.cell(row, col, x)         x += 1  wb.save("number.xlsx")

 遍历获取单元格内容:

from openpyxl import Workbook  wb = Workbook()  ws = wb.active  x = 1  for row in range(1, 6):     for col in range(1, 5):          ws.cell(row, col, x)         x += 1   print(ws["a:c"]) # 获取 a ~ c 列的单元格内容   print(ws[1:3]) # 获取 1 ~ 3 行的单元格内容  print(ws["a1:d4"]) # 获取 a1 ~ d4 的内容  # 遍历 a1 ~ d4 的单元格 for cells in ws["a1:d4"]:     for cell in cells:         print(cell.value)   print(ws.iter_rows()) # 获取行 print(ws.iter_cols())  # 获取列  # 按行遍历 for rows in ws.iter_rows():     for row in rows:         print(row.value)   # 按列遍历 for cols in ws.iter_cols():     for col in cols:         print(col.value)   wb.save("number.xlsx")

查看iter_rows() 和iter_cols() 方法的源码可以看到:

它是可以传递一个最小行,最小列,最大行,最大列的参数的, 如果不传入,则默认获取全部!

操作单元格:

合并单元格:

 调用 Workseet 对象提供的 merge_cells() 和 unmerge_cells() 方法可以完成 合并单元格和取消合并单元格的功能, 但是需要注意的是, 合并后的单元格会将单元格中原有的数据丢失, 只保留最左上角的单元格数据。

# 合并 b2 - d4 的单元格 ws.merge_cells("b2:d4") # 取消合并 ws.unmerge_cells("b2:d4")  wb.save("test.xlsx")

源码中可以发现, 它同样特工了 start_row 等形参, 分别是开始行, 结束行,开始列,结束列,如果有需要也可以通过这几个形参来控制要合并的 单元格。

 插入单元格:

 Workseet 对象提供了insert_cols   insert_rows 两个方法可以完成单元格的插入操作:

ws.insert_cols(2, 3) # 从第二列开始插入3 列单元格   ws.insert_rows(1, 4) # 从第一行开始, 插入4 行单元格

删除单元格:

ws.delete_cols(2, 2) # 从第二列开始,删除2 列单元格   ws.delete_rows(3, 4) # 从第三行开始, 删除 4 行单元格 

 移动单元格:

ws.move_range("c4:d5", 2, -2)  # 选择c4:d5 范围的单元格 向下移动两行 后再向左移动两列

 

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!