经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
Python-使用openpyxl读取excel内容
来源:cnblogs  作者:郭同学的IC修炼笔记  时间:2024/3/13 9:17:22  对本文有异议

1. 本篇文章目标

将下面的excel中的寄存器表单读入并构建一个字典

2. openpyxl的各种基本使用方法

2.1 打开工作簿

  1. wb = openpyxl.load_workbook('test_workbook.xlsx')

2.2 获取工作簿中工作表名字并得到工作表

  1. ws = wb[wb.sheetnames[0]]

wb.sheetnames 会返回一个列表,列表中是每个工作表的名称,数据类型为str。执行上述代码后ws就是获取的工作表。

2.3 读取某个单元格的值

  1. d = ws.cell(row=1, column=1).value
  2. print(d)

使用sheet.cell会返回cell对象,再使用cell.value才能返回单元格的值,执行上述代码的结果如下:

2.4 按行读取

按行读取可以用iter_rows()方法。

  1. for row in ws.iter_rows():
  2. print(row)

执行上述代码的输出如下:

由图可知,该方法应当是一个迭代器,返回的是row是一个tuple,里边是各个单元格cell。可以按照如下方法获取每列的值。

  1. import pprint as pp
  2. excel_list = []
  3. for row in ws.iter_rows():
  4. row = list(row)
  5. for i in range(len(row)):
  6. row[i] = row[i].value
  7. excel_list.append(row)
  8. pp.pprint(excel_list)

这里用到了一个模块pprint,用来使打印出的列表、字典等美观易读。print结果如下:

可以看到已经将excel中的内容构建了一个列表,但是下边一些没有内容的行也读了进来,尽管每个单元的值是None,这是因为之前对下边的行做过编辑,然后又删掉,导致这些无内容的单元具有单元格格式,openpyxl会将这些单元格也识别进来,所以要想避免这种情况,使用xlrd库是一种办法,或者采用下面的办法:

  1. excel_list = []
  2. for row in ws.iter_rows():
  3. row = list(row)
  4. if row[3].value != None:
  5. for i in range(len(row)):
  6. row[i] = row[i].value
  7. excel_list.append(row)
  8. pp.pprint(excel_list)

执行结果如下,可以看到全为None的行被过滤掉了。

按列读取方法类似,使用iter_cols()。

2.5切片读取

有时候我们并不想读取表格里的全部内容,只想读取一部分,这时候可以用iter_rows()和iter_cols()的切片功能。

  1. excel_list = []
  2. for row in ws.iter_rows(min_row=2, min_col=2, max_row=3, max_col=3):
  3. row = list(row)
  4. if row[1].value != None:
  5. for i in range(len(row)):
  6. row[i] = row[i].value
  7. excel_list.append(row)
  8. pp.pprint(excel_list)

执行结果如下,可以看到只获取了表格二行二列至三行三列的内容。

2.6 利用表格行列坐标直接获取单元格、单元格的值、切片

除了上述使用sheet.cell(row, col)来获取单元格值,以及iter_rows/cols获取行、列、切片外,还可以直接用excel的行列坐标表示来获取上述内容。

  1. pp.pprint(ws['B3']) #获取B3单元格的cell对象
  2. pp.pprint(ws['B3'].value) #获取B3单元格cell对象的值
  3. pp.pprint(ws['A1':'B2']) # 获取A1:B2这个切片的cell们
  4. pp.pprint(ws['A:B']) # 获取A列到B列的所有cell对象
  5. pp.pprint(ws[1:2]) # 获取行1到行2两行的所有cell对象

这里要注意使用这种切片、获取行列对象值的时候不能直接用.value方法,.value只是单独cell即一个单元格的cell时才能直接用,所以要想用这种方法获取切片、行列的值时要配合遍历、列表等方法构建。

2.7快速获得工作表的行们和列们

使用sheet.rows 和sheet.cols。

  1. pp.pprint(list(ws.rows))

执行结果如下:

3.构建本任务所需字典

代码如下:

  1. class ReadRegListExcel:
  2. def __init__(self, this_ws):
  3. self.reg_dic = {}
  4. self.ws = this_ws
  5. def excel_max_rows(self):
  6. max_rows = 0
  7. for row in ws.rows:
  8. if row[3].value != None:
  9. max_rows += 1
  10. return max_rows
  11. def construct_dic(self):
  12. max_rows = self.excel_max_rows()
  13. self.reg_dic['module name'] = self.ws.cell(row=1, column=2).value
  14. self.reg_dic['module base address'] = self.ws.cell(row=1, column=4).value
  15. self.reg_dic['registers'] = []
  16. row = 3
  17. all_rows = list(self.ws.rows)
  18. print(all_rows)
  19. while row <= max_rows:
  20. if all_rows[row-1][0].value != None:
  21. self.reg_dic['registers'].append({})
  22. self.reg_dic['registers'][-1]['register name'] = all_rows[row-1][0].value
  23. self.reg_dic['registers'][-1]['register address'] = all_rows[row-1][1].value
  24. self.reg_dic['registers'][-1]['fields'] = [[value.value for value in all_rows[row-1][2:7]]]
  25. else:
  26. self.reg_dic['registers'][-1]['fields'].append([value.value for value in all_rows[row-1][2:7]])
  27. row += 1
  28. return self.reg_dic
  29. if __name__ == "__main__":
  30. reg_dic_obj = ReadRegListExcel(ws)
  31. reg_dic = reg_dic_obj.construct_dic()
  32. pp.pprint(reg_dic)

最后得到的寄存器字典如下:

至此读入寄存器列表文件并构建出结构化的寄存器字典任务完成。

原文链接:https://www.cnblogs.com/xiaoguoic/p/18069103

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号