知行编程网知行编程网  2022-09-05 17:30 知行编程网 隐藏边栏  444 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python如何在word中读取表格内容的相关知识,包括python读取表格,以及python word排版这些编程知识,希望对大家有参考作用。

python如何读取word中的表格内容

Word 文件看起来复杂且结构不便。实际上,一个word文档中的内容大概有几种:段落(paragraph)、表格(table)、字符(character)。我现在要分析的word文档基本上都是段落和表格。本文主要介绍从单词和结构化表格信息分析表格的方法。

1.为了使用python解析word文件,可以使用docx包,需要先安装在python中。

pip install python-docx


2、安装后,就可以读取word文件。

importdocx
fn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据
for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据
 
for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text)
 
table_num=len(doc.tables)#获取文档的表格个数
 
print(table_num)
 
table_0=doc.tables[0]#选取第一个表
 
table_rows =len(table_0.rows)#获取第一个表的行数
 
print(table_rows)
 
tab=doc.tables[0].rows[0].cells[0]#获取第一张表第一行第一列数据
 
print(tab.text)
 
par= doc.paragraphs[2]#读取第三段数据
 
print(par.text)


本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享