一共有近2600条类似格式的表格细栏,每个栏目包括的信息有:
-
日期
-
发文单位
-
文号
-
标题
-
签收栏
需要提取其中加粗的这三项内容到Excel表格中存储,表格样式如下:
仔细观察可以发现一个文件条目占据了3行,所以对表格全部行循环迭代时可以设步长为3
注意观察表格,按照row和cell把所需内容解析清楚
2/1
这种 日/月
的形式。我们需要转化成 YYYY-MM-DD
格式,而这利用到datetime
包的strptime
和strftime
函数:-
strptime:
解析字符串中蕴含的时间 -
strftime:
转化成所需的时间格式
openpyxl
线程的最后记得保存
最后附上完整代码,代码很简单,理清思路最重要
● 80%的人都不知道,全球Python库下载前10名
● 我珍藏的一些好的Python代码,技巧|上篇
● 爬取300本Python书籍,用Python告诉你哪家强?
点赞是最大的支持
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何用python3输出分数?11/20
- ♥ 520到了! 我用Python拜托周董为我和女友送上祝福!07/09
- ♥ python中过滤函数的作用是什么?01/13
- ♥ PySpark——开启大数据分析师之路05/23
- ♥ python正态分布中的正态函数08/23
- ♥ 如何实现python切片步长11/04
内容反馈