欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 资讯 > Python代码优雅解析PDF文件

Python代码优雅解析PDF文件

2024/11/7 10:05:21 来源:https://blog.csdn.net/u013378469/article/details/143433507  浏览:    关键词:Python代码优雅解析PDF文件

主要功能:利用Python扩展库pdfplumber解析中文核心期刊要目总览.pdf文件成excel文件

解析文件:中文核心期刊要目总览.pdf

官方文档:pdfplumber · PyPI

具体代码:

import pdfplumber
import pandas as pdwith pdfplumber.open("hexin.pdf") as pdf:print(len(pdf.pages))first = pdf.pages[0]ftable = first.extract_table()tables = ftable[2:]for page in pdf.pages[1:]:tables += page.extract_table()data_frame = pd.DataFrame(tables, columns=ftable[1])with pd.ExcelWriter('hexin.xlsx') as excel:data_frame.to_excel(excel, index=False)

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com