欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 健康 > 养生 > 开源将图像和 PDF 文件高精度地转换为 Markdown 和 JSON 格式的文本软件

开源将图像和 PDF 文件高精度地转换为 Markdown 和 JSON 格式的文本软件

2025/3/11 11:47:17 来源:https://blog.csdn.net/bugsycrack/article/details/146143675  浏览:    关键词:开源将图像和 PDF 文件高精度地转换为 Markdown 和 JSON 格式的文本软件

推荐一款开源将图像和 PDF 文件高精度地转换为 Markdown 和 JSON 格式的文本软件:Pdf-extract-API 。

该项目提供一种工具,用于将图像和 PDF 文件高精度地转换为 Markdown 和 JSON 格式的文本,包括支持表格数据和数学公式。

该工具基于 FastAPI,使用 Celery 进行异步处理,使用 Redis 缓存 OCR 结果,提供多种OCR策略,如 Marker、Surya-OCR 和 Tesseract,还能移除个人身份信息。

功能非常震撼,推荐花时间测试和掌握。

食用地址:https://github.com/CatchTheTornado/pdf-extract-api

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词