核心能力在于:
-
保留原文档的结构和格式,包括标题、段落、列表等;
-
自动删除页眉、页脚、脚注、页码等元素;
-
准确提取图片、表格和公式等多模态内容;
-
符合人类阅读顺序的排版格式。
官网:https://github.com/opendatalab/MinerU
LazyLLM 是一个开源大模型应用开发框架,可以让我们像搭建积木一样,快速构建出具有生产力的 AI 大模型应用(官网:https://github.com/LazyAGI/LazyLLM
-
MinerU:
跨页拼接文本 + 分离穿插表格 → 语义完整性 MAX → 生成专业建议 -
PyPDF:
丢失关键段落 + 表格文字粘连 → 大模型东拼西凑 → 回答当场翻车