
MinerU简介
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中。MinerU能保留原PDF文档结构,提取文字、图片、图片描述、表格等内容,自动识别并转换LaTeX格式、HTML格式,自动OCR,支持多语言。

MinerU主要功能:
- 删除页眉、页脚、脚注、页码等元素,确保语义连贯
- 输出符合人类阅读顺序的文本,适用于单栏、多栏及复杂排版
- 保留原文档的结构,包括标题、段落、列表等
- 提取图像、图片描述、表格、表格标题及脚注
- 自动识别并转换文档中的公式为LaTeX格式
- 自动识别并转换文档中的表格为HTML格式
- 自动检测扫描版PDF和乱码PDF,并启用OCR功能
- OCR支持84种语言的检测与识别
- 支持多种输出格式,如多模态与NLP的Markdown、按阅读顺序排序的JSON、含有丰富信息的中间格式等
- 支持多种可视化结果,包括layout可视化、span可视化等,便于高效确认输出效果与质检
- 支持CPU和GPU环境
- 兼容Windows、Linux和Mac平台
MinerU核心功能与优势:
- Magic-PDF模块:专注于PDF文档处理,能够智能识别并去除非正文内容如页眉、页脚,同时精准保留标题、段落、列表等结构,支持图片、表格、公式的提取,确保转换后的Markdown格式既准确又易于阅读。
- Magic-Doc模块:针对网页和电子书,能够从网页中提取正式内容。
- 多模态内容处理:MinerU不仅处理文本,还能有效提取和处理图像、表格、公式等多模态内容。
- 多语言支持:MinerU支持包括繁简中文在内的84种语言。
- 格式多样:支持多种输出格式和可视化结果,适配 CPU 和 GPU 环境,兼容多平台。
- 自动识别转换:识别并转换公式为 LaTeX 格式,表格为 LaTeX 或 HTML 格式,还能自动检测并启用 OCR 功能,。
MinerU只要应用于学术研究、市场分析、法律文档处理、知识管理等领域,使得我们能高效地从大量文档中提取关键信息,从而加速数据准备过程,为大模型训练、知识图谱构建等提供高质量的数据支持。
MinerU由上海人工智能实验室(上海ai实验室)大模型数据基座OpenDataLab团队开发,并在2024年的WAIC(世界人工智能大会)上发布,迅速在GitHub上获得关注,成为Python的热门项目。
数据统计
数据评估
关于MinerU特别声明
本站土豆丝提供的MinerU都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由土豆丝实际控制,在2025年8月15日 上午12:27收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,土豆丝不承担任何责任。
相关导航

小狐狸AI创作系统,小狐狸AI创作系统是一款基于ThinkPHP框架开发的AI问答小程序,可以说小狐狸GPT目前国内较好的一款的ChatGPT对接OpenAI 软件系统。

ComflowySpace
ComflowySpace,Comflowy社区开箱即用的 Comfy UI 整合包 一键安装,小白也能轻松上手。

Tabnine
Tabnine,一个AI助手,可以加速代码交付并确保代码的安全性。它提供了令人印象深刻的代码完成功能,并帮助提高开发效率。Tabnine可以与流行的现代集成开发环境(IDE)无缝集成。

TailwindCSS
Tailwind CSS ,一个实用程序优先的 CSS 框架,旨在使用户能够更快、更轻松地创建应用程序。它允许您使用实用程序类来控制布局、颜色、间距、排版、阴影等,以创建完全自定义的组件设计,而无需留下 HTML 或编写一行自定义 CSS。

CodeFuse
CodeFuse,CodeFuse 是蚂蚁自研的智能研发助手,希望提升开发者效率,让写代码变得更简单,并已对外开源。用户可以通过CodeFuse使用代码补全、解释代码、代码优化以及生成单测等功能,以更快、更轻松地编写代码。

RTranslator
RTranslator,一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。

HeroUIChat
HeroUI Chat,一款能够将用户提供的文本描述或设计图快速转化为 React 应用程序代码的工具,比较适合开发网站的开发者和设计师。

Onlook
Onlook,一款设计师的Cursor,支持对 React 网站进行可视化编辑并实时将修改写入代码,主打 “设计即编码”。
暂无评论...
