zerox

3个月前发布 159 00

使用视觉模型将 PDF 转换为 Markdown

收录时间：

2025-01-16

打开网站 ">手机查看

zerox是一款开源免费PDF处理工具，它使用ORC视觉模型可以将带有复杂内容的PDF /Word/图片等转换为 Markdown ，让你把文档变为结构化数据。

截止到发文该项目在github已经获得8.1k的star，非常火爆的AIGC工具。它的原理就是利用OCR识别复杂内容的文档，然后将内容提供给AI进行处理，最终输出清晰明了的数据文档。

演示

从结果看到它自动将文件内容进行排版，非常准确识别出了矩形数图中的数据并且按照从大到小进行排序。对于折线图的识别也非常准确，还帮我们按照时间顺序整理

下面演示言传一张带有手写文字的图片，，图片是一份有文字信息还有表格信息，AI 居然能如此准确识别手写部分的内容，准确率还不赖。

点击智能按钮还能换一种格式呈现，方便专业人员做数据分析和处理。

部署

可在Python和node 环境下进行本地部署，支持多种视觉模型~

作者提供了一个demo感兴趣的可以去看看，

demo：https://getomni.ai/ocr-demo

数据统计

暂无评论

暂无评论...

zerox

演示

部署

数据统计

相关导航

Kimi Copilot – 网页总结助手

Elmo

ChatYouTube

ChatPDF

ChatDOC

ima知识库

NotebookLM

TXYZ

暂无评论

网址

朱雀大模型检测

Weights

ChatGPT

Fish Audio

即梦AI

纳米AI搜索

DeepSeek

OpenAI 学院

Manus

Midjourney

网址

使用 viggle ai 来制作古人版“小明剑魔”回答我，搞笑视频！

免费的AI扩图、抠图、区域重绘擦除被我找到了，那就是豆包AI。

Face Swap — AI换脸工具离线版，一键更换视频/图片人物脸部！ROOP

ChatGPT中文指令角色预设大全！让你的AI更懂你！ChatGPT提示词（Prompt）大全

FreeClaude35Assistant：让你免费无限制使用Claude 3.5 Sonnet 大模型

DeepSeek R1大模型本地部署教程，超级简单一键部署，让你实现AI真正的自由问答。

zerox

演示

部署

数据统计

相关导航

Kimi Copilot – 网页总结助手

Elmo

ChatYouTube

ChatPDF

ChatDOC

ima知识库

NotebookLM

TXYZ

暂无评论

网址

朱雀大模型检测

Weights

ChatGPT

Fish Audio

即梦AI

纳米AI搜索

DeepSeek

OpenAI 学院

Manus

Midjourney

网址

使用 viggle ai 来制作 古人版“小明剑魔”回答我，搞笑视频！

免费的AI扩图、抠图、区域重绘擦除被我找到了，那就是豆包AI。

Face Swap — AI换脸工具离线版，一键更换视频/图片人物脸部！ROOP

ChatGPT中文指令角色预设大全！让你的AI更懂你！ChatGPT提示词（Prompt）大全

FreeClaude35Assistant：让你免费无限制使用Claude 3.5 Sonnet 大模型

DeepSeek R1大模型本地部署教程，超级简单一键部署，让你实现AI真正的自由问答。

使用 viggle ai 来制作古人版“小明剑魔”回答我，搞笑视频！