阅读总结

zerox

使用视觉模型将 PDF 转换为 Markdown

标签:

zerox是一款开源免费PDF处理工具,它使用ORC视觉模型可以将带有复杂内容的PDF /Word/图片等转换为 Markdown ,让你把文档变为结构化数据。

截止到发文该项目在github已经获得8.1k的star,非常火爆的AIGC工具。它的原理就是利用OCR识别复杂内容的文档,然后将内容提供给AI进行处理,最终输出清晰明了的数据文档。

演示

从结果看到它自动将文件内容进行排版,非常准确识别出了矩形数图中的数据并且按照从大到小进行排序。对于折线图的识别也非常准确,还帮我们按照时间顺序整理

zerox

下面演示言传一张带有手写文字的图片,,图片是一份有文字信息还有表格信息,AI 居然能如此准确识别手写部分的内容,准确率还不赖。

点击智能按钮还能换一种格式呈现,方便专业人员做数据分析和处理。

zerox

部署

可在Python和node 环境下进行本地部署,支持多种视觉模型~

作者提供了一个demo感兴趣的可以去看看,

demo:https://getomni.ai/ocr-demo

数据统计

相关导航

暂无评论

暂无评论...