zerox是一款开源免费PDF处理工具,它使用ORC视觉模型可以将带有复杂内容的PDF /Word/图片等转换为 Markdown ,让你把文档变为结构化数据。
截止到发文该项目在github已经获得8.1k的star,非常火爆的AIGC工具。它的原理就是利用OCR识别复杂内容的文档,然后将内容提供给AI进行处理,最终输出清晰明了的数据文档。
演示
从结果看到它自动将文件内容进行排版,非常准确识别出了矩形数图中的数据并且按照从大到小进行排序。对于折线图的识别也非常准确,还帮我们按照时间顺序整理
下面演示言传一张带有手写文字的图片,,图片是一份有文字信息还有表格信息,AI 居然能如此准确识别手写部分的内容,准确率还不赖。
点击智能按钮还能换一种格式呈现,方便专业人员做数据分析和处理。
部署
可在Python和node 环境下进行本地部署,支持多种视觉模型~
作者提供了一个demo感兴趣的可以去看看,
demo:https://getomni.ai/ocr-demo
数据统计
相关导航
暂无评论...