MENU

olmocr!成了,效果还行~

• 2025 年 04 月 05 日 • 阅读: 422 • 软件分享

项目

https://github.com/allenai/olmocr

效果如图(前端代码为ai生成,使用 Gradio 构建):

识别以下示例图片用时:45.7秒

image.png

测试服务器:

配置项规格
vCPU16核
内存60 GiB
系统镜像Ubuntu 20.04 64位
显卡型号NVIDIA A10
显存24 GB

第一次搞 有点乱!晚点整理踩坑记录!!!

补充:

表格识别:

image.png

公式识别:

image.png

转换后:
image.png

添加新评论

已有 4 条评论
  1. wintsa wintsa

    服务器配置需求也太高了

    1. @wintsa嗯,是滴,要求贼拉高,因为要跑一个大模型,用qwen-vl优化的一个7b识别图像

    2. wintsa wintsa

      @丸子什么时候开个接口@(吐舌)

    3. @wintsa就买了7天,花了300多,明天到期 T_T