项目
https://github.com/allenai/olmocr
效果如图(前端代码为ai生成,使用 Gradio 构建):
识别以下示例图片用时:45.7秒
测试服务器:
配置项 | 规格 |
---|---|
vCPU | 16核 |
内存 | 60 GiB |
系统镜像 | Ubuntu 20.04 64位 |
显卡型号 | NVIDIA A10 |
显存 | 24 GB |
第一次搞 有点乱!晚点整理踩坑记录!!!
补充:
表格识别:
公式识别:
转换后:
olmocr!成了,效果还行~ by https://oneszhang.com/archives/145.html
服务器配置需求也太高了
嗯,是滴,要求贼拉高,因为要跑一个大模型,用qwen-vl优化的一个7b识别图像
什么时候开个接口@(吐舌)
就买了7天,花了300多,明天到期 T_T