登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
表格识别效果炸裂!小红书dots.ocr 与百度PaddleOCR对比 ...
表格识别效果炸裂!小红书dots.ocr 与百度PaddleOCR对比评测
[ 复制链接 ]
柩通奉
2025-8-12 08:54:12
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
OCR领域又迎来了新玩家——dots.ocr。这是小红书Hi Lab最近发布的一款基于视觉语言模型的LLM,仅有1.7B参数。由于OCR在各类应用中几乎不可或缺,且该领域许久未见新面孔,这成功引起了AI指令员的注意。其官网介绍如下:
dots.ocr是一个强大的多语言文档解析器,它在一个视觉语言模型中统一了布局检测和内容识别,同时保持了良好的阅读顺序。尽管其基础是紧凑的 1.7B 参数 LLM,但它实现了最先进的(SOTA)性能。
强大性能
:dots.ocr 在 OmniDocBench 上实现了文本、表格和阅读顺序的 SOTA 性能,同时提供的公式识别结果与 Doubao-1.5 和 gemini2.5-pro 等更大的模型相当。
多语言支持
:dots.ocr 展示了在低资源语言上的强大解析能力,在我们的多语言文档基准测试中,在布局检测和内容识别方面均取得了决定性优势。
统一且简单的架构
:通过利用单一视觉语言模型,dots.ocr 比依赖复杂、多模型管道的常规方法提供了显著更精简的架构。通过改变输入提示即可在任务间切换,证明视觉语言模型可以实现与传统检测模型(如 DocLayout-YOLO)相比具有竞争力的检测结果。
高效且快速的性能
:基于紧凑的 1.7B LLM 构建,dots.ocr 提供了比许多基于更大基础的高性能模型更快的推理速度。
那么,其实际效果如何?我们将dots.ocr与OCR领域的长期霸主——百度PaddleOCR进行横向对比评测,探讨这个基于视觉语言模型的OCR是否能在某些方面超越PaddleOCR。
本次测评内容涵盖
表格识别、公式识别、报纸版面识别、手写体识别、发票识别、报销单识别
,全面比较dots.ocr和paddleOCR在各个方面的表现。
详细测评内容请关注微信公众号“
AI指令员
”,回复
ocr
,获取完整测评分析报告!
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
表格
识别
效果
炸裂
小红
相关帖子
如何识别SQL Server中需要添加索引的查询
使用随机森林识别暴力破解
2025 年 AI 编程工具生成效果全景比拼:从技术实力到综合评分
泛2级泛内页程序,效果很好
刚刚 Cursor2.0炸裂发布!这3大亮点必学
MIP动态泛2泛内页程序效果好
借助LLM识别每一个物联设备
扣子Coze实战:从0到1搭建抖音+小红书对标账号监控智能体
LLM应用剖析: 小红书AI图文生成器-红墨
人脸识别项目如何在Spring Boot项目中如何建立数据库和管理
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
如何识别SQL Server中需要添加索引的查询
4
1057
敕码
2025-10-05
安全
使用随机森林识别暴力破解
1
459
晾棋砷
2025-10-12
业界
2025 年 AI 编程工具生成效果全景比拼:从技术实力到综合评分
1
491
威割
2025-10-21
程序
泛2级泛内页程序,效果很好
2
87
新程序
2025-10-28
科技
刚刚 Cursor2.0炸裂发布!这3大亮点必学
3
74
趣侮
2025-10-31
程序
MIP动态泛2泛内页程序效果好
3
122
新程序
2025-11-01
科技
借助LLM识别每一个物联设备
2
733
佟棠华
2025-11-12
业界
扣子Coze实战:从0到1搭建抖音+小红书对标账号监控智能体
3
228
吕梓美
2025-11-24
业界
LLM应用剖析: 小红书AI图文生成器-红墨
1
547
晾棋砷
2025-12-08
业界
人脸识别项目如何在Spring Boot项目中如何建立数据库和管理
0
390
赖秀竹
2025-12-11
回复
(2)
辜酗徇
2025-11-1 22:40:31
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享
万妙音
2025-11-6 02:10:23
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
过来提前占个楼
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
科技
签约作者
程序园优秀签约作者
发帖
柩通奉
2025-11-6 02:10:23
关注
0
粉丝关注
17
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994893
kk14977
6845357
3934307807
991123
4
xiangqian
638210
5
韶又彤
9998
6
宋子
9983
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
237
AI运动识别插件-APP版新版特性速览
775
NetBox 自动化导入资产 - IP地址
80
在调度的花园里面挖呀挖
766
ACP:让 AI 编程工具配置从此告别碎片化 —
860
画高保真原型图用什么软件?产品经理与设计
63
企业数字化转型如何破局?看这三大招
752
解决 iOS 上 Swiper 滑动图片闪烁问题:原
424
OpenCV (C++) 提速技巧(以Haar小波变换为
206
Claude Code 使用 Skills
670
资源总是不够用?这次,我用一套系统盘活了
976
UniEdit:首个大型开放域大模型知识编辑基
575
Karmada v1.16 版本发布!支持多模板工作负
311
《ESP32-S3使用指南—IDF版 V1.6》第五十五
941
纯前端调用大模型真的安全吗?我踩过的坑比
898
【分析式AI】-带你秒弄懂决策树与随机森林
98
DBLens 的数据安全、登录方式与离线使用说
72
国内开发者合规订阅 Claude Code 的 3 条最
156
Perforce QAC 2025.3 新版上线 | 速度与深
476
防止跨站脚本攻击(XSS)(完整版HTTP安全
353
Wayland下RDP服务器的搭建