🔥 Search Hot Tweets
Search and analyze hot tweets from KOL accounts list (list: https://x.com/i/lists/1961235697677017443) within 6 hours. Use SoPilot plugin to quickly comment and occupy the comment section.

饼干哥哥🍪
今天被DeepseekOCR刷屏了,但如果真是想落地使用,我依然首选PaddleOCR-VL 前者是DS提出用OCR的方式解决模型上下文压缩效率的问题,确实真让人眼前一亮,但更像一种“以图压文”的技术探索,属于研究性质。 而在企业的落地场景下,Paddle做OCR 要成熟得多。 我是起码7年前做数据分析项目的时候,要录入乱七八糟的纸质数据的时候就接触开始用Paddle,迭代到上周新发的PaddleOCR-VL,对文档和图片解析的能力非常稳定和强大 图转文效果上,DeepSeek-OCR可能仅是在纯文本的场景下能用,更复杂的场景,如报表/合同/学术 PDF 等需要做结构化还原,只有PaddleOCR-VL 才能「稳定」跑出来。 体现在模型跑分上,PaddleOCR-VL 属于SOTA 级别的方案,包括OmniBenchDoc V1.5等多个全球榜单上都是第一 其中,对表格结构理解的Table TEDS 项目Paddle 得分 93.52 而 ds 只有78.02,差了15+分也是有点离谱的 部署上更是无压力。PaddleOCR-VL 仅 0.9B 的参数, 本地甚至 CPU 也能跑(虽然慢点),但企业线上部署没有任何压力 最后,一句话总结: 企业里的 OCR 要求是可核验的逐字逐结构还原:paddleocr-vl 更符合“如实记录”的标准,而 DeepseekOCR 更偏向压缩与重构,在复杂文档中更易引入生成式幻觉。
Est. 100 views for your reply
