快讯

领先OCR模型PaddleOCR-VL在智算适配成功

2025.12.29 | 编辑 | 7次围观山城日报网

　　近日，成都智算中心在昇腾AI基础软件生态建设上取得新进展，完成了全球领先的文档解析模型——PaddleOCR-VL的适配验证。该模型的成功适配，为区域开发者与企业提供了又一项可便捷使用的领先AI工具，体现了成都智算中心在夯实AI算力基础设施、持续丰富平台模型生态方面的扎实能力。

　　PaddleOCR-VL是百度于2025年10月正式开源的自研模型。它以“轻量级”的身躯，实现了令人瞩目的性能突破：

　　全球性能榜首：在全球权威的文档解析评测OmniDocBench V1.5中，以92.6的综合得分问鼎榜首。在文本、表格、公式、阅读顺序四大核心能力上均达到业界最优水平。

　　极致高效的0.9B参数：核心模型参数量仅为0.9B，却在精度和效率上超越了众多参数庞大的巨型多模态大模型以及OCR领域的垂直模型等，实现了“小体积、大能量”。

　　真正的“理解”而非简单 “识别”：不同于传统OCR只能逐行识别文字，PaddleOCR-VL能像人一样“读懂”复杂版面的逻辑结构。它能精准提取财报表格、数学公式、课堂手写笔记等多元信息，并自动还原符合人类阅读习惯的信息顺序。

　　PaddleOCR-VL基于昇腾完成适配，为企业在OCR领域提供了先进的技术选择和独特优势，其核心价值在于：

　　1多模态理解，精准处理领域数据

　　企业垂域数据多存在于复杂文档中。PaddleOCR-VL能深度解析合同、报告、票据中的文字、表格、公式及手写体，将大量非结构化文档高效转换为可供模型学习的优质结构化数据，为专属模型提供高质量的“数据原料”。

　　2基于国产算力，安全合规有保障

　　在成都智算中心的国产化平台上进行开发，为对数据安全要求高的政务、金融、医疗等行业提供了关键保障。实现了全流程数据在自主可控环境内处理，满足安全合规要求，同时已完成的适配确保了后续开发运行的稳定高效。

　　3开源轻量，降低定制成本与门槛

　　其模型小、开源开放的特点，让企业能基于此优秀模型进行低成本部署，大幅缩短开发周期。轻量化设计也易于与现有系统集成，在普惠算力支持下，显著降低了打造和运行专属模型的综合成本与技术门槛。

　　总结来说，这一组合为企业提供了一条安全、高效、经济的垂域智能化路径，助力企业将文档中的领域知识快速转化为专属的AI能力。

　　目前，PaddleOCR-VL模型已在成都智算中心平台上完成部署和验证，具备了面向各类用户提供服务的能力。

　　立足成都，算赋百业。成都智算中心将继续致力于打造开放共赢的AI创新生态，引进和适配更多像PaddleOCR-VL这样的前沿成果，携手合作伙伴，共同推动人工智能技术扎根现实场景，赋能千行万业的智能化升级。