近日,成都智算中心在昇腾AI基础软件生态建设上取得新进展,完成了全球领先的文档解析模型——PaddleOCR-VL的适配验证。该模型的成功适配,为区域开发者与企业提供了又一项可便捷使用的领先AI工具,体现了成都智算中心在夯实AI算力基础设施、持续丰富平台模型生态方面的扎实能力。

PaddleOCR-VL是百度于2025年10月正式开源的自研模型。它以“轻量级”的身躯,实现了令人瞩目的性能突破:
全球性能榜首:在全球权威的文档解析评测OmniDocBench V1.5中,以92.6的综合得分问鼎榜首。在文本、表格、公式、阅读顺序四大核心能力上均达到业界最优水平。
极致高效的0.9B参数:核心模型参数量仅为0.9B,却在精度和效率上超越了众多参数庞大的巨型多模态大模型以及OCR领域的垂直模型等,实现了“小体积、大能量”。
真正的“理解”而非简单 “识别”:不同于传统OCR只能逐行识别文字,PaddleOCR-VL能像人一样“读懂”复杂版面的逻辑结构。它能精准提取财报表格、数学公式、课堂手写笔记等多元信息,并自动还原符合人类阅读习惯的信息顺序。
PaddleOCR-VL基于昇腾完成适配,为企业在OCR领域提供了先进的技术选择和独特优势,其核心价值在于:
1多模态理解,精准处理领域数据
企业垂域数据多存在于复杂文档中。PaddleOCR-VL能深度解析合同、报告、票据中的文字、表格、公式及手写体,将大量非结构化文档高效转换为可供模型学习的优质结构化数据,为专属模型提供高质量的“数据原料”。
2基于国产算力,安全合规有保障
在成都智算中心的国产化平台上进行开发,为对数据安全要求高的政务、金融、医疗等行业提供了关键保障。实现了全流程数据在自主可控环境内处理,满足安全合规要求,同时已完成的适配确保了后续开发运行的稳定高效。
3开源轻量,降低定制成本与门槛
其模型小、开源开放的特点,让企业能基于此优秀模型进行低成本部署,大幅缩短开发周期。轻量化设计也易于与现有系统集成,在普惠算力支持下,显著降低了打造和运行专属模型的综合成本与技术门槛。
总结来说,这一组合为企业提供了一条安全、高效、经济的垂域智能化路径,助力企业将文档中的领域知识快速转化为专属的AI能力。

目前,PaddleOCR-VL模型已在成都智算中心平台上完成部署和验证,具备了面向各类用户提供服务的能力。
立足成都,算赋百业。成都智算中心将继续致力于打造开放共赢的AI创新生态,引进和适配更多像PaddleOCR-VL这样的前沿成果,携手合作伙伴,共同推动人工智能技术扎根现实场景,赋能千行万业的智能化升级。


发表评论