国内首份OCR白皮书公布 全面盘点OCR产业发展态势

2020-09-29 17:51:38 | 来源:中央广电总台国际在线 | 责编:冯实

  国际在线消息:9月28日,在中华人民共和国工业和信息化部、北京市人民政府、国际电信联盟(ITU-T)指导的2020 AIIA人工智能开发者大会上,主办方正式发布国内首份智能文字识别(OCR)能力测评与应用白皮书。该白皮书从OCR发展背景、技术沿革、产业发展现状、技术标准化、发展趋势等多个维度,对当前国内OCR产业进行了梳理,全面助推OCR技术产业化加速落地及可持续发展。

  据了解,OCR是光学字符识别(Optical Character Recognition)的缩写,指利用机器将图像中手写体或印刷体的文本转换为计算机直接处理格式。作为计算机视觉领域的重要分支,OCR的典型应用是通过图像文字识别实现信息录入。由于文字和符号包含丰富的语义信息,基于OCR提取文字信息继而进行分析,能够帮助机器更好地理解图像。

国内首份OCR白皮书公布 全面盘点OCR产业发展态势_fororder_图片1

  AIIA 2020人工智能开发者大会现场

  据了解,这份白皮书是由中国信息通信研究院、中国人工智能产业发展联盟、腾讯云AI计算机视觉中心、腾讯安全战略研究部、腾讯优图实验室联合起草。

  新基建带来新机遇,OCR技术发展三大趋势

  借助人工智能技术,近年来OCR性能的提升为产业数字化催生出更复杂的OCR应用场景提供了坚实支撑,覆盖包括手机、电子产品以及云服务在内的更加多样化的服务载体,进一步加快OCR的普及,持续渗透社会生产生活的更多领域。

  作为人工智能应用中最接“地气”、商业推广较为成熟的领域,OCR产业在“新基建”背景下将迎来新的发展机遇,相关技术将迎来新一轮变革。白皮书指出,OCR技术未来发展的三大方向主要包括一体化端到端的OCR模型,兼具高性能高效率的OCR,从感知到认知的智能OCR。

  构建一体化的端到端网络,对文字检测和识别进行训练将成为OCR技术发展的重要趋势之一。端到端的网络设计不仅能减少重复计算而且能够提高特征质量,促进任务性能改善。当前,移动端OCR算法大多以牺牲一定的算法精度来换取运行速度,针对移动设备设计兼顾性能和效率的轻量OCR模型将是未来发展的重要方向。

  对智能OCR而言,OCR技术通常从计算机视觉领域出发,通过与自然语言处理技术、知识图谱等更广领域的交叉融合,语义及知识的深度挖掘提升OCR性能将成为未来发展的重要趋势。此外,在OCR中引入强化学习和元学习等新的学习范式,让机器自主学习如何识别文字将成为研究热点。

  2025年全球OCR市场规模将达到133.81亿美元

  目前,OCR技术已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。随着传统行业的数字化转型,OCR应用范围和场景将进一步扩展,市场规模将进一步增大。有机构预测,2025年全球OCR市场规模将达到133.81亿美元。

  早期受限于技术发展水平,OCR厂商通常从特定应用切入,例如车牌识别系统等,形成了一系列专用设备。近年来,越来越多的终端设备及应用均嵌入了OCR技术并逐渐形成了从基础设施、基础能力到终端应用的完整产业链生态,衍生出了卡证、票据等一系列细分OCR能力,通过组合的方式服务于各个行业。

国内首份OCR白皮书公布 全面盘点OCR产业发展态势_fororder_图片2

  OCR产业生态图

  如今,OCR技术逐渐“下沉”为一项基本能力,为上层不同业务应用提供底层技术支撑。以腾讯云为代表的科技机构和云计算厂商正纷纷加速布局OCR,在满足自身内部业务需求的同时不断对外开放先进的OCR能力。

  多行业场景成熟落地 OCR评测标准首次发布

  在具体的落地应用层面,目前,卡证识别、票据识别等标准场景文字识别已经相对成熟,手写文字识别在教育、物流等行业的应用不断扩大。复杂动态场景下的OCR技术和应用成为近两年的热门研究方向,例如,无人驾驶、机器人等场景。

  在此次发布的白皮书中,腾讯云公布了其多项OCR领域的典型落地案例。丰巢快递柜通过使用腾讯云联合腾讯优图实验室提供的身份证OCR技术,身份证字段识别准确率高达99%,提高了用户寄件、取件效率;宁波银行通过采用腾讯云联合腾讯优图实验室打造的智能票据OCR解决方案,将识别的字段准确率提升至90%以上,更好满足银行业务场景的需要;搜狗广告图片文本审核借助OCR产品服务帮助客户自动识别海量的图片文字内容,从而高效进行广告图片违法内容识别,降低客户业务的违规风险。

  为全面降低OCR相关领域的应用门槛,白皮书首次公布OCR评测标准和规范。今年4月,中国人工智能产业发展联盟制定了《OCR服务智能化分级技术要求和评估方法》。该方法规定了OCR服务在功能、性能、安全等方面的技术要求以及评估方法。7月,OCR服务要求及评估方法在国际电信联盟(ITU-T)SG16组成功立项,标志着深度学习背景下的OCR评测方法已逐渐被国际标准组织接受。

  腾讯深度参与推动OCR领域技术革新和标准制定,帮助企业客观、全面地评价不同OCR服务能力。目前,由中国人工智能产业发展联盟指导,腾讯云开发的天鉴OCR服务引擎自动化评测平台,不仅能够为OCR技术供给方提供技术测试服务,而且将发布OCR技术或产品的测试结果,为需求方提供客观公正的选型依据。(图/文 陈东)

声明:国际在线作为信息内容发布平台,页面展示内容的目的在于传播更多信息,不代表国际在线网站立场;国际在线不提供金融投资服务,所提供的内容不构成投资建议。如您浏览国际在线网站或通过国际在线进入第三方网站进行金融投资行为,由此产生的财务损失,国际在线不承担任何经济和法律责任。市场有风险,投资需谨慎。

  • GE Ontime_fororder_123_副本