近日,捷通华声宣布灵云智能开放平台(hcicloud.ocm)多语种OCR识别能力服务进入试运营阶段,开始提供包括中文、英文、德文、法文、俄文、西班牙文、意大利文等十几个国家语言文字的自动识别服务。此次灵云多语种OCR能力的发布,也是继灵云平台推出13种语言的灵云语音合成、93种语言的灵云手写识别技术能力之后,灵云平台服务多国语言方面所取得的最新进展。
作为中国人工智能领域的领军企业,捷通华声自2000年开始坚持自主研究智能语音、图像等人工智能技术,并不断在OCR、手写识别等智能图像技术领域取得突破。近年来,灵云OCR在扫描识别领域异军突起,以接近100%的中英文识别率和优质的版面分析能力获得了产业内广大用户的认可,为企业大幅减少了人工文字录入工作量、提高了文档编辑和搜索的效率。伴随经济全球化的进展,人工智能技术在多语言环境中的应用需求越来越迫切。捷通华声顺应产业发展趋势,在加大多语言人工智能技术研究的基础上,依托灵云智能开放平台以开放、合作、共赢的战略发展思路,与国内外顶尖人工智能研究机构、企业开展广泛合作,全面为中国企业提供多语言人工智能技术能力服务。此次上线的多语种OCR,可以帮助企业与广大用户将德文、法文、俄文、西班牙文、意大利文等不同国家语言的文件、书籍、报纸、杂志等档案数字化,生成便于传输和管理的PDF文件,将有力促进国内企业参与国际交流。
自灵云智能开放平台(hcicloud.ocm)2011年推出灵云OCR以来,不仅面向广大用户提供直接文字识别服务,同时针对金融,能源,交通,政府,企业等领域企业户提供定制化服务。灵云OCR通过匹配图像中的关键信息来自动确认图像种类,获得更加准确的识别结果。目前灵云OCR已实现对身份证,驾驶证、行驶证、增值税发票,银行卡号、名片等各类证照、票据、表单的识别。针对特殊需求,灵云OCR还可以提供特殊定制功能,针对用户的图像种类进行模板定制,实现“一种核心,多类图像”的应用效果,尤其是在各大银行,证劵、保险公司,能源、电信、医疗、政府等办公营业厅的应用中,已成功实现人证统一、票据电子化、无纸化办公等功能,极大节省了大众用户办理业务的等待时间,也极大节省了企业业务成本,提高了办公效率,并通过减少大量复印以符合绿色环保办公的新趋势。
灵云OCR支持扫描仪、手机、照相机、摄像机、高拍仪等各种图像扫描、拍照设备,并兼容市场的主流业务系统。在各种系统应用中,灵云OCR在确保原业务系统稳定性和安全性的同时,也可借助自学习功能不断丰富字符/图像特征库,从而提高自身在识别时对图像的适应能力。除了企事业办公以外,人们生活的方方面面也因灵云OCR技术的广泛应用而更加的生动有趣。目前,用户已经可以用手机、数码相机或DV拍照名片等纸质资料,并利用灵云OCR软件识别转换成可编辑的电子资料。可以想象,日后灵云OCR的应用场景将会越来越广泛,使用也将会越来越便捷。