- 为语音输入和文本输入提供方言解决方案,是当前印度科技公司的重点研究项目
- 方言识别系统有助于解决潜在10亿方言用户的上网问题,让互联网成为边远城镇居民生活中不可或缺的一部分
- 方言使用者与说英语人群对教育、财富和政治等话题的讨论深度存在很大不同,有必要为方言用户量身定制服务
少数几家印度科技公司一直在低调地开发方言识别系统,他们目标明确,试图开发出原理简单、但有实际作用的产品,解决10亿方言用户的问题,让互联网成为边远城镇居民生活中不可或缺的一部分。
目前,这些公司想通过方言识别系统解决一系列问题,例如,开发智能聊天机器人,为印度银行系统提供方言服务;或是开发信息交流平台,让只会讲方言的农民能够从农学专家那里获得技术指导。
银行服务
Gnani.ai已经开发出基于印度语、卡纳达语、泰卢固语、泰米尔语和古吉拉特语等方言的语音识别系统,这些系统同时也适用于那些会讲英语但有印度口音的用户。Gnani.ai由曾在德州仪器公司工作的Ananth Nagaraj和Ganesh Gopalan创办,它与另外三家企业从三星创业投资公司(SVIC)获得总计6亿卢比(约合873万美元)的投资。SVIC是韩国三星集团旗下的风险投资部门。
虽然Gnani。ai目前开发的这套人工智能方言识别系统主要是为地区银行、金融机构和农协服务。不过在未来,当三星想要在其多平台语音助手Bixby上推出印度方言服务时,Gnani.ai搭建的这套自动语音识别引擎也能派上用场。
「如果你来自哈里亚纳邦的一个小村庄,想要了解自己的账户余额,你可以拨打热线电话或打开应用程序,用印地语进行询问,系统就会自动解答你的问题。」联合创始人Ganesh Gopalan说。
Gnani.ai设计这套语音系统,一开始是为了给银行的日常业务提供高质量方言服务。针对拥有大量手机银行客户端用户的印度银行,Gnani.ai在现有应用的基础上开发了语音辅助插件。目前,印度的很多国有银行和相关金融机构在印度各个省份都设有分支,并使用多种方言提供服务。
Gopalan表示,他们的技术团队与语言学家展开密切合作,不断提高识别准确性,从而为用户提供高品质服务。由于语音识别系统允许用户使用方言询问问题,并获取自动解答。因此州政府也在一个为农民提供帮助的项目中利用了这项技术。「如果农民想要了解当地市场某种农产品的价格信息,他可以使用方言向我们的系统发起询问,系统会识别出他所描述的问题,并对其进行标号,然后提供对应标号的解答。我们已经使用一些方言对系统进行了概念验证,成功获取到了某家市场里某一种农产品的价格信息。」
语音宣传与调查
印度中央政府还利用方言识别技术来开展大规模调查活动。比如,在伦敦和海德拉巴都有办公室的语音技术公司Voxta Communications就正在帮助印度国家技能培训局(NSDC)对公民的生活状况展开调查。Voxta Communications联合创始人Kavita Reddi说:「回答什么内容不重要,无论是产前或产后的护理常识,还是如何为孩子接种水痘疫苗,都可以在我们的手机机器人系统上添加相应的内容。」
由于在2014年为印度总理莫迪的竞选活动提供语音宣传服务,这家公司被人们称为「政治Siri」。最近,他们又与快速消费品巨头Reckitt Benckiser合作,推出了一场以语音识别技术为依托的个人卫生宣传活动——「Swachch Bharat」(干净的印度)。借助语音识别技术,Reckitt旗下的清洁品牌滴露在热线宣传活动中收集了大量有用数据,了解到了偏远村庄居民最需要哪些基本卫生设施。据这家公司介绍,滴露通过热线宣传的形式与村民进行互动,并为其提供建议。
Reddi说道:「我们为滴露做了一个涉及500万人的热线宣传活动。系统会用明星AmitabhBachchan的声音朗读一首关于健康与卫生的诗歌,并以选择题的方式考察民众的健康与卫生常识,参与活动的居民也可以选择聆听更多的诗歌朗诵,或者发表自己的看法……事实证明,大多数人希望能够为他们的村庄安装厕所。」
Voxta目前正与NSDC展开合作,并在早期项目的基础上(包括孕妇健康谘询项目),设计出能够识别方言的语音交互系统,帮助政府开展有关健康和卫生方面的调查活动,让居民能够用本地方言来参与活动。
农产品价格查询
Reverie Language Technologies在今年早些时候,被Reliance Industries以19亿卢比(约合2762万美元)的价格收购,他们还开发了包括印地语字体、可以实现内容转换的键盘等多种解决方案。Reverie希望能帮助农民通过方言来了解商品价格信息,并提供易于理解的方言报告供他们参考。印度政府为了促进农业发展,于2016年在农业市场门户网站(eNAM)上推出了这个方言识别项目,希望能在五年内为边远地区的农民提供帮助。
印度有超过450万农民使用eNAM平台获取农产品价格信息。Reverie已在eNAM门户网站上推出五种方言服务——印地语、马拉地语、古吉拉特语、泰卢固语和孟加拉语,并对静态和动态内容进行实时识别和翻译。Reverie Language Technologies首席营收官MithunDas表示:「我们还支持使用当地方言、每天为用户生成多种格式的报告。」这家公司的其他客户包括HDFCBank、Practo、BHIM和Intex。
信息交流平台
为语音输入和文本输入提供方言解决方案,是当前印度科技公司的重点研究项目,除此之外,一些印度公司正在努力了解当地居民关注的热门话题,并帮助他们获取相关信息。比如,通过为使用印度言提问的人们找到高质量的回答,语音服务平台Vokal已经取得了成功。快速浏览一下Vokal平台上的内容,你会发现一些印度人民经常提问的问题,比如「如果我的英语不是很好,我该如何准备IAS考试?」或者「用高压锅煮饭对健康有害吗?」。热心人则可以在Vokal上对相关问题进行解答。
Vokal联合创始人Aprameya Radhakrishna表示,方言使用者对教育、财富和政治等话题的讨论深度与说英语的人群存在很大不同。Radhakrishna说:「举个例子,那些讲英语的人可能会问‘如何才能有效地进行投资?如何为退休生活储蓄?’而那些方言用户关心的问题则是‘如何才能赚到钱’,他们显然没心思去关心投资或购买保险方面的问题。」这些差异让Vokal觉得,为方言用户量身定制产品很重要,这样才能营造一种认同感、促进知识共享。
方言语音和文本内容服务商Agrahyah Technologies联合创始人Sreeraman Thiagarajan表示,除社交娱乐外,他们还帮助10多亿方言用户使用印度方言获取知识与信息,这项工作非常有价值。Thiagarajan还持有Mooshak的股权。Mooshak是一个「为印度人量身定制」的信息交流平台,用户可以使用印度方言创建和分享内容。
在Mooshak应用程序上,那格浦尔的葡萄种植者可以使用熟悉的方言来交流种植经验。帮助方言人群获取有用信息是这个平台设立的初衷。那格浦尔的葡萄种植者经常讨论的一个话题,是关于他们还没有找到应对变种真菌的良方。他说:「虽然政府请了专职农学家来解决此类问题,但他们缺乏所需资源,无法及时展开研究——这也是农户之间需要经常进行讨论以找出解决方案的原因。」
开发者正在对这款已有四年历史的应用进行更新,并于8月份重新发布。随着地区社交平台ShareChat的崛起,Mooshak的人气有所下滑。不过此次更新将弱化平台的娱乐功能,把重点放在帮助用户找到问题的解决方案上。Thiagarajan说:「我们无法像TikTok那样拥有2亿用户群,但我们正在打造一个有实际意义的小规模平台。」
许多科技巨头已经创造出能够帮助方言用户轻松访问网页内容的技术。GoogleGo开发的一项技术让用户能够以印地语、孟加拉语、马拉亚拉姆语、马拉地语和泰米尔语等28种方言聆听网页内容。而且这项技术对硬件的要求不高,甚至能够在缓慢的2G网络连接下,通过自然语言处理和语音合成AI技术实现网页内容语音化。
微软在5月份更新Windows10操作系统时,还发布了一款支持10种印度方言的语音键盘。它能够对用户的行为模式和遣词造句进行研究,并为方言用户提供个性化的单词联想,进而提高文本输入的准确性。
亚马逊去年在Alexa印度站点推出了一项新技术,旨在帮助平台学习印地语以及泰米尔语、马拉地语、卡纳达语、孟加拉语、古吉拉特语和泰卢固语等地区方言。然而,印度科技公司希望能够立即解决方言用户获取网络资源的问题,而不是等待科技巨头来弥补这一空白。
Vokal创始人Radhakrishna说:「印度人口不可能在一夜之间学会英语,这需要花费数十年的时间。对于科技公司来说,这是一个很好的机遇,我们可以通过提供高质量方言服务来树立良好口碑。」