36氪获悉,国内智能语音交互领域的初创公司“标贝科技”已完成5000万元人民币A轮融资,本轮融资由深创投领投,恒生电子(600570)跟投。据悉,本轮投资将会用于拓展业务规模,以及人才梯队建设、前后端系统建设以及新型技术的研发。此前,标贝科技在2017年获得了千万元人民币级别的Pre-A轮融资,由凯泰资本投资。
标贝科技是36氪持续关注的一家AI公司,成立于2016年2月,最早做数据服务,现已升级,主要做语音合成(TTS)整体解决方案及相关数据服务:所推出的名为“声音超市”的产品,可提供多音色的语音合成服务;数据服务主要包括音库制作、文本标注、评测系统、语音转写、声音采集标注等。
作为人机交互的重要领域,语音合成技术近两年发展迅速。端对端合成技术,以及神经网络声码器技术的研究成果,使得语音合成的效果大幅提升。语音合成技术的应用也成为这两年智能语音交互领域的一个热点。国外,去年,Google系的Lyerbird推出了一套“只需一分钟的声音样本就能模仿任何人说话”的系统;今年,微软在其公有云平台上推出了语音合成定制服务产品Custom Voice。国内,讯飞推出了“讯飞留声”,只需要10段的声音采集即可完成个人声音的复刻。
标贝科技是国内语音合成领域以技术见长的创业公司。当下其优势体现在语音合成效果更好,“个性化声音”定制实现周期更短。这与团队技术背景及数据积累有关。数据上,团队此前做语音数据服务,积累了大量的语料数据。同时,研发了高效的数据标注工具,提高了数据标注的效率。技术上,CTO李秀林从事语音行业十余年,曾就职于百度,并带领团队获得百万美元大奖。
产品方面,今年5月,标贝科技打造了“声音超市”,为客户提供一个可供选择的、所听即所得的声音平台。主要按照API调用、SDK进行收费。目前已为360、网易等提供数据及语音合成技术服务。
与语音识别、语义理解等智能语音交互的技术相比,语音合成技术被认为是有机会单独存在而无需做全栈的一个方向。且随着技术的成熟,开始在诸如语音交互、有声读物、新媒体、智能客服、泛娱乐领域开始被应用。这也是当前标贝主要商业落地的领域。
CEO刘博介绍,目前在智能客服领域,标贝已与智齿等建立合作,进入银行和金融机构;在有声读物、新媒体等领域,标贝已与央视、出版社等达成合作;在语音交互领域,标贝的主要客户为智能音箱客户;在泛娱乐领域,也与几个明星工作室达成了合作;整体来看,目前智能客服领域的付费能力更好,预计明年新媒体、有声读物领域的付费能力会有所提升。
现阶段,标贝科技的主要营收还是来自于数据业务,主要客户包括了阿里、百度、腾讯、搜狗等。根据猎云网的数据,标贝科技已成功为客户提供了总规模约1500小时的IP语音库数据。
刘博认为,对标贝来说,当下技术与数据两项业务都会是公司重点。数据方面,公司去年开始已将部分资金投入到特色IP声音数据的储备;技术方面,公司目前的时间窗口还有半年左右,明年新的技术会突破。
当BAT等大厂开始关注到语音合成技术,语音合成的赛道未来竞争也很可能更为激烈。刘博认为,一方面,大公司往往需要做全栈技术,技术上未必有创业公司专注,另一方面,标贝科技目前会从三方面提升竞争力,包括提升数据壁垒、广泛布局声音类型IP、技术上寻求新突破。