当前位置:

百度发布国内首款AI输入法 进入全感官输入2.0时

作者:「比较快」

发表于:Jul 23, 2019

浏览:

当输入告别键盘,语音、表情、动作都成为输入方式,会是一种怎样的神奇体验?

1月16日,在百度输入法“AI·新输入 全感官输入2.0”发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。

同时,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破,流式截断的多层注意力建模(SMLTA)将在线语音识别精度提升了15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。

发布会现场,百度高级副总裁王海峰表示,输入法是离用户最近的产品之一,也是AI落地的“桥头堡”,百度全方位的AI能力正在不断赋能输入法,让输入法更”聪明“。他也给出了输入法行业的“未来画像”,他认为,虽然目前的输入法产品主要应用于手机端,但未来的输入法将应用于各种智能设备与用户的交互,并走向世界,为全球用户提供更多元的输入方式。
  据介绍,截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。同时,百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并已与超过100个全球知名IP达成合作,实现技术与市场的双丰收。

SMLTA语音识别精度全球领先 语音技术创新带动交互变革

百度输入法AI探索版是百度AI落地应用的又一重要成果,全语音交互是它最大的特点之一。“虽然当前输入法主流是键盘输入,但对用户需求变化的洞察,让我们有信心较早地推出这款全语音交互的产品”,百度中文输入法负责人蔡玉婷表示,相较2016年,百度输入法日均语音请求量增长了8倍,语音输入法的场景也从聊天和搜索拓展到游戏、娱乐、购物等众多场景。

全语音交互对于语音识别准确率要求极高,百度推出全语音交互输入法的信心,还来自于百度领先业界的语音技术。现场,百度语音技术部负责人高亮宣布了百度语音输入的四项重大突破和给输入法用户带来的体验提升。

在线语音领域,百度发布流式截断多层注意力建模(SMLTA),这是中文在线语音识别历史上的两个重大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型;世界上第一次大规模部署在线语音交互注意力模型。这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题,并将在线语音识别精度提升了15%,超越行业最高水平15%。

离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。

中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入技术突破,让用户真正实现“自由说”,无论是中英文夹杂,还是普通话家乡话来回切换,百度输入法都能准确识别。据介绍,百度输入法是目前唯一实现了高精度“中英自由说”和“方言自由说”的输入法产品。