三星无声语音助手 静默式交互体验
admin
2021-01-11 05:22:08
0

在2019年,三星就曾预告过新的“人造人”NEON助手,并表示NEON可以像真正的人类一样进行对话,并有一定的感知能力。NEON的网站上宣传其外观和行为都像真实的人类,能够表现出情感和智慧,而据相关消息,三星最终将随三星Galaxy S21 Ultra独家发售这款数字助手。

数字助手首先也是一款手机助手软件,目前,智能手机能够提供各种类型的应用服务,其中就包括手机助手软件,用户可以通过语音、文字等方式与智能手机之间进行交互,智能手机通过该语音识别助手软件识别语音后,提供对应的应用服务。

智能手机识别语音的功能可以有三种方式:交互任务型、知识问答型及闲聊型。其中,交互任务型语音识别方式使得用户可以通过直接的语音输入,由智能手机识别该语音,完成与智能手机的应用服务之间的交互意图,而无需进行多次语音识别界面的操作。

但是,智能手机提供的交互任务型语音识别方式对用户来说,使用率并不高,这是因为用户在通过语音操控智能手机时,存在以下缺点:1)公众场合不适合使用语音,有隐私问题;2) 智能手机处于嘈杂的远程环境下,语音识别的效果不佳;3)因为用户发音不准确,形同意思的表述方式多样等因素,语音识别和语音理解的准确率还需要提高;4)有些用户不习惯使用智能手机提供的语音识别界面。

那么,智能手机该如何在这些条件下简便且准确地采用语音识别方式实现交互任务呢?为此,三星在2019年9月27日申请了一项名为“一种采用语音识别方式实现交互任务的方法及系统”的发明专利(申请号:201910921533.6),申请人为三星电子(中国)研发中心和三星电子株式会社。

根据该专利目前公开的资料,让我们一起来看看这项应用于智能设备的语音识别方法及系统吧。

如上图,为该专利中发明的采用语音识别方式实现交互任务的方法流程示意图,首先,系统会基于当前环境进行语音识别来得到文本以及语义信息,基于得到的文本以及语义信息,来确定对应的上下文信息,且划分不同的场景,基于不同的场景来在系统中匹配不同的语音技能推荐表。

这种利用语音技能推荐表的方式,可以更加准确的应对不同的场景,通过事先准备好丰富的语料库,就可以非常人性化的与用户进行对话以及完成相应的操作。而当要实现交互任务时,则会根据语音技能推荐表执行智能手机的交互任务。同时,由于是智能助手主动分析用户所处场景,并主动提供相关的操作服务,因此无需用户主动发起语音唤醒,而是由语音助手主动为用户提供相关服务,只需用户进行选择即可。

如上图,为这种采用语音识别方式实现交互任务的方法子流程图,当用户唤醒语音助手插件模块时,语音助手插件模块被触发,该模块通知语言输入信息采集模块启动信息采集,信息采集模块通过上下文感知模块获取到当前的环境信息,再向语音助手插件模块发送请求,来获取从用户语音识别得到的文本,以及做自然语言理解后的语义信息。

之后,语言输入信息采集模块将采集到的文本、语义信息及当前的环境信息传输给语言技能生成模块,由此来生成语言技能库,并通知语言技能推荐模块。

语言技能推荐模块在特定情况下可以启动,将大量不同的上下文划分到若干类场景中,对每个场景生成相应的语言技能推荐表。

如上图,为在手机上使用语言技能推荐表的展示图,该款语音助手插件模块为Bixby,当每次都调用Bixby时,都会显示出语言技能推荐表,并且场景不同,该语言技能推荐表中的推荐技能偶读不同。

例如,经过学习后,如果用户打开手机并且唤醒了Bixby,则就可以触发语言技能推荐表的展示,当用户选择某条推荐的语言技能时,将该语言技能推荐表中的文本用作用户语言输入识别的结果,以完成后续用户的指令。

以上就是三星发明的可以完成精准语音识别任务的静默式语音识别助手,其在实现交互任务时,基于当前环境下对语音识别得到文本以及语音信息,在交互时无需发出语音,仅通过用户少量选择操作就可以完成复杂的交互任务,因此可以简便且准确地采用语音识别方式来实现交互任务。

相关内容