文章分类

当前位置:首页>文章中心

从数据角度全面解析,智能语 音交互产品该怎样确定“唤醒词”

发布时间:2018-01-25 点击数:879

“小度小度,我想听周杰伦的新歌《等你下课》。” “小度小度,帮我打开卧室的灯。” “小度小度,定一个 明早七点半的闹铃。” 

和很多 智能语音交互产品一样,当你使用搭载DuerOS系统的 智能音箱的时候,需要多 次这样叫出它的名字——“小度小度”,才能让 它更好的为我们服务。但是什 么样的名字才是好名字?什么样 的名字顺口悦耳人人喜爱?产品经理想叫A,其他同事想叫B,到底应该叫什么好呢? 

本篇文 章将从数据的角度,科学的告诉你,智能语音交互产品该“叫”什么名字。 

一、什么是“唤醒词”以及它为什么重要?

1. “唤醒”和“唤醒词”

在讨论名字之前,我们首 先对语音交互过程中的一些定义做一个简单的介绍。 

语音交互的过程,和我们 平时与人交流的方式非常相似。比如某 天中午你正坐在办公室看到窗外阴天,你担心 接下来会不会下雨,于是你 向正在低头办公的同事喊了一声“小明”,小明听 到了抬头看你表示在听,你接着问“今天会下雨么?”小明打 开手机查了一下今天的天气预报,然后回答你说“天气预报说下午3-4点有雷阵雨”。 

在百度AI交互设 计院的研究地图中,语音交 互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤 醒是每一次用户与语音产品交互的第一个接触点,因此唤 醒环节的体验在整个语音交互流程中至关重要,它的体 验好坏将直接影响用户对产品的“第一印象”。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

我们知道,尽管是“智能”的语音交互产品,机器仍 然没有我们人类聪明。对于目 前市面上常见的语音交互产品来说,一个眼 神或者一个动作还不能引起它的注意,因此需 要定义一个将产品从待机状态切换到工作状态的词语,们称这种词为“唤醒词”。 

还记得 我们刚刚提到的“问天气”的例子吗?我们通过呼喊“小明”的名字,来引起他的注意,而对于 智能语音交互产品,我们也需要通过叫出“名字”,也就是 唤醒词来激活设备。以智能音箱产品为例,“小度小度”是唤醒渡鸦raven H的唤醒词,“Hey Google”是唤醒Google Home的唤醒词,“Alexa”是唤醒Echo的唤醒词。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

2. “唤醒词”对用户体验的影响

百度AI交互设 计院基于大量的对智能语音交互产品用户测试的经验,发现影 响语音唤醒体验的因素包含两个维度——输入和输出。输入环 节的影响因素包括唤醒词、唤醒方式,输出环 节的影响因素包括唤醒响应速度、唤醒反馈方式、唤醒成 功率和误唤醒率。为了确 定影响语音唤醒体验的主要因素,我们通 过问卷调查的方法对其重要性进行了研究。调查结果发现,对于用户来说,唤醒词 是语音唤醒输入环节中较为重要的影响因素,且一个好的唤醒词,会直接影响唤醒率。 

而目前,关于唤 醒词设计的关键因素还未进行科学的研究。鉴于此,本期我 们以唤醒词为对象进行研究,希望能 够对唤醒词的设计提供理论和数据上的支持。 

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

另外,我们将 在后续的文章中,为大家 陆续呈现关于影响语音唤醒体验的更多研究,敬请关注。 

二、怎样设计一个好的“唤醒词”? 

针对唤醒词,我们先 后通过以下两个实验进行了研究。

实验一:现有唤 醒词组合方式研究

实验二:唤醒词语音要素研究

下面我 们对每个实验的结论进行逐一详述: 

实验一:现有唤 醒词组合方式研究

首先,我们对 市场上各类语音交互设备唤醒词的组合方式进行拆解,发现唤 醒词均是在一个简单“名字”的基础 上加以变化而构成,此外,“名字”本身也 具备不同的构成方式。在实验中,我们为 用户提供了不同组合方式的唤醒词,由用户 根据其个人喜好程度在5点量表上进行评价(1-非常不喜欢、2-不喜欢、3-一般、4-喜欢、5-非常喜欢)。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

实验结果表明,不同组合方式下,用户的喜好程度不同: 

1)在以“名字”为基础 的不同组合方式中,“名字+名字”的叠词 式组合方式最受用户喜欢,而“品牌+名字”的组合 方式最不被用户喜欢。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”2)另外,就“名字”本身而言,“小+字”的名字最受用户喜欢。这点也 与汉语人名命名习惯相符,《汉语人 名用字的统计分析(郑淑花,2010)》显示,“小”字在人 名命名十大常用字之中。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

实验二:唤醒词语音要素研究

音节是 听觉上最容易分辨出来的语音单位,也是最 自然的语音单位,汉字中 一个汉字读音就是一个音节,每个基 本音节都是由声调、声母和 韵母三个部分构成。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”理想条件下,我们希 望对唤醒词每一音节的声调、声母、韵母进行研究,但是由 于音节数的增加,研究变 量数将大幅度增长,导致我 们无法通过一次实验来完成。另外,通过文献查阅,我们发 现人们在起汉语人名时,会将尾 音节的发音情况列入考量,同时,汉语人名/宠物名 统计研究中也多见其对尾音节发音情况的统计。 

因此,综合文 献和前文实验的结论,本次实 验中我们以唤醒词尾音节为研究对象,选取“小+字”的构词结构,变换尾音节,进行唤 醒词的发音偏好实验。同时为 避免用户受汉字本身字义的影响,实验中 用户看到的唤醒词均为标有声调的拼音。在实验中,我们要 求用户根据其个人喜好程度在5点量表 上对唤醒词进行评价(1-非常不喜欢、2-不喜欢、3-一般、4-喜欢、5-非常喜欢)。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

实验结果表明:

1)声调方面,用户最喜欢阴平(1声);另外相较“仄声”(3声上声、4声去声统称为“仄”),用户更加喜欢“平声”(1声阴平、2声阳平统称为“平”)。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”2)声母方面,用户更 加喜欢尾音声母为零声母,而包含了z、c、s的舌尖 前音最不被用户所喜欢。 

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

3)韵母方面,从韵母 发音时的开口口型来看,用户更 喜欢开口口型较大的齐齿呼和开口呼;另外从韵母结构来看,音节韵 母为单韵母的词最受用户的喜欢。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

三、小结 

本文主 要围绕智能语音交互设备的唤醒词展开研究,从唤醒 词组合方式和语音要素两个方面探讨了影响用户体验的因素,我们发现: 

1)现有唤 醒词组成方式方面:

§  在以“名字”为基础 的不同组合方式中,“名字+名字”的叠词 式组合方式最受用户喜欢,而“品牌+名字”的组合 方式最不被用户喜欢;

§  就“名字”本身而言,“小+字”的名字最受用户喜欢。

2)语音要素方面:

§  声调:用户最喜欢阴平,同时相较“仄声”,用户更加喜欢“平声”;

§  声母:用户更 加喜欢尾音声母为零声母,而包含了z、c、s的舌尖 前音最不被用户所喜欢;

§  韵母: 按照韵 母发音时的口型开口情况来看,用户更 喜欢开口口型较大的齐口呼和开口呼;另外按 照韵母结构来看,音节韵 母为单韵母的词最受用户的喜欢。 

基于本文的研究,相信你 已经掌握了如何构造一个好的唤醒词的方法了吧?以下是 我们结合收集的用户自定义唤醒词及本文研究结论,为唤醒词作出的分类,供读者们应用参考。

从数据角度全面解析,智能语
音交互产品该怎样确定“唤醒词”

需要注意的是,本文是 从用户视角出发,对唤醒 词进行了科学的研究和探讨,但是实 际在设计唤醒词时,需要考 虑的因素还有很多,如:唤醒词 是否过于常见导致语音设备容易被误唤醒,唤醒词 与品牌之间是否具有关联。另外,受当前 语音技术的限制,现有的唤醒词多以4音节词居多,但未来 随着语音技术的进步,唤醒词 的长度存在变短的趋势,在设计 唤醒词时还应考虑其可优化的空间等等。 

特别注明:由于实 验设定的条件和样本数量等限制因素,本次实 验研究结论或许不能代表所有智能产品用户在家居环境的全部感受,但希望 通过我们的研究和探索,可以为 语音交互中唤醒环节的设计提供支持和依据,帮助打 造自然和极致的语音交互体验。

未来,我们还将继续围绕AI交互设计各个环节、体验要 素开展更多研究,不断拓 展人工智能交互设计领域的研究地图,也欢迎 感兴趣的同学一起交流、探讨。

在线客服
  • 销售热线
    020-82395261