评测主体
本次评测针对的主体为各厂商的声控技术。我们选用了6款不同厂商的手机进行测试。尽管都不是各个厂商最新款的产品,但是由于各厂商推出此功能的手机已经很久了,选用它们具备一定的代表性。我们选用的6款产品分别为:摩托罗拉 L2000(资料)、西门子 3568I(资料)、爱立信T18、飞利浦989、诺基亚 8210(资料)和三星SGH-2488。
标准和内容
为考察影响手机语音识别的因素,以及在不同因素下对手机语音识别的影响,数字通信评测室特别设计了4个评测条件:使用环境、不同的使用者声源、手机声源的距离和手机内有多条记录语音。评测声源保持在88~92分贝的范围之内,是一个正常人说话的声音水平。
考虑到拨打手机最多的场合集中在办公环境、开放环境的马路上和汽车上。因此,数字通信评测室专门设计了三种代表性的环境,以对不同噪音水平下的手机语音识别进行评测。三种环境为:1.办公环境(代表安静的环境,环境噪声为65分贝) 2.开放环境的马路上(代表嘈杂的环境,环境噪声为90分贝) 3.汽车上(代表运动的环境,环境噪声为85分贝),环境噪声采用专业噪声设备进行测试,并得出的数值。
由于手机用户地域性特征比较明显,在语言上的差别很大。因此我们选用了三个不同地域语言的代表人物进行测试,借以考察人员语音语调对手机语音识别造成的影响。测试语言分别为标准普通话、方言普通话和四川方言。
在一般情况下,手机用户对于对语音的录入不仅仅满足于一条,那么在多条语音记录的情况下手机语音识别率是否能够达到令人满意的程度呢?为此,我们为测试手机都录入了三条语音记录:数字通信、手机声控、评测。手机开始的录入内容均采用标准普通话进行录入,语音采样是在安静环境下(65分贝)标准的普通话录入。为了测试的准确性,我们对每种条件下的语音拨号记录都进行了10次测试。
评测室选用的手机语音拨号的距离采用10厘米、30厘米两种,即手机话筒与声源(人口)之间的距离。在对手机使用者的调查和分析中,选用这两种距离具有一定代表性。因为手机用户在进行语音拨号的一般行为是拿着手机对着话筒进行拨号,此时手机与使用者之间的距离大概为10厘米左右;另外我们考虑语音拨号功能的设计就是动口不动手,所以现在非常流行的手机挂绳被我们借用。手机挂在胸前大概距离为30厘米,因此我们也选用了30厘米的距离。
诺基亚 8210
诺基亚的语音标签在电话簿中进行录入,当听到嘟的一声时便可以开始进行了。
见图1,单个记录,声源距离10厘米。从图形来看,各个环境下诺基亚语音识别率保持得比较稳定。在安静环境下,识别率略高,对声源的语音语调有一定要求,对普通话和四川方言识别率稳定,方言普通话反而不高。
见图2,单个记录,声源距离30厘米。从图形来看,各个环境下诺基亚语音识别率保持得比较稳定,不过测试成绩不能令人满意。对比图1,我们可以看出,声源距离对诺基亚语音识别率影响较大,特别是在环境噪声水平较高的情况下,测试成绩下降幅度较大。
见图3,三个记录,声源距离10厘米。从图形来看,在各个环境下诺基亚语音识别率保持得比较稳定。普通话、四川话较稳定,方言普通话识别率较差。对比图1我们可以看出,诺基亚手机语音记录个数与语音识别率没有太大的关系,总体成绩差不多。
见图4,三个记录,声源距离30厘米。从图形来看,在安静环境下诺基亚语音识别率较高,但是方言普通话还是很不理想。随着环境噪声的增加语音识别率降低幅度大。对比图2,我们可以看出,在噪声水平较高的地方,多条记录使语音识别率降低;对比图3,85分贝以上,声源距离对诺基亚的影响巨大,此时的总体识别率不高。
结论:诺基亚语音识别的特点是:在安静环境中,声源距离较近时,诺基亚的识别率稳定,效果令人满意。但随着声源距离和手机语音记录个数增加,语音识别率明显降低,尤其在高分贝的环境中,不能令人满意。
爱立信T18
爱立信T18是测试当中语音识别功能反映最慢的一款手机,在语音识别模块的软件设计上有待改进。
见图5,单个记录,声源距离10厘米。从图形来看,爱立信的语音识别相当稳定,影响语音识别因素是声源的语音语调,普通话的识别率很高,在不同的环境噪声中都有很好的表现。
见图6,单个记录,声源距离30厘米。从图形来看,爱立信的语音识别率不高,对声源的语音语调比较挑剔,普通话的识别率最高,噪声越强识别率越低。对比图5,我们可以看出声源距离成为了制约语音识别的主要因素,随着噪声水平的增加,影响越来越明显。语音识别率越来越低。
见图7,三个记录,声源距离10厘米。从图形来看,各种环境下爱立信的语音识别率较稳定,普通话的识别率仍然最高,到了90分贝,整个识别率降低明显。对比图5,我们可以看出,多条记录对于爱立信语音识别率没有明显的影响,也只是在小范围的正常波动。
见图8,三个记录,声源距离30厘米。从图形来看,各种环境下爱立信的语音识别稳定,噪声环境中有一些波动,普通话仍然识别率较高。对比图6,我们可以看出,多条记录会给爱立信的语音识别率影响不大,就测试数据看反而有所升高;对比图7,我们可以看出,声源距离对爱立信的语音识别影响明显,随着声源距离的增加识别率明显下降。
结论:爱立信的语音识别特点是:爱立信的语音识别相当稳定,影响语音识别因素是声源的语音语调,普通话的识别率很高,在不同的环境噪声中
都有很好的表现。同时多条记录对爱立信的语音识别率影响不大,但是声源距离对爱立信的语音识别影响明显,随着声源距离的增加识别率明显下降
摩托罗拉 L2000
摩托罗拉的声控技术采用两次确认方式,两次语音录入的语调比较吻合,摩托罗拉 L2000便可以开始语音拨号。
见图9,单个记录,声源距离手机为10厘米。从图形来看安静环境下(65分贝)的普通话识别率较高,声源其他的语音语调识别效果均不佳,随着环境噪声的增加,语音识别率大幅度下降。
见图10,单个记录,声源距离手机为30厘米。从图形来看安静环境下(65分贝)的普通话识别准确,非标准普通话识别率低;特别在噪声环境中,摩托罗拉表现差强人意,识别率为零。对比图9,我们可以看出,在安静环境下声源距离对于语音识别影响并不大,但是到了嘈杂环境识别率很低,并且伴随着噪音的增加,识别率大大降低,基本不能正确识别。
见图11,三个记录,声源距离手机为10厘米。从图形来看安静环境下(65分贝)的普通话都能正确识别,其他语音语调识别率有所降低。而且随着噪声水平的增加,识别率开始降低嘟嘟较大。对比图9,我们可以看出,在各种环境下手机的语音记录数对语音识别影响不大,属于一个正常波动的范围。
见图12,三个记录,声源距离声源为30厘米。从图形来看安静环境下(65分贝)的普通话识别率高,但是对声源的语音语调有一定要求,而且在噪声水平较高情况下,手机几乎不能正确识别。对比图10,我们可以看出多条语音记录对摩托罗拉的语音识别影响不大;对比图11,我们可以看出,声源距离会对摩托罗拉的语音识别产生影响,特别是在嘈杂的环境中,摩托罗拉的表现令人遗憾。
结论:安静环境下(65分贝)的普通话识别率较高,其他的语音语调均不能达到满意的程度,而且随着环境噪声的增加,语音识别率降低幅度大;多条语音记录不会太影响摩托罗拉的语音识别;但是声源距离是摩托罗拉语音识别的重要敌人,特别是在嘈杂的环境中,识别率极低,不能令人满意。
西门子 3568I
西门子进行语音拨号,听到“嘟”的一声提示音以后就可以开始进行语音拨号。西门子的声控技术也采用两次确认方式,在语音录入时需要对采样声音进行两次输入比对,最终确定采样音源。
见图13,单个记录,声源距离10厘米时。从图形来看安静环境下(65分贝)各种声源的语音语调识别率都很高,但是随着噪声水平的提高,识别率降低幅度比较大。
见图14,单个记录,声源距离30厘米。从图形来看安静环境下(65分贝)的识别率依然很高,但是噪声水平对其影响巨大,噪声的增加识别率下降为0。对比图13,我们可以看出安静环境下声源距离识别率影响不大,但是在噪声水平较高情况下声源距离的影响就非常明显了,任何语音口令均不能正确识别。
见图15,三个记录,声源距离10厘米。从图形来看安静环境下(65分贝)的识别率较高,但是随着噪声水平的增加,识别率降低幅度比较大。对比图13,可以看出西门子手机语音记录个数对语音识别影响不大,识别率没有明显的变化。
见图16,三个记录,声源距离30厘米。从图形来看安静环境下(65分贝)的识别率很高,但是随着噪声水平的提高,识别率降低幅度开始变大识别率很低。对比图14可以看出,多条语音记录对西门子的语音识别影响不大;对比图15,我们还可以发现声源距离在噪声水平比较高的情况下对语音识别的冲击较大,噪音越高手机的语音识别率越低。
结论:西门子语音识别的特点:静环境下(65分贝)各种声源的语音语调识别率都很高,但是随着噪声水平的提高,识别率降低幅度比较大;而多条的语音记录并不会对手机的语音识别造成太大的影响;声源距离在噪声水平比较高的情况下对语音识别的冲击较大,噪音越高手机的语音识别率越低。
飞利浦989
飞利浦的声控技术一向是备受推崇的。在对送测样机的测试中,飞利浦的声控技术的确令我们叹为观止。进行语音拨号时,飞利浦没有语音提示,当听到嘟的一声时,就可以录音。
见图17,单个记录,声源距离为10厘米。从图形来看,不管处于测试的任何环境,飞利浦的语音识别率都相当高,特别是在65、85分贝情况下,只有90分贝时有轻微下调。
见图18,单个记录,声源距离为30厘米。从图形来看,安静环境下(65分贝)飞利浦识别率较高,但是随着噪声水平的增加,识别率有所降低,识别率仍然维持在60%的以上。对比图17,可以看出,声源距离的提高对各种环境下的识别率有影响,在安静环境中这种影响较小,在噪声水平较高时,影响较大。随着噪声的增加下降幅度增大,总体识别率位置在60%以上。
见图19,三个记录,声源距离为10厘米。从图形来看,飞利浦的表现稳定,即使在嘈杂的环境,识别率依然强劲。对比图18,我们可以看出,多段录音对飞利浦的语音识别只有极小的波动。
见图20,三个记录,声源距离为30厘米。从图像来看,这是飞利浦几组数据中最差的一组,安静环境下(65分贝)飞利浦语音识别率较高,但是随着噪声水平的提高,识别率降低明显。对比图18,我们可以看出安静环境下多条语音记录影响不大,但是到了高噪声水平时影响变得很明显。对比图19,我们可以看出,在安静环境下声源距离的影响可以忽略,但是在嘈杂环境当中,高噪声和距离的双重作用使飞利浦的识别率下降厉害。
结论:飞利浦语音识别特点:安静环境下(65分贝)飞利浦识别率较高,但是随着噪声水平的增加,识别率有所降低,识别率仍然维持在60%的以上;安静环境下多条语音记录影响不大;但在在嘈杂环境当中,高噪声和距离的双重作用使飞利浦的识别率下降厉害。
三星SGH-2488
三星送测的SGH-2488手机在进行语音录入时,会出现三次中文提示音,然后可以录入并进行对比。只有三次完全吻合,才能对录音进行保存并开始进行语音拨号。
见图21,单个记录,声源距离为10厘米。从图形来看三星的语音识别对噪音环境,声源的语音语调要求很严格,在安静的环境下三星能够识别比较标准的普通话,其他环境下识别率均为零。
见图22,单个记录,声源距离为30厘米。从图形来看三星的语音识别对噪音环境,声源的语音语调要求很严格,在安静的环境下三星能够识别标准的普通话,其他环境下识别率均为零。
见图23,三个记录,声源距离为10厘米。从图形来看三星的语音识别对噪音环境,声源的语音语调要求很严格,在安静的环境下三星能够识别标准的普通话,其他环境下识别率均为零。
见图24,三个记录,声源距离为30厘米。从图形来看三星的语音识别对噪音环境,声源的语音语调要求很严格,在安静的环境下三星能够识别比较标准的普通话,其他环境下识别率均为零。
结论:三星语音识别特点:在实际测试当中我们发现,三星这款手机对语音语调的要求是送测样机当中最严格的,可以说到了比较苛刻的地步。在语速,音调上的稍微变化,就足以影响语音拨号的正确识别,三星公司大概也知道它们的严格要求,所以它提供了二次机会进行语音拨号的机会,当你第一次不成功时,还有一次机会,不过这个机会也不容易抓住。实际测试当中最影响三星语音识别率的因素就是声源的语音语调,在对标准普通话进行采用后,除了标准普通话的语音拨号成功较高外,其余的语音语调成功率机会为零。同时环境噪声对三星的语音拨号也有一定的影响,我们可以很容易推断,环境噪音的增加,必然对语音拨号的声源信号产生影响,任何一点小的变化都不能从三星那里得到正确的识别。不过我们也应该认识到,三星在软件设计方面考虑得更多是对手机持有人的照顾,离开了原有的手机持有人再想对以前的语音记录进行拨号可能性很小。同时可以避免在嘈杂的环境中手机误拨错误的产生。
总评
通过对6款手机所作的语音拨号的识别率综合性能测试,我们可以得出结论。影响手机声控能力的主要因素是:环境、使用者的语音语调、声源距离。从实际测试成绩来看,手机内存储语音样本个数对手机的语音识别影响不大。目前应用的手机声控技术在安静环境下识别率都比较高,测试的6款手机在安静的环境下均能够得到比较满意的效果。而在这种环境条件下,能制约各品牌手机语音识别性能的就是测试人员的语音语调。在这6款具有代表性的手机品牌中,由飞利浦989所代表的的声控技术无疑是最优秀的。无论是身处什么样的环境,还是声源的多变性,飞利浦的识别率都能令人非常满意。
数字通信评测室建议:虽然目前声控技术应用越来越多,但是在普通消费者心目当中,还没有把声控功能更多地考虑到影响购买的因素当中。同时,消费者也不太了解对于如何更好地应用声控技术。声控技术在未来肯定是一门热门技术,并越来越成熟,正确有效的使用声控功能对于“摩机”一族来说是很重要的。用户在现阶段使用手机的声控功能时,数字通信评测室敬告大家应注意几点:对于绝大多数手机来说在使用此功能时,应注意选择安静一点的场合,同时注意应让手机尽量保持近一点的距离;为了保证有更好的声控命令识别率,在录入声控指令样本时,尽量选择语音语调差异较明显的指令;在实际使用声控功能的时侯,尽量让自己的声调和语速同录入指令大致相同;当然选择一个语音识别能力好的品牌也是非常重要的。
我们清楚地感到,当手机各项功能都趋于完备的今天。在手机上加入时尚而实用的一些功能,也是目前各大手机厂商的一项重要的战略。声控,作为在今天的手机上一个重要的功能,时下已经成为衡量手机功能是否完善的一个重要条件。虽然这次通过测试各品牌手机的声控功能,其结果差强人意,不过我们相信在不久的将来会有更多更新更好的功能整合到手机上来,而作为个人的数字化产品,手机对人们的帮助与作用也将越来越明显。
本次声控评测编缉推荐品牌:飞利浦
本文地址:http://www.cnonline.org/2001/article/1264.html