中研网

苹果Siri学说上海话 语音助手究竟是怎么工作的?

HuZhongKai


目前,迄今为止,至少有一件事是Siri的竞争对手做不到的,即会说36个国家的21种语言。这个功能非常重要,因为大部分智能手机都是销往美国以外的地区的。

据报道,微软的“小娜”会说13个国家的8种语言。谷歌语音助手会说4种语言,该服务一开始只在谷歌自家的Pixel手机里有,后来又装入了其他安卓设备。亚马逊的Alexa只会说英语和德语。

微软公司一个29人的编辑团队正着手推出面向地方市场的定制“小娜”服务。谷歌和亚马逊都表示计划给它们的语音助手添加更多语言,但两家公司均拒绝透露更多消息。

而苹果Siri,如今也要开始学说上海话了,一种只在上海和周边地区使用的吴语方言。这说明,智能助手要想成为能够全面操作智能手机和其他设备的工具,就必须跨越语言的障碍。

Siri可以说是这些服务中的老前辈了。许多研究人员,包括位于西雅图的艾伦人工智能研究所的首席执行官奥伦·埃齐奥尼在内,都认为在语音识别和回答问题方面,苹果的领先优势已消耗殆尽。

智能化的语音助手究竟是怎么工作的呢?

提取语音:

通过话筒,获取你所说的语音,声波信号转换成电压信号,或是电流信号。

电信号的滤波:

将电压信号或电流信号通过硬件电路,进行高频滤波或是带通滤波,去除直流信号,和相关的分语音信号的干扰;其中的滤波器,有硬件电路实现的,也有软件实现的,现在大部分滤波的实现都是采用软件的方式。

语音信号的预处理:

滤掉非语音信号以后,把语音信号进行相关的处理,这些的方法都是基于对人类语音和听觉研究所得到的,有很多比较好用的方法。常见方法有:语音预加权,语音分帧,语音加窗等方法。

将纵波的声波转换成电信号,然后在再由模拟的信号转换成数字信号,再根据语音学科相关的原理将语音进行相关的标准化处理,和简单的辨别处理。

标签: 苹果Siri 苹果Siri说上海话 语音助手工作原理

相关阅读

热点头条

精彩图文