
2019-2025年艺术摄影服务产业深度调研及未来发展现状趋势预测报告
凭声音描绘出人脸 什么技术这么厉害?
外媒称,麻省理工学院的研究人员发明一种技术,能够仅凭借声音描绘出人脸。
据阿根廷布宜诺斯艾利斯经济新闻网6月18日报道,仅凭声音就可以描绘出人脸,这听起来似乎匪夷所思。现在一个名为Speech2Face的自主智能学习系统已经将其变为现实。
据麻省理工学院的研究人员称,这个系统实际上就是一个神经网络。他们搜集了来自YouTube等网站上的海量视频,而所有视频内容都是人在讲话。随后他们利用这些资料对这个能够自主智能学习的神经网络加以训练。通过训练,这个系统学习到了声音和面部特征的相关联系,掌握了讲话者的一些基本特征,例如年龄、性别、种族和音色等。
报道称,自主智能学习系统能够利用声音与面部特征的关系,根据少量声音片段大致推测出一个从未见过的讲话者的面容。
值得一提的是,该系统并不能准确还原一个讲话者的面容,而是只能根据学习到的基本特征大致模拟人脸图像。
研究人员指出,这是因为该系统的训练方向就是捕捉与年龄、性别等特征相关的视觉特点,而这些特点属于多位讲话者的共性。在海量资料的基础上,该系统只有在从未见过的讲话者身上找到足够多的共性之后,才能大致模拟出一幅人脸图像。因此这幅图像无法做到精确还原讲话者的面容。
此外,虽然该系统的资料库规模庞大,但毕竟无法涵盖全世界所有人,因此该系统模拟出来的图像仍需要进一步调整和完善。
目前该系统面临的最大挑战就是如何给这个资料库扩容,进而使其描绘的讲话者面容更加接近原型,但这项任务绝非易事,仍需研究人员进一步努力。
声控原理是什么
有些商店,你一走进去,就会有欢迎光临的电子声音。这就是声控。
声控电路由电源部分、谐振放大部分和触发器组成,电源部分用于提供所需直流电压,谐振放大部分用于将声音信号转换成电信号并进行放大,该部分包括一振荡电路,用于排除干扰信号对该灯状态的影响,触发器用于实现状态保持与转换。本发明的声控灯具有控制范围大和抗干扰能力强之优点。
声音是震动产生的,声波在空气中传播,如果遇到固体则会把这种震动传播到固体上。声控元件就是这种对震动敏感的物质,有声音时就接通(电阻变小),没有声音时就断开(电阻变的很大)。再通过电路和芯片做个延时,就可以使有声音时电路接通一段时间。不管是声控灯也好还是什么也好,都是一个原理,只是最后接的负载不同罢了。

2019-2025年艺术摄影服务产业深度调研及未来发展现状趋势预测报告