人工智能技术研究动态分析
一、智能语音识别及控制技术
自动语音识别,简称ASR。这项技术是使人与人,人与机器更顺畅交流的关键技术。随着人们对生活的仪式感的追求,移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统也变得越来越流行。在这些设备和系统上,以往鼠标、键盘这样的交互方式就不再延续像用在电脑上一样的便捷性了。而语音作为人类之间自然的交流方式,在这些设备和系统上就成为了更受欢迎的交互方式了。
如果有一个语音到语音翻译系统其实就可以完美消除这个交流壁垒。这样的话就算语言不通人们也可以自由地进行交流。比如我们现在这里看到的就是一个典型的语音到语音的翻译系统,可以看到,语音识别是这个流水过程中的第一环。
语音技术可以极大地提升人机交流的能力,其中最流行的应用场景就有大家所熟知的语音搜索、个人数码助理、游戏、起居室交互系统和车载信息娱乐系统。对于语音搜索而言,它能使用户直接通过语音来搜索餐馆、行驶路线和商品评价的信息。这极大地简化了用户输入搜索请求的方式。目前,语音搜索类的应用在各类品牌和系统的手机上都已非常流行。
第二个个人数码助理已经作为原型产品出现了十年,siri系统就是从它变得流行起来的。自那以后,很多公司都发布了类似的产品。我们把这种系统简称PDA。PDA系统知晓我们在移动设备上的信息,了解一些常识并记录了用户与系统的交互历史。有了这些信息后,PDA可以更好的服务用户。比如,可以完成拨打电话、回答问题和音乐搜索等工作。而用户所需要做的只是直接向系统发出语音指令即可。在融合语音技术之后,游戏的体验将得到很大的提升。例如,玩家可以和游戏角色对话以询问信息或者发出指令。
最后,起居室交互系统和车载信息娱乐信息在功能上十分相似。这种系统允许用户使用语音与之交互,我们可以通过他们来播放音乐、询问信息或者控制系统。当然,由于这些系统的使用条件不同,设计这样的系统时会遇到不同的挑战。
二、高级人工智能逐步突破
2021年12月15日,Nature发布了《2021年十大科学新闻》;12月17日,Science紧随其后,公布了《2021年度十大科学突破》。Nature和Science都将「人工智能预测蛋白质结构」评为本年度最重要的发现,Science更是将其列为“2021年十大科学突破进展”之首。
长期以来,蛋白质结构的预测一直是生物学领域的研究热点和难点。传统的蛋白质结构探测方法主要有三种:X射线晶体学、核磁共振和冷冻电镜。但这些方法成本较高,研究周期漫长,且进展有限。
人工智能为这一困扰生物学界数十年的难题按下了快进键。
2021年7月,蛋白结构两大AI预测算法——DeepMind的AphaFold2和华盛顿大学等机构研发的RoseTTAFold相继开源。
AphaFold2“解锁”98%人类蛋白质组
2021年7月16日,DeepMind在Nature发表论文,宣布已利用AlphaFold2预测了35万种蛋白质结构,涵盖了98.5%的人类蛋白质组,及其他20种生物几乎完整的蛋白质组。研究团队还公布了AlphaFold2的开源代码和技术细节。
RoseTTAFold可十分钟内计算出蛋白质结构
同日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文,公布了其开源蛋白质预测工具RoseTTAFold的研究结果。研究团队探索了结合相关思想的网络架构,并通过三轨网络获得了最佳性能。三轨网络产生的结构预测精度接近CASP14中的DeepMind团队的Alpha Fold2,且速度更快、所需计算机处理能力更低。仅用一台游戏计算机,在短短十分钟内就能可靠地计算出蛋白质结构。
其他研究进展
2021年8月,中国研究人员使用Alpha Fold2绘制了近200种与DNA结合的蛋白质结构图。11月,德国和美国的研究人员利用Alpha Fold2和冷冻电镜绘制了核孔复合物的结构图。12月22日,深势科技推出了蛋白结构预测工具Uni-Fold,在国内首次复现谷歌Alphafold2全规模训练并开源训练、推理代码。
三、AI神经网络识别技术
人工神经网络(Artificial Neural Network,ANN),通常简称为神经网络,是一种在生物神经网络的启示下建立的数据处理模型。神经网络由大量的人工神经元相互连接进行计算,根据外界的信息改变自身的结构,主要通过调整神经元之间的权值并对输入的数据进行建模,最终具备解决实际问题的能力。通常,人类自身就是一个极好的模式识别系统。人类大脑包含的神经元数量达到1011数量级,其处理速度比当今最快的计算机还要快许多倍。如此庞大、复杂、非线性的计算系统时刻指挥着全身的获得。当视野中出现张熟悉的人脸时,只需数百毫秒的时间即可正确识别。尽管许多昆虫的神经系统并不发达,但仍表现出极强的识别能力。蝙蝠依靠其声纳系统搜集目标的位置、速度、目标大小等信息,最终实现声纳的回声定位以极高的成功率捕捉目标。
一般认为,生物神经并不是一开始就具备这样的识别能力的,而是在其成长过程中通过学习逐步获得的。人类出生后的几年间,大脑接收了大量的环境信息,随着经验的积累,神经元之间的相互关系不断变化,从而完成智能、思 维、情绪等精神活动。
在人类刚刚出生时,其神经元存储的信息相当于一张白纸。在环境中各种输入信号的刺激下,神经元之间的连接关系逐渐发生了改变,最终对信号做出正确的反应。人工神经网络模型就是模仿生物神经网络建立起来的,但它是对生物神经网络的抽象,并没有也不可能完全反映大脑的功能和特点。事实上神经网络不可能也没有必要达到大脑的复杂度,因为生物大脑的训练过程是生物的整个生命周期,即使建立了与之复杂度相当的网络模型,训练所花费的成本也会令其输出的一切结果失去应有的价值。
在人工神经网络中,最重要的概念莫过于神经元节点与权值。节点对应有向图中的节点,权值表示节点间相互连接的强度,人的神经网络的可塑性表现在,其连接权值都是可调整的,它将一系列仅具有简单处理能力的节点通过权值相连,当权值调整至恰当值时,就能输出正确的结果。网络将知识存储在调整后的各权值中,这一点是神经网络的精髓。
四、人工智能带来媒体变革
智能媒体,顾名思义是将人工智能等技术手段与媒体相融合之后形成的一种媒体形态,与传统媒体形态的本质区别是拥有了信息技术的强力加持。在媒体生产与消费的各个环节,都可从近年来飞速发展的互联网技术中获得支持,让媒体生产环节成本更低,效率更高,让用户对媒体信息的消费更有针对性,信息获取效率大增。
20年前人们的信息获取方式主要以纸媒和广播电视媒体为主,20年后的今天,人们更多会在线获取信息。同样的道理,人工智能是比互联网更大的一个技术现象,目前正处于起步阶段,在此技术趋势的影响下,20年后人们的信息消费方式是否会有颠覆性巨变?答案是肯定的。
促成智能媒体成为一个大产业的宏观条件正在逐渐凝聚,为此报告的撰写方做了非常详尽的调查。国家对于人工智能和5G网络等新基建项目进行了大量的投入,甚至还对智能媒体的发展给出了指导意见。摆在媒体从业者面前的,是一个正在形成的巨大机遇,任何对此机遇的忽视,都会导致深不可测的风险。因为技术发展的速度之快,是不会给后知后觉者任何机会的。
由于近年来兴起了一批个性化移动阅读平台,往往声称以人工智能为基础,对媒体内容进行个性化分发,所以很多人觉得智能媒体早已行之有年了。事实上,媒体内容的个性化分发,或许连人工智能在媒体内容上所能发挥作用的皮毛都算不上。那只不过是一种复杂一点的以兴趣标签为基础的匹配,谈不上精准,只是放大了信息的量级以给用户更多选择而已,谈不上真正符合用户需求。智能媒体在国内的发展,仍处于起步阶段而已。
人工智能是一种比标签匹配甚至比软件复杂很多倍的算法,而5G则解决了数据传输的瓶颈和时延,两者结合起来之后很多东西就要有所改变了,而其中有些改变是颠覆性的,足以将人们的生活方式同时改变。举个简单例子,当计算机能将语音、图像、自然语言等这些东西都数字化了之后,未来媒体信息消费者是否还需要从原本特定的媒介获取信息,就成了一个很大的悬念。媒体信息的消费多以手眼口耳等人体器官的协调作用而完成的,有了脑机接口之后是否还需要如此,也就成了一个问题。特定媒体信息平台如果不随技术趋势做出改变,有可能突然有一天就发现自己成了多余的存在。
《2022-2027年中国人工智能芯片行业发展分析及投资风险预测报告》由中研普华人工智能芯片行业分析专家领衔撰写,主要分析了人工智能芯片行业的市场规模、发展现状与投资前景,同时对人工智能芯片行业的未来发展做出科学的趋势预测和专业的人工智能芯片行业数据分析,帮助客户评估人工智能芯片行业投资价值。

关注公众号
免费获取更多报告节选
免费咨询行业专家