寒武纪”是距今约5.3亿年的地质时代,深远的海洋中诞生了一大批生物,地球物种空前繁荣昌盛,这也是显生宙的开始。
古生物学众说纷纭,有地球变暖说、氧气水平升高说等等。但无论哪种观点都认为,在寒武纪,地球的生态变化跨过了奇点,进而改变了一切。
自ChatGPT问世以来,从GPT-1到GPT-3.5,GPT模型的智能化程度不断提升,GPT-4多模态模型的发布进一步加速产业革命。ChatGPT对智能终端的赋能,同样将开启新一轮“寒武纪大爆发”时代。
AIGC内容快速发展下,未来智能终端(平板、手机、音响、电视、IOT等)的人机交互都有望重构。当下,各大厂商争先发布大模型,如ChatGPT、百度文心一言、三六零大模型、华为盘古大模型、阿里大模型等,国内外大模型加速应用落地,多模态大模型赋能下通用与垂直应用场景的应用端革新渐渐开启。
AI大模型的进展带来边缘域AI三大产业链环节的变革。边缘域AI产业链包括智能硬件、模组、芯片三大环节。AI大模型的迭代推动了边缘域AI的应用发展,将对应用于AI领域的模组以及算力芯片提出更高的要求,同时带动应用端智能硬件的革新。
ChatGPT引领大模型浪潮,AI“iPhone“时刻已至
ChatGPT为AI的“iPhone“时刻。3月21日,英伟达CEO黄仁勋在GTC2023大会上将ChatGPT比作AI的“iPhone“时刻,AI时代加速来临。
自ChatGPT问世以来,从GPT-1到GPT-3.5,GPT模型的智能化程度不断提升,ChatGPT在拥有3000亿单词的语料基础上预训练出拥有1750亿个参数的模型(GPT-2仅有15亿参数),预训练数据量从5GB增加到45TB,模型从预训练+微调转变为人工标注数据+强化学习,人工智能取得技术突破。而随后GPT-3.5turbo带来10倍成本的降低及GPT-4多模态模型的发布,进一步加速生产力的全新跃迁。
多模态模型成重要趋势,AI应用空间有望进一步拓展。多模态模型结合来自不同模态(例如文本、图像、语音等)的数据进行联合建模,应用于自然语言处理、计算机视觉、语音识别等领域,有效提高模型的准确度和稳定性。
从OpenAI产品矩阵可以看出其已经布局文本、图片、语音等多模态产品,未来将逐步探索多模态的融合,实现图像、视频、文本间跨模态生成,显著提升智能终端产品体验,带来各行各业生产力水平的质变。
国际科技巨头加紧布局多模态模型领域。微软和谷歌两大巨头相继推出大模型,2023年3月,OpenAI推出GPT-4模型,可以接受图像和文本输入,并输出文本。3月谷歌推出PaLM-E模型,通过输入多模态语句,包括视觉、连续状态估计和文本输入编码,来执行机器人操作规划、视觉问题解答等具体操作;5月谷歌推出PaLM2模型,支持100多种人类语言与20多种编程语言,同时支持读取与生成音视频内容。
AI领域群体效应下,国内大厂纷纷入局。国内AI大厂以百度文心一言发布为拐点,未来有望凭借更优质的中文数据和多场景的应用实现弯道超车。百度文心一言是国内首个全栈大模型产品,模型发布后申请合作厂商超9万家,腾讯、阿里、华为、商汤等大厂在AI大模型领域已有成熟布局,相关应用有望快速发布。伴随着多模态大模型的不断涌现,更多场景的AI应用将加速落地。
APIPlugin引入,海量应用迈入AI新时代
Plugin开启AI的“APPStore“时代,生态版图进一步扩展。2023年3月2日,OpenAl推出了自然语言对话模型GPT-3.5-Turbo和语音转文本模型Whispermodels的开发者API,使得多种应用程序可通过API的方式接入ChatGPT。3月24日,ChatGPTplugins的发布,进一步扩大了ChatGPT的应用能力并催化至多场景的业务处理能力,AI的“APPStore“时代到来。
插件商城接入10余家应用,具备检索实时信息、检索知识库信息和代替用户操作应用功能。OpenAI官网显示,目前Plugin已接入Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram以及Zapier等应用,涉及旅行、购物、航班、推荐餐厅、语言导师等各个方面。未来,随着各类应用与ChatGPT的结合,GPT生态系统有望迎来“苹果+AppStore”的繁荣时刻。
除大模型外,龙头厂商也纷纷布局轻量级模型,当前Meta、谷歌、高通等公司已开始发力边缘AI。谷歌和Meta分别于今年5月11日和7月19日发布了各自最新的大语言模型版本PaLM2和Llama2,较以往版本实现测试数据、性能等全面优化,轻量化版本均能应用于边缘端,其中最新发布的Meta大模型Llama2更是开放开源免费使用,有望推动边缘AI迎来“安卓时刻”。此前,芯片龙头厂商高通也首次成功实现StableDiffusion模型在手机端应用生成AI图像,并于5月30日宣布高通正在转型为边缘计算公司,全面下注边缘AI。
继今年2月发布Llama1大模型后,MetaAI在7月19日凌晨发布了最新一代的开源大模型Llama2。该模型在测试中表现优异,Meta计划将该模型开放开源免费使用,且支持高通芯片运行,有望助力边缘AI加速落地。
Llama2模型的训练数据量、参数均有增加。Llama2的参数、训练数据和上下文长度相比上一代模型增加。新模型Llama2系列包含70亿、130亿和700亿三种参数类型,相比原来Llama1最多650亿参数有所增加。并且,相比于Llama1预训练模型1.4万亿的训练token数,Llama2预训练模型的训练数据提升了40%至2万亿,且针对聊天用例进行的Chat模型精调训练数据超过100万人类标记数据,使用人类反馈进行强化学习(RLHF)从而提高模型安全性。此外,对于大模型非常重要的上下文长度限制,Llama2比Llama1翻了一倍至4096字符,能处理更多信息。Llama2模型在大多数基准测试中表现优于其他开源模型,包括编码、推理、知识、精通性测试等。不仅如此,Meta从有用性和安全性进行评估,认为Llama2有希望成为闭源模型的替代品。
在Meta之前,谷歌率先于5月11日发布通用大语言模型PaLM2,并且包含轻量化版本,可运行于移动终端。PaLM2性能全面优于前代模型,部分领域能与GPT-4竞争。多语言能力方面,作为驱动AI机器人Bard的模型的升级版,PaLM2可使用Fortran等20多种编程语言,100多种口头语言进行数学、软件开发、语言翻译推理和自然语言生成,多语言能力全面超过前代PaLM模型,同时部分语言能力基准测试结果超过GPT-4。编程能力方面,PaLM2改进了编程能力,谷歌通过调整预训练数据集构建了PaLM2-S*模型。该模型擅长Python、Javascript等流行编程语言,也可以生成Prolog、Fortran等语言的专用代码。
目前边缘计算市场上参与者众多,不同阵营厂商正以不同的路线共同推动边缘计算快速发展。以英特尔、AMD等为代表的芯片厂商积极推出CPU、GPU、FPGA、DPU、IPU等边缘算力芯片;亚马逊、微软等云服务厂商将云计算能力向设备和用户侧延伸,扩充云数据中心的外延,将云原生的统一编程模式通过边缘网关的能力应用到设备构成的边缘云,主打云边协同一体化;以移动、电信、联通为代表的5G运营商将IT能力同基础网络承载与业务运营融合,提供基站的边缘计算服务及5G网络接入管理。
严格意义上的边缘AI市场,包括边缘终端市场和边缘服务器市场两类。边缘终端市场是指直接在终端设备上做计算的AI芯片,对于功耗和能效要求比较高,包括针对特定应用的SOC芯片和通用加速器独立芯片两种形态。另一种针对边缘服务器市场,通常以处理器加上通用型深度学习加速芯片为主流方案,传统巨头英伟达、华为等在此市场有较深布局。而本文则将重点讨论边缘终端市场的芯片架构,边缘服务器市场暂不涉及。
边缘AI芯片也可以分为“计算+连接”。其中:
1)计算芯片则处于边缘AI的核心,用于接受感知外界环境,同时对视频语音信息加以处理运算,实现边缘AI功能,赋能硬件终端。
2)连接芯片位于诸多终端,更多是通过网络协议接收指令,执行功能;
然而伴随产业发展,计算+连接芯片有二者融合的趋势。蓝牙、WiFi等连接芯片,开始提升制程,提高运算能力,增加NPU模块,实现智能连接;而计算芯片也开始注重通信协议研发,部分集成通信功能。

关注公众号
免费获取更多报告节选
免费咨询行业专家