欲了解更多中国汽车零部件行业的未来发展前景,可以点击查看中研普华产业院研究报告《2023-2027年中国汽车零部件行业市场深度全景调研及投资前景分析报告》。
海量训练数据是 AI 大模型的应用前提。自动驾驶龙头企业的实际里程数据积累占据大模型应用先 机。2020 年 4 月,特斯拉 Autopilot 智能驾驶系统里程数就已超过 48 亿公里;百度 Apollo 自动驾 驶也已积累超 5000 万公里测试里程;2023 年 4 月,毫末智行发布的 DriveGRT 认知模型使用了 超过 4000 万公里真实里程进行训练;小鹏汽车的智能辅助驾驶行驶里程截至 2022 年 8 月超过 1.74 亿公里,高速智能导航辅助驾驶(NGP)累计行驶里程超过 2450 万公里。 AI 大模型应用为时尚短,自动驾驶领域模型架构仍在探索中。目前 AI 大模型主要应用于自然语 言处理(NLP)和计算机视觉(CV)领域,以 Transformer 架构为主。Transformer 架构较卷积 神经网络(CNN)在大规模数据的学习中表现更好,也有少量 CNN 架构的大模型处于科研进程中。 目前,ChatGPT、DriveGPT 等大模型均采用 Transformer 架构+监督学习(SL)预训练+人类反 馈强化学习 (RLHF)的模式。
自动驾驶 AI 大模型的算力建设主要可分为以下 3 种模式: 自建智算中心,独立训练大模型。特斯拉等自动驾驶厂商已自建云端计算中心,用于自动驾驶模 型训练和数据标注。 部分环节合作。百度、腾讯、火山引擎(字节子公司)等互联网科技公司均推出 toB 全流程智能 汽车云服务,为主机厂提供数据中心用于模型训练。 解决方案合作。百度文心、商汤日日新等大模型体系均开放了与车企的行业应用合作渠道,针对 汽车行业应用场景进行模型调优。如吉利汽车与百度文心合作吉利-百度文心 NLP 大模型,2023 年 5 月 31 日,首款搭载车型吉利银河 L7 已经上市。
AI 大模型训练过程算力要求高,智算中心成为关键。自动驾驶领域 AI 大模型训练数据规模在亿 公里级多模态传感数据,参数可高达几百到几千亿,预训练阶段算力要求非常高。特斯拉、吉利、 小鹏、毫末智行等主要自动驾驶厂商采用不同模式建设云端计算中心用于模型训练。
科技巨头可为自动驾驶主机厂提供算力支持和 AI 大模型开发服务。百度、华为、腾讯、阿里等科 技巨头,具有较强的 AI 模型开发能力和充足的 AI 算力,可作为云计算服务商和云开发平台为主 机厂的 AI 大模型开发提供服务。相较主机厂投建智算中心和独立 AI 模型开发平台的方式,其成 本和技术难度大幅降低,也为小型新创主机厂和传统汽车厂提供了快速入局自动驾驶领域和追赶 头部自动驾驶厂商的机会。据 IDC 数据,2022 年百度 Apollo 自动驾驶云平台和华为分别占据 34.4%、29.7%的中国自动驾驶开放平台市场规模,行业集中度较高;2022 年中国自动驾驶平台 市场规模达到 5.89 亿元,增速达 106%,预计 AI 大模型应用推广带来算力需求进一步增长,IDC 预计 2023 年将达 7.9 亿元。
合作并装载互联网企业已开发的 BEV 感知模型,可成为新入局主机厂的较优选择。AI 感知决策 大模型均需海量数据驱动,已宣布实现 BEV 感知模型落地的国内厂商包括百度 Apollo、小鹏汽车、 华为、毫末智行、商汤等,均为已实现高速辅助驾驶量产并积累大量智能驾驶数据的主流自动驾 驶主机厂或互联网企业。考虑到数据收集、标注和模型训练的复杂性,与百度、华为、商汤等互 联网企业合作,搭载其已开发的 BEV 感知模型可大大降低主机厂入局自动驾驶的成本。
NLP 大模型实现人车的更友好交互,推动座舱智能化进程;CV 大模型助力数据标注、仿真和感 知等;多模态 AI 大模型为城市场景辅助驾驶乃至高等级自动驾驶的规模量产拉开帷幕,同时也有 望用于智能座舱中的人机交互,融合语音、视觉、手势等多种交互方式,满足用户在不同场景下 的不同使用习惯。
NLP 大模型的应用可实现语言交互、拟人表达和决策建议。NLP 大模型可突破性解决传统人车交 互场景中对话风格固化、智能性差的问题,根据高工智能汽车研究院数据,2022 年中国智能座舱 前装搭载率为 39.89%,其中搭载了语音交互功能的智能座舱占比已达到 76.76%。NLP 大模型的 落地和普及,预期将带来智能座舱的技术革新。 NLP 大模型提升操作系统交互性和功能丰富度。逻辑推理、策略规划和知识问答等功能使车载操 作系统功能全面升级;可实现自然对话式交互,使语音交互成为车载系统主要操作模式之一,带 动操作系统架构的重新优化调整。 2023年3月,百度发布文心NLP大模型,其智能语音交互功能已搭载到Apollo智能座舱系统上; 2023 年 5 月,科大讯飞发布讯飞星火认知大模型,宣布“大模型+智能座舱”为其四大行业应用 之一;商汤也提出了基于大模型体系的绝影智能车舱产品。
数据标注方面,大模型预标注+车载小模型学习微调的方式具有应用潜力。数据标注从人工标注 转为 AI 主导人工辅助,一方面大模型知识完备性好,精度高,泛化能力强;另一方面,自动驾驶 数据积累和标注复杂度提高使数据标注工作量快速增加,AI 大模型的应用有助于加速数据标注并 大幅降低数据生产成本。特斯拉从 2018 年以来不断发展自动标注技术,从 2D 人工标注转为 4D 空间自动标注,特斯拉人工标注团队规模不断缩小,2021 年超过 1000 人,2022 年裁员超过 200 人。小鹏汽车和毫末智行也相继采用自动标注工具,毫末智行表示,获取车道线、交通参与者和 红绿灯信息,人工标注成本约每张图 5 元,而毫末 DriveGPT 的成本仅 0.5 元。
场景构建是能力仿真系统的核心之一,生成式 AI 较传统建模渲染生成场景库速度大大提升。仿真 通过构建虚拟交通场景测试和验证自动驾驶系统,可在一定程度上取代实车路测,从而降低自动 驾驶系统开发测试成本。基于有限的路采数据智能化生成大量场景是仿真的关键,数据驱动的 AI 视觉仿真对自动驾驶系统开发落地具有重要价值。
人工智能生成内容(AIGC)技术在仿真、数据标注、座舱交互等系统的部署日益广泛。在仿真 方面,AIGC 技术可大量合成虚拟场景以用于模型训练和测试,从而提高自动驾驶技术精度和可 靠性;在数据标注方面,AIGC 技术可自动标注真实世界图像数据以用于训练 AI 模型;在座舱交 互方面,AIGC 技术可让车机系统与人的交互更自然,提高驾乘体验。 基于 BEV+Transformer 架构的感知算法应用带来传感器架构改变,大模型的本地化部署对车载 算力硬件提出要求。一方面,基于 AI 大模型的感知算法,使激光雷达传感器的重要性下降,在主 流的多雷达+多摄像头的传感器架构之外,提出了纯视觉传感方案,基于多个摄像头即可基本满 足复杂场景环境感知的需求。另一方面,大模型的本地化部署对边缘算力、数据传输带宽和速度 都提出了新的要求,车载芯片需进行相应升级。

关注公众号
免费获取更多报告节选
免费咨询行业专家