生成式AI正成重塑百度的产品线。
10月17日,首钢园,在2023百度世界大会上,李彦宏自信满满。
在中美高度内卷的百模大战中,他推出了全新升级的文心大模型4.0和十余款AI原生应用,在智能汽车领域,百度也借助大模型能力发布了多个行业领先的智能驾驶和智能座舱产品。
简单来看,文心大模型4.0具备了对前后乱序、模糊意图和潜台词等复杂提示词的理解力,能根据素材图生成海报、文案和视频,还能撰写小说,解读药品说明书等。
李彦宏直言,文心大模型4.0综合能力“与GPT-4相比毫不逊色”。
在李彦宏发布的多款AI原生应用中,包括搜索、入流、地图、网盘、文库等均在大模型能力赋能下具备了全新的能力。
李彦宏下结论称:AI原生时代已经来临。
而在百度重点布局的智能汽车领域,可以说生成式AI 同样重塑了百度的智舱和智驾产品,百度Apollo的多款产品都颇具看点。
智驾产品中,百度Apollo发布的城市常用路线领航Apollo City Driving,借助车道级地图,仅一趟就能实现秒级建图。
国内首款纯视觉城市领航高阶智驾产品Apollo City Driving Max将于今年4季度量产落地。
而在智舱领域,大模型能力将重构人车交互业态。
同时,百度发布了智舱开发工具链,帮助品牌构建专属模型和应用。
此外,百度即将发布国内首款舱驾融合智能汽车,搭载舱驾一体软芯融合智算平台Apollo Robo-Cabin。入门级产品可实现基本的行泊一体功能和智舱语言功能,后续也将推出高阶智驾版本产品。
具体来看,在智能驾驶领域,除了此前已经发布的高速领航辅助产品,本次世界大会上,百度主要推出了城市专用路线领航Apollo City Driving。
在百度统计的数据中,在城市场景,包括通勤场景、接送家人、固定活动等在内的常用路线占到整体出行需求的85%,为此,Apollo推出通勤模式,可以最高性价比实现无限趋近全域场景的城市辅助智驾。
Apollo City Driving包括高速领航辅助、城区辅助、智能泊车以及可升级的通勤模式。
通勤模式可实现城市自主变道、交通灯识别、无保护左/右转以及十字路口启停等功能。
在整合多项功能后,Apollo City Driving可实现全场景覆盖,实现全域点到点的领航,打通室外车位,任意城快/高速路线和城市常用路线间的连接,大幅扩展使用场景,同时提高行车连续性。
而且,由于通勤模式仅需使用中算力平台就能实现,大大优化了性价比,而BEV能力的上线也将进一步强化其安全性。
Apollo City Driving优秀的软件能力可实现一趟秒级建图,只需驾车开过一趟就能开启通勤模式。
而借助云端共享可将建图路线分享给同车型的家人朋友。而且,建图后,区域内任意车位或任意点均可启动泊车功能。
在泊车能力方面,支持断头路车位、斜列,以及户外记忆泊车等场景,可实现99%泊车场景覆盖。
这套方案使用的是9V5R12S传感器配置,预计将于2024年下半年实现OTA推送升级。
此外,百度智能汽车业务部总经理苏坦也表示,国内首款纯视觉城市领航高阶智驾产品Apollo City Driving Max将于今年4季度量产落地。
纯视觉路线的高阶智驾能力是今年业内颇为热门的概念,但目前有还没有车企实现正式量产落地。
同一天,极越发布了其国内首个“BEV+Transformer”算法实现的纯视觉高阶智驾技术方案,并对外公布了极越与百度联合研发的国内首个占用网络技术。从公布内容来看,极越01搭载的应该就是Apollo City Driving Max。
在极越官方社交账号发布的一段城市领航辅助驾驶路试视频中,极越01一镜到底跑完了上海陆家嘴-外滩-南浦大桥等路段,全程零接管。
BEV+Transformer的纯视觉,配合OCC占用网络技术能够帮助汽车机器人更准确还原3D场景,获取比激光雷达点云分辨率更高的三维结构信息,还能减少漏检、误检并弥补视觉所不具备的空间高度信息,突破能力上线和提升安全保障的同时,替代激光雷达,并大幅提升了泛化能力。
极越01将于10月底正式上市,并同步开启交付。
除了智驾能力,极越01的智能座舱能力也在百度世界大会上同步发布演示。
极越01的语音交互不仅可覆盖车内车外、四路同说、连续对话等复杂场景,还融合语音、手势、视觉识别等多模态交互,可根据用户喜好和习惯带来个性化的体验。
未来,极越01还将搭载车载语音大模型,可实现语音、语义与声纹端到端一体化建模,声纹准确率大于98.5%。同时,百度Paddle Lite深度学习推理框架将多个云端大模型基座极致优化后适配高通8295芯片,可使推理加速2倍,内存降低60%,同时保持模型精度不降。
苏坦认为,在大模型时代,理解、生成、推理、记忆等能力成为核心要素,座舱内人和车的关系也将变为人和虚拟人之间的关系,交互方式将发生巨变。
百度推出的智舱大模型就是大模型由通用到专深的应用,是专为座舱打造的技术底座。
大模型的加持,可增强舱内效果,使其获得更类人的智能,提升舱内交互理解能力60%,并增加多模/主动交互能力,实现拟人回复能力,且推理速度快至1秒。
同时,大模型的加持可大大降低智能座舱落地成本,场景开发投入降低90%,推理调用成本也降低90%。
语音交互是大模型落地智舱的基座,可实现大模型技能和座舱语音体验的无缝融合。
目前Apollo大语言模型在智能座舱领域的产品包括车载语音SDK5.0/5.5,可实现大模型本地化加持的语音交互,车载智慧增强包,即可快速上车的车载大模型原生应用,以及车载对话开发平台,实现车载大模型场景能力开发。
Apollo大语言模型的合作车型包括极越01、凯迪拉克锐歌、别克E5、吉利银河L和吉利银河L6等。前一日,长城也与百度Apollo签定了大模型战略合作备忘录。
此外,百度Apollo还提供智舱开发工具链,可支持主机厂高效构建品牌专属的模型和应用,实现大模型从专深到品牌的进一步细化。工具链将智舱AI原生应用开发范式流程化、工具化,可实现全链路的降本增效。
更值得一提的是百度Apollo将发布国内首个舱驾融合智能汽车。
随着电子电气架构向中央集成式发展,跨域融合,舱驾融合也是近期业内不断被提及的话题。
虽然多家芯片厂商发布了舱驾融合产品的计划,车企与智驾公司也宣称在进行研发,但目前尚未有一家企业公开发布过舱驾融合产品。
Apollo Robo-Cabin即是百度即将推出的舱驾融合产品,采用同一平台智驾基线架构,可实现快速高效量产。
初期计划中的产品将基于高通8295芯片,可实现入门级行泊一体能力和智能座舱能力。
后续,百度Apollo还计划推出可实现高速领航+自主泊车能力以及城市通勤+自主泊车2.0能力的舱驾一体平台产品。
今年Chat GPT 横空出世,引发产业颠覆式变革,人工智能渐行渐近。
而在中国市场,面向智能汽车推出特定应用的大模型,先后有百度的文心一言、科大讯飞的星火大模型以及华为的盘古大模型和商汤科技的日日新SenseNova大模型。
同时在智驾领域,长城投资的毫末智行推出了Drive GPT。
对于大模型对于智能驾驶和智能座舱的影响,业内有不同声音,像数据量达不到百亿规模的属于伪大模型。
尽管对大模型的定义有争议,对于如何借助大模型改造人车交互有不同看法,但大模型将从底层重构人机交互方式却是共识。
百度在智能驾驶领域和智能座舱领域的投入和探索时间最入,并基本与国内各大车企都有过合作,但一直受制于车辆的数据开放而无法深入,最终寻求自己造车,开发Robotaxi,此次文心一言4.0的发布,让百度在AI时代找到了重塑数字基础设施的机会,因而李彦宏借助生成式AI重构了产品线,如同马化腾所说,什么是移动互联网就是在手机上把PC时代的互联网重做一遍。
以大模型为代表的生成式AI正成为移动互联网的下一个形态,从这个视角来看大模型对智能汽车的改造,即可以看出百度Apollo正走在正确的路上,这也是百度与长城汽车和吉利汽车进一步加深合作的基础。
百度依然是这一市场一位可改变格局的玩家。