首页 > 每日活动 > 每日活动 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

每日活动更多>>

中大型智能旗舰MPV!比亚迪夏上市发布会·广州站盛大启幕 解锁年轻人的“既要又要”,埃安RT这波操作绝了! 问界M8实车上路,只比问界M9小一点,标配双电机+激光雷达 2025“有意思”的发布会,MG ES5上市置换价9.99万起,三电给力 2025年要上市的5款6座增程SUV 合资车企年度销量揭秘:一汽-大众独领风骚,谁拖了后腿? 有望5月正式上市 东风日产N7发布六种配色 地平线SuperDrive推出三大智驾黑科技,开启智能驾驶新纪元 2025年国泰集团控股子公司招聘公告 2025年九江市庐山市环山文化旅游发展集团有限公司招聘工作人员公告 2025年鹰潭市社会保障卡中心招聘聘用人员公告 2025年宁德市闽东医院医学检验科劳务派遣人员招聘启事 2025年福建日报社(福建日报报业集团)招聘高层次人才方案 2025年温州市白鹿人才科技发展有限公司招聘青鹿空间项目部工作人员公告 2025年金华市永康市自然资源和规划局工作人员招聘简章 2025年宁波市慈溪市机关事务管理局直属机关幼儿园招聘派遣制工作人员公告 何以城市、何以广州:作为“城市经验”的广州史研究 陕西年度六大考古新发现揭晓,秦都邑“汧渭之会”遗址等入选 一个苗族女人,“语音转文字”出了一本书 在京剧艺术中体会粉墨中国 OpenAI重组机器人部门,将打造实体AGI智能 零跑C10增程版在欧洲上市,欧洲13国建400多销售网点 又一国产车倒了!广汽接盘支付员工工资 埃安承接售后服务 比亚迪唐L旗舰SUV即将发布,搭载先进动力技术及智能驾驶系统 CBA第九周周最佳球员:邹阳携手洛夫顿当选 西卡18+9加兰米切尔合砍39分 步行者胜骑士豪取6连胜 塞克斯顿21+5本西14+9 马尔卡宁缺阵爵士加时胜篮网 东契奇无缘赛季末奖项评选 连续5年一阵纪录中断 音乐剧《大河长歌》北京成功上演 刷屏朋友圈 话剧《雷雨》 回归曹禺精神 重构现代经典