Cointime

扫码下载App
iOS & Android

ChatGPT:驶进人工智能与汽车行业的新篇章

6 月 16 日,梅赛德斯 - 奔驰官方宣布将车载语音助手接入 ChatGPT。即日起,超 90 万美国客户可通过 Mercedes me 手机应用或语音“Hey,Mercedes”参与 MBUX 智能人机交互系统测试计划。

汽车是大模型最大的交互应用场景,这是 ChatGPT 第一次应用在汽车环境中。这一测试的结果将被用于进一步完善语音助手,为更多市场的大型语言模型提供参考,因为 ChatGPT 的接入,智能汽车操作系统也将被重塑。

除了奔驰,众多企业也在关注和探索大模型在汽车上的应用,包括特斯拉、英伟达、百度、阿里等。人工智能和汽车的结合是国内外的迫切发展方向,没有公司会愿意在人工智能引领的又一次革新中掉队。

而在人人都谈论 AI 的今天,我们也想简单聊聊人工智能将会对汽车行业带来怎样的改变。

METAVERSE

更懂你的智能座舱

大模型的出现给人工智能的发展带来了新的机遇和挑战,也为汽车行业提供了新的可能性,主要的应用场景包括智能座舱和智能驾驶。

汽车智能座舱是指集成了多种智能化功能和服务的汽车内部空间,它可以通过多模态的人车交互方式,为驾乘者提供安全、舒适、便捷、娱乐的出行体验。

人工智能大模型在汽车智能座舱上的应用,首先体现在语音交互方面。

语音交互是智能座舱中最重要的功能之一,它可以让驾乘者通过自然语言与汽车进行沟通和控制,提高出行的便捷性和安全性。

根据汽车智能化研究机构汽势科技的数据,2023 年上海车展上,搭载语音交互功能的车型占比达到了 95%,其中奔驰的语音交互搭载率排名第一。

而奔驰之所以能在语音交互方面领先,与其采用了 ChatGPT 技术有关。奔驰将 ChatGPT 整合到其 MBUX 智能人机交互系统中,为车主提供了全新的语音助手体验。该系统将支持更动态的对话,它不仅可以准确理解车主的语音命令,还可以与车主进行交互式对话。

其次便是图像分析方面。图像大模型可以为汽车智能座舱提供面部识别、情绪分析、AR 相机等服务,让驾乘者可以通过图像与汽车进行交互和娱乐。例如,商汤科技发布的图片生成模型“秒画 SenseMirage”,就可以根据驾乘者的输入或选择,生成各种风格和主题的图片。

除了语音交互和图像分析之外,3D 内容大模型也可以为汽车智能座舱赋能,它可以为其提供 3D 导航等服务。

总之,人工智能大模型在汽车智能座舱上的应用,可以让汽车具有更强的感知、理解、生成、交互等能力,从而为驾乘者提供更加智能化、个性化、场景化的出行体验。

这是一场正在发生的交互革命,而这场革命还离不开未来交通行业的另一个重要发展方向——自动驾驶。

METAVERSE

自动驾驶再提速

自动驾驶技术是未来交通行业的重要发展方向,而 AI 是实现自动驾驶技术的关键技术之一。自动驾驶是指通过计算机系统的感知、决策和执行,实现车辆在不同程度上替代人类驾驶者的技术。

根据国际汽车工程师协会(SAE)的标准,自动驾驶可以分为六个级别,从 L0 到 L5,分别代表不同的自动化程度和人机交互方式,L0-L2 属于驾驶辅助,L4-L5 才算自动驾驶。

而我们目前最高到 L3 级,即借助人工智能,车辆可以处理所有驾驶任务,但在紧急情况或者其他类似系统故障的情况下,仍需要驾驶员在场。

◉ 自动驾驶 L0-L5

L0 级,人工驾驶;

L1 级,辅助驾驶,是指车辆可以提供部分辅助功能,但仍然需要驾驶员时刻监控周围环境,并随时准备接管车辆;

L2 级,部分自动驾驶,是指车辆可以提供多项辅助功能,例如同时具备 AIGC 和 LKA 的高级驾驶辅助系统(ADAS);

L3 级,有条件自动驾驶,车辆可以在特定的场景和条件下完成所有的驾驶操作和周围环境监控,但需要在系统要求时由人类提供适当的应答;

L4 级,高度自动驾驶,是指车辆可以在特定的场景和条件下(例如无人物流、无人微公交、自主泊车等)完成所有的驾驶操作和周围环境监控,并且不需要人类提供任何应答。此时,车内无需配备安全驾驶员,但仍然限定道路和环境条件;

L5 级,完全自动驾驶,此时的车内无需配备安全驾驶员,也不限定道路和环境条件。

◉ 技术原理

自动驾驶采用计算机自主学习、高精度地图、定位、网络通信和激光雷达等信息技术,在车辆自动行驶过程中,利用环境感知、自动决策和控制等技术,对道路行驶条件、行驶过程中可能遇到的障碍及危险进行有效的控制和避免,并对各种复杂环境和突发状况采取行之有效的措施。它的基本原理包括了感知、决策、控制三方面。

感知是自动驾驶的基础,是实现决策和控制的前提。感知是通过毫米波雷达、激光雷达、摄像头,对车辆周围环境进行精准识别,自主避让前方障碍物,进行自动转向。

决策是指车辆根据感知到的信息,通过智能算法和模型,进行规划和判断,确定合适的工作模式和控制策略,代替人类做出驾驶决策。决策主要依赖于芯片和软件,是自动驾驶的核心,包括路径规划、行为规划、轨迹规划、交互规划等。

控制是自动驾驶的实现,是感知和决策的结果。它是指车辆根据决策输出的指令,通过线控系统或机械系统,对车辆进行相应的操作执行,如转向、加速、减速、制动等。

控制主要包括两个方面:纵向控制和横向控制。前一个控制车辆在行进方向上的速度和加速度,主要涉及油门和制动系统;后一个控制车辆在垂直于行进方向上的位置和角度,主要涉及转向系统。

◉ 应用层面

人工智能的发展显著提高了自主驾驶系统的能力。通过机器学习算法、计算机视觉和传感器融合技术的结合,系统能够理解周围环境并对其做出反应,变得更加可靠、高效和安全。

想要利用人工智能实现彻底改变驾驶方式,主要是看自动驾驶领域的应用层面,包括环境感知、决策规划、学习适应三个重要部分。

自动驾驶车辆结合了摄像头、激光雷达、雷达和其他传感器来收集周围环境的数据。接着,人工智能算法将对这些数据进行处理,以创建详细的环境地图,并识别物体,如行人、其他车辆、红绿灯和路标,决定车辆该如何响应。而类似 GDDR6 的高速存储器可以支持快速存储和访问数据,实现密集型计算。

而自动驾驶汽车使用人工智能根据从传感器收集的数据能做出实时决策。例如,如果自动驾驶汽车检测到行人横穿马路,它将使用人工智能来确定最佳行动方案,进行减速或停车。

同时,预测建模与监督学习算法能实现预测其他道路使用者的行为,例如行人在特定位置横穿马路和其他车辆变道的可能。这有助于汽车预测潜在的交通问题,并采取适当的行动来避免。

而无监督学习算法可用于识别自动驾驶汽车传感器收集的数据中的异常或意外事件,例如在意外位置横穿道路的行人或突然变道的车辆。

自动驾驶系统还可以利用机器学习和深度学习技术不断优化自身性能。通过不断收集和分析驾驶数据,系统可以学习和适应不同的驾驶场景,改进自己的决策能力和反应速度。

此外,强化学习技术也在自动驾驶领域发挥着重要的作用。通过强化学习,车辆可以在实际驾驶环境中不断试错和学习,优化其驾驶策略和决策能力。

METAVERSE

未来驶向何方?

汽车在当代社会是人类出行必不可少的交通工具与社会发展的经济引擎。随着人工智能技术的不断进步,自动驾驶技术将逐渐商业化并进一步普及。

也有一种观点认为,汽车也有望成为智能移动终端的一部分。人工智能和互联网的发展为汽车提供了与其他智能移动终端进行交互的能力。我们的智能生活也会因为汽车的移动私人空间属性,而变得更具有扩展性与独特性。

作为全球市值最高的车企,特斯拉大力推行自动驾驶,势必要将 autonomy 进行到底。国内百度 CEO 李彦宏也表示,随时都在发生的正常车祸不是新闻,而自动驾驶的车祸就成了新闻,究其根本原因是无人驾驶还未普及。

当然,智能驾驶产业链的确还需要完善政策、成本、技术、保险等各方面因素存在的问题。但自动驾驶技术的前景一片光明,我们的出行生活也期待变得更加智能与安全。

【声明】:本文为元宇宙之心运营团队原创,未经允许严禁转载,如需转载请联系我们,文章版权和最终解释权归元宇宙之心所有。

评论

所有评论

推荐阅读

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)

  • GameFi板块市值暂报45.15亿美元,FLOKI排名第一

    3 月 21 日,据 Coingecko 数据,GameFi 板块市值暂报 45.15 亿美元,FLOKI 以 2.86 亿美元市值排名第一,排在第二第三位的分别为:The Sandbox(2.18 亿美元)、Undeads Games(2.11 亿美元)。此前 Solana 基金会主席 Lily Liu 表示,区块链游戏「不会再回归」。她认为,尽管行业曾寄望通过链上资产与开放世界推动 Web3 与元宇宙发展,但实际表现远未达预期。市场观点称链游长期依赖「Play-to-Earn」等代币激励模式,却缺乏真正吸引核心玩家的游戏性与内容构建能力,导致用户留存与生态可持续性不足。包括 Andreessen Horowitz(a16z)、Framework Ventures、Animoca Brands 在内的机构曾向该领域投入数十亿美元,但回报表现不佳。

  • Karpathy:大多数App不该存在,3个提示词让AI接管整个智能家居

    据 1M AI News 监测,Andrej Karpathy 在 No Priors 播客中称,应用商店里的大多数智能家居 App「根本不该存在,一切都该是 API 端点,Agent 才是智能粘合层」。他分享了今年 1 月构建的家庭 Agent「Dobby the elf claw」:只用三个提示词,Agent 自行扫描局域网发现了 Sonos 音响,逆向工程其协议后接管播放控制。如今 Dobby 通过 WhatsApp 对话统一控制灯光、空调、窗帘、泳池、安防系统,取代了此前六个独立 App。他还接入了视觉模型监控安防摄像头,有人到访时自动推送图片消息到 WhatsApp。「这在一两年内应该是免费的,不涉及任何 vibe coding,这是基本功,」Karpathy 说,「客户不再是人类了,而是代替人类行事的 Agent。这场重构的规模将相当可观。」

  • OpenAI创始成员:12月以来没写过一行代码,Agent用不好?「那是你菜」

    据 1M AI News 监测,「vibe coding」概念提出者、OpenAI 创始成员 Andrej Karpathy 在 No Priors 播客中透露,去年 12 月是他工作方式的分水岭。此前他自己写代码与委托 Agent 的比例约为 80:20,12 月之后反转为 20:80,「到现在可能已经不止了」,「我大概从 12 月起就没打过一行代码」。他将这种状态称为「AI 精神病」(AI psychosis):Agent 的能力边界尚未被充分探索,「一切皆有可能,而一切失败归根结底都是技能问题(skill issue)」。他开始像 PhD 时期看 GPU 利用率一样关注 Token 吞吐量,「订阅额度没用完就意味着你没有最大化产出」。他还描述了 Agent 的「锯齿感」:「我同时感觉在和一个极其聪明的、做了一辈子系统编程的博士生对话,又在和一个十岁小孩对话。」

  • 日媒:伊朗准备允许日本船只通过霍尔木兹海峡

    3 月 21 日,据日本共同社报道,伊朗外长阿巴斯·阿拉格奇表示,经两国官员协商,伊朗已准备好允许与日本相关的船舶通过霍尔木兹海峡。日本石油进口严重依赖中东地区。伊朗战争促使日本本月动用石油储备。日本一直面临特朗普要求其协助保卫该海峡的压力。本周早些时候,日本首相高市早苗在华盛顿与特朗普当面会晤时,向其说明了日本参与此类行动在法律上的限制。同时,她也强调了双方共识领域,包括承诺增加从美国进口石油以及就导弹研发开展合作。(金十)

  • Solana基金会主席:链游已「死亡」,行业数十亿美元投入或成最差赌注之一

    3 月 21 日,Solana 基金会主席 Lily Liu 表示,区块链游戏「不会再回归」。她认为,尽管行业曾寄望通过链上资产与开放世界推动 Web3 与元宇宙发展,但实际表现远未达预期。Solana 曾被视为最有潜力支撑大规模链游的公链之一,凭借高性能和低成本支持实时交互。然而,包括 Star Atlas、Stepn 等项目虽一度获得关注,但整体 GameFi 赛道自 2021 年高峰后持续下滑。市场观点指出,链游长期依赖「Play-to-Earn」等代币激励模式,却缺乏真正吸引核心玩家的游戏性与内容构建能力,导致用户留存与生态可持续性不足。包括 Andreessen Horowitz(a16z)、Framework Ventures、Animoca Brands 在内的机构曾向该领域投入数十亿美元,但回报表现不佳。不过,部分公司仍在探索转型路径,例如 Mythical Games 与 Gunzilla Games,逐步弱化区块链要素,将其作为可选功能而非核心机制,以提升用户体验与市场接受度。

  • 现货黄金失守4500美元关口,现货白银日内跌近7%

    3 月 21 日,据 Bitget 行情数据,现货黄金失守 4500 美元/盎司关口,日内跌超 3%;现货白银日内跌近 7%,现报 67.845 美元/盎司。消息面上,受美元走强影响,以及有报导称美国已为在伊部署地面部队做好详细准备,加剧了市场对油价上涨、通胀以及随之而来的利率上升的担忧。独立贵金属交易员 Tai Wong 表示:「随着市场的担忧在周末前走高,金银价格正被拖累走低。在经历了本周因加息担忧引发的剧烈回调后,贵金属走势尤为震荡。价格应会很快进行盘整,但过程将充满波折。」全球主要券商认为,欧洲央行和英国央行加息的可能性正在增加,最早可能在 4 月。美联储周三维持利率不变,并预测通胀将走高,而主席鲍威尔表示,由于战争的影响,未来的政策路径面临异常高的不确定性。

  • 智谱预告GLM-5.1将开源

    据 1M AI News 监测,智谱 Z.ai 全球负责人李子玄在 X 上发文:「Don't panic. GLM-5.1 will be open source.」(别慌,GLM-5.1 将会开源。)未透露发布时间及模型细节。