Cointime

扫码下载App
iOS & Android

ChatGPT已过时?Auto-GPT迅速走红,无需人类插手自主解决复杂任务,GitHub标星5万

作者 | Luke Larsen

译者 | 核子可乐

策划 | 冬梅

ChatGPT 之所以能风靡全球,很大程度上要归功于其简单的功能框架。作为一款 AI 聊天机器人,它唯一的作用就是生成令人信服的自然语言文本、顺畅回应用户的提问。

但 AI 聊天机器人的使用体验,往往由用户设计提示词的水平所决定。有鉴于此,新型应用 Auto-GPT 应运而生,它允许 AI 自主行动 — 即实现“自我提示”,并彻底改变我们对于这项技术的看法和感受。对于这一工具,有外媒的标题甚至称,“ChatGPT 已经过时”。

Auto-GPT 项目地址:https://github.com/Torantulino/Auto-GPT

Auto-GPT 是什么?

Auto-GPT 是一款开源 Python 应用程序,由开发者用户 Significant Gravitas 于 2023 年 3 月 30 日发布至 GitHub。该应用程序以 GPT-4 为基础,允许 AI“自主”行动,无需用户详尽提示每个动作。大家可以为 Auto-GPT 制定一个总体目标,再由它逐步采取行动以实现目标。这就是“AI 智能体”概念的来源 — 使用互联网资源以完全独立的方式在 PC 上执行操作,不再需要一步步接受提示和引导。

GitHub 上还发布了一个简单示例,展示 Auto-GPT 如何浏览网络并为“即将到来的下一个节假日”准备聚餐食谱。这时 Auto-GPT 会化身“大厨 Chef-GPT”,帮助用户在网上搜索正确答案。之后,它会将食谱以文件的形式保存在用户计算机内。

就功能本身来看,这似乎算不上什么创新大事件。但 Auto-GPT 代表用户搜索互联网并执行文件保存操作的能力,已经让这款 AI 远远超越了简单的聊天机器人。

Auto-GPT 是如何工作的?

Auto-GPT 的迷人之处,在于它能够对 AI 的运行步骤做拆分,真正把 GPT 模型出色的文本生成能力转化为可用功能。Auto-GPT 把整个过程分解成“思考”、“推理”和“评价”几个环节,准确告知用户 AI 正在做什么、为什么这么做。在前面的 Chef-GPT 示例中,它的“思考”方式如下:“我将搜索即将到来的节假日,据此创建出独特的食谱。”而“推理”部分,则是“只要确定了节假日的具体内容,就能确定食谱的相应设计。”

至于“评价”环节,Auto-GPT 会对所做工作表达一些担忧和限制。可以看到,Auto-GPT 正在以完全自主的方式一步步达成用户指定的目标。

Auto-GPT 还拥有其他一些神奇的能力,包括长 / 短期记忆和集成 ElevenLabs 提供的文本到语音实现。所有这些功能的结合,让 Auto-GPT 在感受上更像是能与人类真正互动的 AI 智能体。

Auto-GPT 用例

人们正在发掘 Auto-GPT 的各种可能用例。虽然目前仍处于起步阶段,但因为它属于纯开源项目,所以任何人都可以尝试这款工具。Twitter 上就出现了一个简单的“Ecommerce-GPT”示例,其目标是自主开发和运营电子商务业务,旨在帮助用户增加净资产。

我的 Auto-GPT 来自 @SigGravitas,正在开发电子商务业务。它决定检索互联网以寻找商业创意,并将结果保存在文件中以供后续参考。

另一个有趣的用例出现在编码领域。Twitter 上的一位用户想出了“Robo-GPT”,负责分析、重写并保存程序代码。

今天我编写了 Auto-GPT 的变体 Robo-GPT,希望让代码更干净、依赖关系更简单。它目前的功能还不像 Auto-GPT 那么完备,但希望它能易于理解、运行和更新。

类似的例子还有很多,也许这款 AI 智能体最终将帮助我们创建网站、组织社交媒体活动等等。

与此同时,具备类似功能的竞争系统也纷纷亮相,包括微软 Jarvis 和 BabyAGI。这些方案都允许 GPT“自我提示”并实现自主行动。

如何使用 Auto-GPT

与其他 GitHub 项目一样,Auto-GPT 的设置过程不只是下载文件或者访问网站。在上手之前还需要满足一些重要的前提条件,比如安装有 Python 3.8(或更高版本)、OpenAI API 密钥和 Pinecone API 密钥。如果希望使用可选的文本转语音功能,还需要用到 ElevenLabs API。

用户可以在 Auto-GPT GitHub 页面上找到相关链接及其他重要信息。在满足以上三项要求后,单击“Code”并下载 Zip 文件。当然,用户也也可以通过 Git 应用程序获取这些文件。

首先打开命令行程序,例如 PowerShell,并在其中输入“git clone https://github.com/Torantulino/Auto-GPT.git”以克隆代码仓库。

第二步是在 PowerShell 中输出“cd ‘Auto-GPT'”以导航至项目目录。之后,输入“pip install -r requirements.txt”来安装所需的依赖项。最后,将文件“.env.template”重命名为“.env”并填写您的 OpenAI API 密钥。

在安装完成之后,Auto-GPT 的实际使用其实非常简单。它会要求用户先为机器人命名,之后再提供想达成的目标。它甚至提供两个示例,引导朝着正确的方向前进。

Auto-GPT 实现通用人工智能了吗?

不少 AI 爱好者把 Auto-GPT 视为通往人工通用智能(AGI)的第一步。确实,Auto-GPT 表现出了推理和通过多个自主步骤达成目标的能力,其长 / 短期记忆机制也让它能够不断学习更多新鲜事物。

但很多人仍然认为,一系列相互关联的提示并不能让系统真正获得“智能”;也有人坚称,人类的大部分智能和行为就是以这种方式实现的。

无论是 AGI 的开端、还是 AI 标准化道路上的重要一步,Auto-GPT 的出现必然引发新的哲学思考。这些运行在互联网上、活动在数字世界中的 AI 智能体,究竟是不是“智能生物”?也许只有时间能给出答案。

评论

所有评论

推荐阅读

  • Polymarket周一将发布重大公告

    3 月 21 日,Polymarket 团队成员 Mustafa 发文表示,将于周一公布一项「重大公告」,具体内容尚未披露。

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)