Cointime

扫码下载App
iOS & Android

OpenAI 宫斗剧引出神秘项目 Q*

个人专家

撰文:木沐

「出局 - 跳槽 - 返岗」,5 天之后,Sam Altman 最终重新拿回 CEO 一职,与力挺他的原董事会主席 Greg Brockman 一同回到了 OpenAI。

当人们以为这家 AI 巨头上演的宫斗剧彻底落下帷幕时,路透社甩出一个大瓜:在 Altman 被罢免之前,OpenAI 几位研究人员向董事会发出警告信,内容是一项强大的人工智能发现可能威胁人类,而这封信可能是 Altman 下台的关键。

知情人士还告诉路透社,OpenAI 内部有一个名为 Q*(发音为 Q-Star)的项目,这可能是该公司探索通用人工智能 (AGI) 的突破。

至此,外界的目光从 OpenAI 的人事斗争转向神秘的 Q*。

Q* 或与 AI 的数学能力有关

路透社披露的有关内部警告信和 Q* 的信息,均来自不愿具名的消息人士。尽管这家权威媒体表示没有看到内部信的原文,也无法证实 Q* 的功能,但这个增量信息还是引来了外界的好奇。

11 月 22 日,OpenAI 宣布原则上达成协议让 Sam Altman 重新担任 CEO,并组建由 Bret Taylor(主席)、Larry Summers 和 Adam D'Angelo 组成的新董事会。按照这个消息,该公司的首席科学家 llya Sutskever 从董事会出局,他曾被视作罢免 Altman 的核心推动者。

在 X 上,Altman 和 OpenAI 彼此点赞, Brockman 发了一张和成员的「大团圆」合影,老板与员工庆祝着再次成为一家人。

这场被称为「企业家与科学家之争」的大戏以企业家之胜落下帷幕,但外界至今都不清楚 Altman 到底因为什么导致了 OpenAI 原董事会的不信任。

11 月 23 日,路透社援引消息人士曝出大瓜称,Altman 下台前四天,几位研究人员写了一封信给董事会,警告一项强大的人工智能发现,他们称这一发现可能威胁人类。

两位消息人士称,此前未报道的信件和人工智能算法是董事会罢免 Altman 之前的关键。其中一名知情人士称,OpenAI 在给员工的内部信中承认有一个名为 Q* 的项目,一些人认为 Q* 可能是公司探索通用人工智能 (AGI) 的突破。

OpenAI 一直认为,AGI 能在最具经济价值的任务中超越人类的自主系统。

这位不愿具名的人士表示,鉴于庞大的计算资源,新模型能够解决某些数学问题,虽然数学成绩仅达到小学生的水平,但在此类测试中取得的好成绩让研究人员对 Q* 未来的成功非常乐观。

路透社的消息让外界对 OpenAI 的目光从人事纷争转移到它的主业上,连 OpenAI 的开发者社区都在追问 Q* 到底是什么,但未获得官方人员的回应。

OpenAI 开发者社区讨论 Q*

由于 Q* 似乎与数学有关,一些开发者推测,OpenAI 的研发可能使用了 Q-Learning 算法,这可能是这个神秘项目以 Q 命名的原因。

Q-Learning 算法是一个数学概念,也是机器学习算法中的一种,能够进行「小学」水平的数学计算,并有望在该领域超越 OpenAI 的 GPT-4 模型。

Q-Learning 使用被称为「强化学习」的机器学习技术来解决数学问题,对正确或最佳的行为给予奖励,对不正确或次优的行为给予惩罚。机器可以通过探索所有可能的路径来学习获得预期奖励的最短路径(shortestroute),通过反复试验找到更优化的路线,并随着时间的推移达到优化状态,每次都做出更好的决策。

AGI 离人类不远了?

根据目前了解 GPT-4 最直接的产品 ChatGPT 的表现看,这个对话机器人能够在人文、编程等领域理解自然语言,并给出符合上下文逻辑的回答,还能在人类的不断提示中修正自己的回答。

但 ChatGPT 对解决数学问题不是很给力,比如不能一次性答对「鸡兔同笼」的问题,还有人给它出过混合运算的数学题,这家伙的答案也是不尽人意。

现在,Q* 被视作 OpenAI 在解决 GPT 数学能力的路径。

新的问题来了:为什么获得了数学能力,就能被 OpenAI 上升到通向 AGI?

研究人员认为,数学是生成式人工智能发展的前沿。目前,生成式人工智能擅长通过统计预测下一个单词进行写作和语言翻译,而同一问题的答案可能会有很大差异。但如果能征服「只有一个正确答案」的数学能力,这意味着人工智能将拥有类似于人类智能的更强推理能力。

与只能解决有限数量运算的计算器不同,AGI 可以概括、学习和理解,更强的推理能力无疑是这些 AGI 特征的重要一步。

给路透社爆料的消息人士称,OpenAI 内部有标记为「人工智能科学家」团队的工作,多个消息来源证实了该团队的存在。一位知情人士表示,该小组由早期的「Code Gen」和「Math Gen」团队合并而成,正在探索如何优化现有的人工智能模型,以提高其推理能力并最终开展科学工作。

这些未得到 OpenAI 回应、也没有实证证明的信息,让 Q* 变得更加神秘。而从 Altman 和 OpenAI 过去的表态看,AGI 一直是这家公司追求的最高峰。

除了在 11 月宣布的一系列新工具外,Altman 上周还在旧金山举行的 APEC 峰会上称,他相信重大进展即将到来。「在 OpenAI 的历史上已经有四次了,最近一次是在过去几周,当我们推开无知的面纱并推进发现的前沿时,我已经在房间里了,能够做到这一点是我一生的职业荣誉。」

如今,Altman 杀回来了,相信这个善于制造热点、运作资本的商业领袖,必然不会让人错过有关 Q* 的消息。

评论

所有评论

推荐阅读

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)

  • GameFi板块市值暂报45.15亿美元,FLOKI排名第一

    3 月 21 日,据 Coingecko 数据,GameFi 板块市值暂报 45.15 亿美元,FLOKI 以 2.86 亿美元市值排名第一,排在第二第三位的分别为:The Sandbox(2.18 亿美元)、Undeads Games(2.11 亿美元)。此前 Solana 基金会主席 Lily Liu 表示,区块链游戏「不会再回归」。她认为,尽管行业曾寄望通过链上资产与开放世界推动 Web3 与元宇宙发展,但实际表现远未达预期。市场观点称链游长期依赖「Play-to-Earn」等代币激励模式,却缺乏真正吸引核心玩家的游戏性与内容构建能力,导致用户留存与生态可持续性不足。包括 Andreessen Horowitz(a16z)、Framework Ventures、Animoca Brands 在内的机构曾向该领域投入数十亿美元,但回报表现不佳。