Cointime

扫码下载App
iOS & Android

OpenAI 宫斗剧引出神秘项目 Q*

个人专家

撰文:木沐

「出局 - 跳槽 - 返岗」,5 天之后,Sam Altman 最终重新拿回 CEO 一职,与力挺他的原董事会主席 Greg Brockman 一同回到了 OpenAI。

当人们以为这家 AI 巨头上演的宫斗剧彻底落下帷幕时,路透社甩出一个大瓜:在 Altman 被罢免之前,OpenAI 几位研究人员向董事会发出警告信,内容是一项强大的人工智能发现可能威胁人类,而这封信可能是 Altman 下台的关键。

知情人士还告诉路透社,OpenAI 内部有一个名为 Q*(发音为 Q-Star)的项目,这可能是该公司探索通用人工智能 (AGI) 的突破。

至此,外界的目光从 OpenAI 的人事斗争转向神秘的 Q*。

Q* 或与 AI 的数学能力有关

路透社披露的有关内部警告信和 Q* 的信息,均来自不愿具名的消息人士。尽管这家权威媒体表示没有看到内部信的原文,也无法证实 Q* 的功能,但这个增量信息还是引来了外界的好奇。

11 月 22 日,OpenAI 宣布原则上达成协议让 Sam Altman 重新担任 CEO,并组建由 Bret Taylor(主席)、Larry Summers 和 Adam D'Angelo 组成的新董事会。按照这个消息,该公司的首席科学家 llya Sutskever 从董事会出局,他曾被视作罢免 Altman 的核心推动者。

在 X 上,Altman 和 OpenAI 彼此点赞, Brockman 发了一张和成员的「大团圆」合影,老板与员工庆祝着再次成为一家人。

这场被称为「企业家与科学家之争」的大戏以企业家之胜落下帷幕,但外界至今都不清楚 Altman 到底因为什么导致了 OpenAI 原董事会的不信任。

11 月 23 日,路透社援引消息人士曝出大瓜称,Altman 下台前四天,几位研究人员写了一封信给董事会,警告一项强大的人工智能发现,他们称这一发现可能威胁人类。

两位消息人士称,此前未报道的信件和人工智能算法是董事会罢免 Altman 之前的关键。其中一名知情人士称,OpenAI 在给员工的内部信中承认有一个名为 Q* 的项目,一些人认为 Q* 可能是公司探索通用人工智能 (AGI) 的突破。

OpenAI 一直认为,AGI 能在最具经济价值的任务中超越人类的自主系统。

这位不愿具名的人士表示,鉴于庞大的计算资源,新模型能够解决某些数学问题,虽然数学成绩仅达到小学生的水平,但在此类测试中取得的好成绩让研究人员对 Q* 未来的成功非常乐观。

路透社的消息让外界对 OpenAI 的目光从人事纷争转移到它的主业上,连 OpenAI 的开发者社区都在追问 Q* 到底是什么,但未获得官方人员的回应。

OpenAI 开发者社区讨论 Q*

由于 Q* 似乎与数学有关,一些开发者推测,OpenAI 的研发可能使用了 Q-Learning 算法,这可能是这个神秘项目以 Q 命名的原因。

Q-Learning 算法是一个数学概念,也是机器学习算法中的一种,能够进行「小学」水平的数学计算,并有望在该领域超越 OpenAI 的 GPT-4 模型。

Q-Learning 使用被称为「强化学习」的机器学习技术来解决数学问题,对正确或最佳的行为给予奖励,对不正确或次优的行为给予惩罚。机器可以通过探索所有可能的路径来学习获得预期奖励的最短路径(shortestroute),通过反复试验找到更优化的路线,并随着时间的推移达到优化状态,每次都做出更好的决策。

AGI 离人类不远了?

根据目前了解 GPT-4 最直接的产品 ChatGPT 的表现看,这个对话机器人能够在人文、编程等领域理解自然语言,并给出符合上下文逻辑的回答,还能在人类的不断提示中修正自己的回答。

但 ChatGPT 对解决数学问题不是很给力,比如不能一次性答对「鸡兔同笼」的问题,还有人给它出过混合运算的数学题,这家伙的答案也是不尽人意。

现在,Q* 被视作 OpenAI 在解决 GPT 数学能力的路径。

新的问题来了:为什么获得了数学能力,就能被 OpenAI 上升到通向 AGI?

研究人员认为,数学是生成式人工智能发展的前沿。目前,生成式人工智能擅长通过统计预测下一个单词进行写作和语言翻译,而同一问题的答案可能会有很大差异。但如果能征服「只有一个正确答案」的数学能力,这意味着人工智能将拥有类似于人类智能的更强推理能力。

与只能解决有限数量运算的计算器不同,AGI 可以概括、学习和理解,更强的推理能力无疑是这些 AGI 特征的重要一步。

给路透社爆料的消息人士称,OpenAI 内部有标记为「人工智能科学家」团队的工作,多个消息来源证实了该团队的存在。一位知情人士表示,该小组由早期的「Code Gen」和「Math Gen」团队合并而成,正在探索如何优化现有的人工智能模型,以提高其推理能力并最终开展科学工作。

这些未得到 OpenAI 回应、也没有实证证明的信息,让 Q* 变得更加神秘。而从 Altman 和 OpenAI 过去的表态看,AGI 一直是这家公司追求的最高峰。

除了在 11 月宣布的一系列新工具外,Altman 上周还在旧金山举行的 APEC 峰会上称,他相信重大进展即将到来。「在 OpenAI 的历史上已经有四次了,最近一次是在过去几周,当我们推开无知的面纱并推进发现的前沿时,我已经在房间里了,能够做到这一点是我一生的职业荣誉。」

如今,Altman 杀回来了,相信这个善于制造热点、运作资本的商业领袖,必然不会让人错过有关 Q* 的消息。

评论

所有评论

推荐阅读

  • 道指期货涨幅扩大至1%

    6月15日,受美国与伊朗达成和平协议并重新开放霍尔木兹海峡的重大利好消息提振,美股三大指数期货拉升。道指期货涨幅扩大至1%,纳斯达克100指数期货涨近2%,标普500指数期货涨1.26%。

  • 部分亚洲对冲基金收益率突破100% 得益于提早布局AI行情

    6月15日,据熟悉业绩情况的消息人士透露,今年前五个月,部分亚洲对冲基金的回报率超过100%,得益于多地股市创下历史新高,以及对人工智能(AI)硬件和大语言模型领军企业的押注。市场参与者表示,由于亚洲几乎涵盖了整个半导体产业链,区域基金更早地发现了供给侧的制约因素,从而能够及早布局,并在AI各细分领域捕捉机遇。这一业绩凸显出,尽管伊朗战争引发了市场波动,但并未阻碍今年由AI驱动的行情,因为不断增长的需求和紧张的供应推高了股价,并推动日本、韩国等股市创下历史新高。知情人士表示,香港WT资产管理有限公司旗下采用多空策略的中国焦点基金,在今年截至5月底的净回报率达103%,仅5月单月涨幅就超过20%。其仅做多基金上涨了67.5%。该消息人士称,对AI硬件以及中国科技股(如芯片制造商华虹宏力和AI公司智谱)的投资推动了这一业绩表现。另一位消息人士称,由资深投资人王通书管理的WT的资产规模迅速增长至约100亿美元。一位消息人士称,2025年成立的香港对冲基金E20 Capital在前五个月实现了136%的净收益,其在存储、光学和CPU领域的持仓推动了其20亿美元旗舰基金“环球机遇投资基金”(Global Opportunity Investment Fund)的回报。与此同时,据另一位消息人士称,长期科技投资者禾其投资(Trivest Advisors)在今年前五个月的收益率为88.9%。

  • 机构:多国央行可能正步入同步加息周期

    6月15日,道富投资管理公司亚太区经济学家Krishna Bhimavarapu表示,在经济韧性增强和通胀走高的支撑下,各国央行可能正步入同步加息的阶段。Bhimavarapu指出,日本央行似乎准备将利率上调至1.0%这一心理关键点,并补充称日本央行可能会暗示今年还将进行第二次加息。不过相比之下,澳洲联储似乎将暂停加息,因为经济增长和劳动力市场的动能均已减弱。然而,通胀问题尚未解决,这可能为今年晚些时候至少再加息一次留有余地。此外,Bhimavarapu预计,美联储在本周结束时可能转向鹰派立场。

  • 消息称立讯精密计划最快7月在港上市

    6月15日,据IFR,立讯精密计划最快7月份在香港上市,拟筹资20亿至30亿美元。

  • WLD日内大涨超15%,现报0.5858美元

    6月15日,行情显示,WLD日内大涨超15%,现报0.5858美元。此前消息,World 宣布其已进入「The Simple Plan」第三阶段(Reach critical scale and initial utility),增长模式将从早期代币激励转向实用驱动增长。

  • 美国现货以太坊ETF昨日净流出493万美元

    6月13日,据Trader T监测,美国现货以太坊ETF昨日净流出493万美元。

  • 美国现货比特币ETF昨日净流入8582万美元

    6月13日,据Trader T监测,美国现货比特币ETF昨日净流入8582万美元。

  • 美国禁止外国主体访问Fable 5和Mythos 5,Anthropic发长文驳斥

    6月13日,Anthropic发布声明称,美国政府以国家安全权力为由,发布了一项出口管制指令,要求暂停任何外国主体对人工智能模型Fable 5 和Mythos 5的所有访问权限,无论该人员是否在美国境内,包括属于外国公民的Anthropic员工。该命令的实际效果是,我们必须立即为所有客户禁用Fable 5和Mythos 5,以确保合规。所有其他Anthropic模型的访问将不受影响。我们于今天下午5点21分(美国东部时间)收到了政府的指令。该信函未说明其国家安全关切的具体细节。我们的理解是,政府认为其已获悉一种绕过或“越狱”Fable 5的方法。迄今为止,政府仅向我们提供了口头证据,证明存在一种潜在的狭窄、非通用越狱,本质上是通过要求模型读取特定的代码库并修复任何软件缺陷。我们正在遵守政府的合法指令,并正在移除所有用户对 Fable 5 和 Mythos 5 的访问权限。但是,我们不同意“某个狭窄的潜在越狱漏洞就应成为召回已部署给数亿用户的商业模型的原因”这一结论。(金十)

  • 伊朗外长:伊美谅解备忘录可能在几天内签署

    6月13日,据伊朗媒体12日报道,伊朗外长阿拉格齐表示,一旦伊美完成最后阶段的谈判,谅解备忘录将立即签署并公布。第一阶段将以远程电子方式签署,“这可能在未来几天内发生”。(新华社)