Cointime

扫码下载App
iOS & Android

对话机器人的崛起:数学家如何使用AI?

作者:Davide Castelvecchi

机器学习工具已经能帮助数学家提出新理论,解决难题,但这些工具对该领域的颠覆性远不止此。

随着人们对聊天机器人的热度空前高涨,数学家也开始探索人工智能(AI)可以如何协助他们的工作。研究人员表示,无论是验证人类书写的证明,还是提出不同问题的解法,自动化正在改变数学——而且不仅限于计算领域。

加拿大蒙特利尔大学数论学家Andrew Granville说道,“我们这里谈的是一个非常具体的问题:机器会改变数学吗?”加州大学洛杉矶分校最近一场座谈会探讨了这个问题,希望能在数学家和计算机科学家之间搭建桥梁。“大部分数学家完全没有看到其中的机遇。”这场活动的主办者之一、美国卡内基梅隆大学的计算机科学家Marijn Heule说。

研究人员能利用AI工具解决复杂的数学问题。来源:Fadel Senna/AFP/Getty

菲尔兹奖(Fields Medal)是数学界的至高荣誉,2018年的菲尔兹奖得主、美国普林斯顿高等研究院的Akshay Venkatesh 在10月以他名义举办的研讨会上开启了关于计算机将如何改变数学的对话。菲尔兹奖的另外两位得主——法兰西公学院的Timothy Gowers和加州大学洛杉矶分校的陶哲轩(Terence Tao)——也在这场辩论中领衔发言。

帝国理工学院的数学家Kevin Buzzard说:“我们能吸引到菲尔兹奖得主和世界级的大数学家加入,说明这个领域正以前所未有的方式热了起来。”

AI方法

辩论的一个内容是哪类自动化工具最实用。AI主要有两类。一类是“符号” AI(symbolic AI),需要程序员将逻辑法则或计算嵌入代码中。“也就是大家眼中‘既靠谱又传统的AI’。”华盛顿的微软研究院(Microsoft Research)的Leonardo de Moura说道。

另一类AI基于人工神经网络,过去十年左右取得了巨大成功。对于这类AI,计算机或多或少需要从头开始,并通过消化海量数据来学习其中的模式。这种方式称为机器学习,它既是“大型语言模型”(包括ChatGPT一类的聊天机器人)的基础,也是能在高难度博弈中打败人类选手或是能预测蛋白质折叠的系统的基础。符号AI本身很严密,而神经网络只能进行统计学上的猜测,其运作方式也很神秘,不为人知。

2018年菲尔兹奖得主Akshay Venkatesh(中)谈论了计算机会如何改变数学。来源:Xinhua/Shutterstock

De Moura通过打造名为Lean的系统,帮助符号AI在数学上取得了一些早期进展。这是一种交互式软件工具,要求研究人员为每个问题写出每个逻辑步骤,而且需要具体到最基本的细节,同时确保在数学上是正确的。两年前,一个数学家团队成功将一个很重要但难以理解的证明——其复杂程度就连作者自己也不确定——翻译成了Lean所使用的语言,最后确认了证明是正确的。

该团队表示,这个过程帮助他们理解了这个证明,甚至帮他们找到了简化证明的方法。“我认为这是比检验结果更令人激动的事,”de Moura说,“即使在最夸张的梦里,我们也不敢这么想。”

除了让个人的独立研究更轻松,这类“证明助手”还可以消除de Moura所谓的“信任瓶颈”,改变数学家之间的合作。“如果我们合作,我可能不太信任你做的那部分。但‘证明助手’能向合作者证明,他们完全可以相信你负责的工作没问题。” 

智能化自动补全

另一个极端是聊天机器人风格的、基于神经网络的大型语言模型。在加州山景城的谷歌公司,前物理学家Ethan Dyer和他的团队开发了专门解决数学问题的聊天机器人Minerva。从核心上讲,Minerva是消息App自动补全功能的超智能版本:通过利用arXiv数据库里的数学论文进行训练,它已经学会以某些App预测词汇和句子的方式,写下解题的详细步骤。Lean的沟通方式类似计算机代码,但与Lean不同的是,Minerva能以会话式英语理解问题并给出答案。de Moura说:“能以自动化方式解决这些问题的其中一些本就是一项成就。”

Minerva既展现了这种方法的能力,也暴露了它的可能局限。比如,它能准确将整数分解成素数——素数是无法被更小素数整除的数。但如果数字超过一定大小,它就会开始犯错,这说明它还没有“理解”其中的一般方法。

当然,Minerva的神经网络似乎还是能掌握一些通用技术,而不仅仅是统计学模式,谷歌团队正在尝试理解它是如何做到的。Dyer说:“归根结底,我们想要一个能和你头脑风暴的模型。”他说,这个模型对于需要从专业文献中获取信息的非数学家也很有用。通过学习课本和与专门的数学软件连接,还可以扩展Minerva的技能。

Dyer表示,开展Minerva项目的动力是为了看一看机器学习的方法到底能走多远;一种能协助数学家的强大自动化工具或许能将符号AI技术与神经网络结合起来。

数学对机器

长远上看,AI程序会一直屈居配角地位吗?还是它也能独立开展数学研究?AI生成正确数学命题和证明的能力或许会越来越强,但一些研究人员也担心,这些命题或证明的绝大部分将是无趣或无法理解的。在去年10月的座谈会上,Gowers表示,研究人员或许有办法教会计算机一些数学相关性的客观标准,比如一个小命题是否能代表许多特例,甚至是连接起数学的各个分支。他说:“为了在定理证明上再上一个台阶,计算机就必须学会辨别什么是有趣的和值得证明的。”如果计算机能做到这些,人类在该领域的未来地位就很难说了。

德国亚琛工业大学的计算科学家Erika Abraham则对人类数学家的未来更为乐观。“AI系统的聪明程度只能达到我们给它编程的水平,”她说,“智能的不是计算机,而是编程序或训练它的人。”

美国圣塔菲研究所的计算机科学家和认知科学家Melanie Mitchell表示,数学家暂时还不会丢饭碗,除非AI的一个主要缺陷能被攻克——即它们还无法从具体信息中提取抽象概念。“AI系统或许能证明定理,但你首先要提出这些定理背后有意思的抽象数学概念,这比证明定理难多了。”

来源:https://mp.weixin.qq.com/s/FXZ7bQwNQwzheZn-CgKGfA

评论

所有评论

推荐阅读

  • Circle在Solana上增发5亿枚USDC

    Circle在Solana上增发5亿枚USDC。

  • BitMine上周增持约13.84万枚ETH,总持仓超386万枚ETH

    截至美国东部时间12月7日晚上8点,BitMine的加密货币持有量包括:3,864,951枚ETH(较上周增持138452枚ETH),按当前价格计算,价值约132亿美元;193枚BTC、EightcoHoldings(纳斯达克代码:ORBS)的3600万美元股份以及10亿美元无抵押现金。

  • Robinhood计划推出山寨币合约并降低费用

    Robinhood 周一宣布,计划通过推出包括降低费率和增加山寨币期货杠杆在内的新功能,以吸引更多美国及欧盟的高级别、高交易量加密货币交易者。该公司在一份声明中表示,已在美国将可用费率层级从三个扩展到七个,「为高交易量用户提供低至 0.03% 的费率」。在欧盟,希望交易永续期货的用户现在可以交易 XRP、DOGE、SOL 和 SUI 的新交易对,符合条件的客户可使用高达 7 倍的杠杆进行交易。

  • 哈塞特:特朗普将公布大量利好经济消息

    美国白宫国家经济委员会主任哈塞特:特朗普将公布大量利好经济消息。

  • 白宫经济顾问哈塞特:应该继续降低利率

    白宫经济顾问哈塞特就美联储发表看法称,应该继续降低利率。关于利率应降至多低的问题,他表示必须密切关注数据情况。他还表示,若现在就公布未来6个月的利率承诺,将是不负责任的行为。

  • Tether 在波场网络上铸造 10 亿枚 USDT

    据 Whale Alert 监测,北京时间21:05:18,Tether Treasury在波场网络上铸造了 10 亿枚 USDT。

  • Paradigm 向巴西稳定币初创公司 Crown 投资 1350 万美元

    加密风投机构 Paradigm 宣布向巴西稳定币初创公司 Crown 投资 1,350 万美元,此轮融资对 Crown 的估值达 90,000 万美元。Crown 创建的 BRLV 稳定币与巴西雷亚尔挂钩,完全由巴西政府债券支持,已成为全球最大的新兴市场稳定币。与零利率的 Tether 不同,BRLV 为机构客户提供高达 15% 的巴西基准利率收益,目前订阅金额已超 3.6 亿雷亚尔(约 6,600 万美元)。

  • Binance:至少拥有250分的用户可申领2000枚STABLE空投

    据官方消息,持有至少 250 个 Binance Alpha 积分的用户可在 Alpha 活动页面申领 2000 个 STABLE 代币空投。若活动未结束,则分数门槛将每五分钟自动降低 10 分。请注意,申领空投将消耗 15 个 Binance Alpha 积分。用户需在 Alpha 活动页面 24 小时内确认申领,否则视为放弃领取空投。

  • Strategy上周以9.627亿美元购入10,624个比特币

    Strategy于12月1日至12月7日期间购入10,624枚比特币,总价约9.627亿美元,单价约90,615美元,2025年至今比特币收益率为24.7%。截至2025年12月7日,Strategy持有660,624枚比特币,总价约493.5亿美元,单价约74,696美元。

  • 美国SEC结束对Ondo长达两年的调查

    美国SEC结束对 Ondo Finance 长达两年的调查,为后者在美国代币化资产领域的扩张扫清道路。