Cointime

扫码下载App
iOS & Android

当我们谈论大模型时,应该关注哪些新能力?

基于大语言模型技术的ChatGPT推出已经有4个月了,更多同类产品还在快速出现。比如,前天谷歌更新了Bard,将辅助编程能力支持的语言数量扩展到20种。

然而,对大模型技术的重要性也出现了质疑,前段时间,吴军老师就评价ChatGPT不算新技术革命,带不来什么新的机会,他认为大模型仍然存在很多限制,不像大家追捧的那样有吸引力。这篇文章发布后,网上也出现了多篇反驳文章。我不太关注这些争论,但我认为有一个问题没有被充分讨论,那就是大模型带来的新能力中,哪些是最为关键的,最有可能带来长期影响的。

我认为,与之前众多的自然语言处理技术相比,大语言模型至少具有三项根本性新能力,这些新能力在学术界已经被广泛讨论,甚至被视为常识,但是在产业界和产品团队中却缺乏足够的关注。实际上,这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式,也会改变很多产品的经济模型。因此,产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。

能力一:涌现能力(emergent abilities)

涌现能力指的是在小型模型中并不存在,但在大模型中“突然出现”的能力,其中包括常识推理、问答、翻译、数学、摘要等(详见下图)。如果仅依靠小型模型的能力做线性外推,往往无法预测出涌现能力的出现和其强度。OpenAI的首席技术官Ilya Sutskever在接受采访时反复强调,尽管表面上看来,语言模型只是在预测下一个词元(token),但当模型足够大,transformer技术的建模能力足够强时,基于内部表示的推理能力就会出现。因此,模型会呈现出与规模较小时完全不同的行为,涌现全新的能力。

,时长00:09

随着语言模型参数数量增加,新的能力逐步涌现且质量快速提升。

涌现能力之所以重要,不仅因为它们是大模型出现后才有的新能力,而且由大模型涌现出来的多数是非常重要的能力。例如,常识推理能力一直是AI领域的重大难题,而大模型的出现使得常识推理取得了重大进展。此外,大模型还有机会进一步获得更多能力。例如,一旦“推理”能力涌现,“思维链提示”(Chain of Thought Prompting)策略就可以用来解决多步推理的难题。因此,涌现能力的出现,是大模型带来的一项根本性变化。

能力二:作为基座模型支持多元应用的能力

在2021年,斯坦福大学等多所高校的研究人员提出了基座模型(foundation model)的概念,这更清晰地描述了之前学界所称的预训练模型的作用。这是一种全新的AI技术范式,借助于海量无标注数据的训练,获得可以适用于大量下游任务的大模型(单模态或者多模态)。这样,多个应用可以只依赖于一个或少数几个大模型进行统一建设。

上图展示了基座模型的结构,基座模型集中化了多模态数据,并且可以适配多元化的下游任务。

大语言模型是这个新模式的典型例子,使用统一的大模型可以极大地提高研发效率,相比于分散的模型开发方式,这是一项本质上的进步。大型模型不仅可以缩短每个具体应用的开发周期,减少所需人力投入,也可以基于大模型的推理、常识和写作能力,获得更好的应用效果。因此,大模型可以成为AI应用开发的大一统基座模型,这是一个一举多得、全新的范式,值得大力推广。

能力三:支持对话作为统一入口的能力

让大语言模型真正火爆的契机,是基于对话聊天的ChatGPT。事实上,业界很早就发现了用户对于对话交互的特殊偏好,陆奇在微软期间2016年就推进“对话即平台(conversation as a platform)”的战略。此外,苹果Siri、亚马逊Echo等基于语音对话的产品也非常受欢迎,反映出互联网用户对于聊天和对话这种交互模式的偏好。虽然之前的聊天机器人存在各种问题,但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想像。用户愈发期待像钢铁侠中“贾维斯”一样的人工智能,无所不能、无所不知。这引发我们对于智能体(Agent)类型应用前景的思考,Auto-GPT、微软Jarvis等项目已经出现并受到关注,相信未来会涌现出很多类似的以对话形态让助手完成各种具体工作的项目。

图为微软最新项目Jarvis的工作流程,Jarvis将通过任务规划、模型选择、任务执行、生成响应四个步骤,结合HuggingFace上的众多模型,完成多模态的复杂AI任务。随着大型语言模型技术越来越受欢迎,我们可以期待它带来更多的惊喜,特别是考虑到上面讨论的这些大型模型带来的关键新能力,周明等人所预测的语言智能黄金十年(2020-2030)很可能会成为现实,这正是一个令人兴奋的时代。

评论

所有评论

推荐阅读

  • 荷兰加密货币平台 Finst 完成 800 万欧元 A 轮融资

    1月21日消息,荷兰加密货币平台 Finst 完成 800 万欧元 A 轮融资,由 Endeit Capital 领投,现有投资者 Spinnin' Records 创始人 Eelko van Kooten 以及 DEGIRO 联合创始人 Mark Franse 跟投。此次融资使 Finst 的总融资额达到 1500 万欧元。

  • 摩根士丹利:黄金对美元霸权的挑战“看不到尽头”

    摩根士丹利表示,美元在全球体系中的角色正持续、逐步地被削弱,但由于可信的替代货币仍然有限,在日益多极化的世界中,黄金已成为对美元最大的挑战者。根据摩根士丹利的研究,美元的国际影响力已在多项指标上出现下降,包括其在各国央行外汇储备中所占比例下滑,以及在企业和新兴市场主权发行中的使用占比减少。尽管如此,美元仍然占据全球储备中最大的份额,这表明目前还没有具有实质意义的挑战者出现。然而,一旦将黄金纳入考量,情况就发生了变化。黄金在各国央行持有资产中的占比已从约14%上升至25%—28%,且这一上升趋势“没有任何放缓的迹象”。风险溢价以及对冲行为将持续对美元形成压力,同时支撑黄金需求。此外政策因素对“去美元化”的推动作用目前处于“中性至略有加速”的状态,而这些政策在短期内的演变,将决定去美元化趋势最终会走多远。

  • BTC突破90000美元

    行情显示,BTC突破90000美元,现报90010.62美元,24小时跌幅达到1.77%,行情波动较大,请做好风险控制。

  • BTC突破89000美元

    行情显示,BTC突破89000美元,现报89000.15美元,24小时跌幅达到3.94%,行情波动较大,请做好风险控制。

  • Coinbase将上线Elsa (ELSA)

    Coinbase 将上线 Elsa (ELSA) ,如果流动性条件满足,且交易得到支持,ELSA-USD 交易对将于今天晚些时候开始开放。

  • 桥水基金创始人达利欧:特朗普的政策可能会引发“资本战争”

    桥水基金创始人达利欧:特朗普的政策可能会引发“资本战争”,因为贸易紧张局势和不断上升的赤字削弱了人们对美国资产的信心,迫使投资者转向黄金作为对冲工具。

  • Tether在Tron网络上新增铸造10亿枚USDT

    据Onchain Lens监测,Tether刚刚在Tron网络上新增铸造10亿枚USDT。截至目前,Tether在2026年已在Tron网络上累计铸造了20亿枚USDT。

  • NXR 流动性池突破930万,币价同步创历史新高

    据官方数据,Nexus Chain 生态核心代币 NXR 的流动性池(底池)总额已突破 930万 USDT,再创历史新高,显示出强劲的市场信心与资金沉淀。与此同时,NXR 币价也同步走高,突破前期高点,刷新历史记录。

  • Canton财库公司Tharimmune将通过股票注册发行募资5500万美元

    纳斯达克上市的Canton财库公司Tharimmune宣布将通过股票注册发行募资5500万美元,据悉该公司将发行1,800,000股普通股,发行价格为每股2.92美元,以及预付认股权证,每份预付认股权证可购买至多17,000,000股普通股,价格为每份2.9199美元,预计本次募资交易将在1月21日完成,新资金将用于持续拓展其以Canton Network代币为中心的数字资产管理战略。

  • Strategy 比特币持仓现浮盈 108.13 亿美元,Bitmine 以太坊持仓现浮亏 32.32 亿美元

    据链上分析师余烬监测,比特币财库公司 Strategy (MSTR) 上周以约 95,284 美元的价格增持了 22,305 枚 BTC (21.25 亿美元)。他们现在总共持有 709,715 枚 BTC (647.36 亿美元),成本均价 75,979 美元,浮盈 108.13 亿美元。 以太坊财库公司 Bitmine (BMNR) 上周以约 3,225 美元的价格增持了 35,268 枚 ETH (1.13 亿美元)。他们现在总共持有 4,203,036 枚 ETH (129.79 亿美元),成本均价 3,857 美元,浮亏 32.32 亿美元。