Cointime

扫码下载App
iOS & Android

为什么聊天机器人时代现在才到来?

本文作者: NATHAN BASCHEZ  编译:Cointime Candice

“很少有新产品像人工智能聊天机器人那样在美国市场上爆炸式增长。聊天机器人没有受到经济衰退的阻碍,正在积累数以百万计的用户,并且被世界上大型科技公司大量提供。”

坦白说。这句话是我编的。事实上,我改编了它。

以下是原始版本,来自40年前(1983年1月9日)的一篇关于个人电脑崛起的新闻文章:

“很少有新产品像个人电脑一样进入美国市场。在不受经济衰退或政府开支削减影响的情况下,个人电脑的销售额达到数十亿美元,在百货公司和折扣店疯狂被销售,就像吸尘器一样。”

计算机在那个时候并不新鲜,现在的人工智能聊天机器人也是如此。但有时在一项技术的成熟过程中,会出现跨越关键边界的时刻,一个突破性的产品被发布,而增长图也会直线上升。

为了跨越这一界限,必须同时将多种因素结合在一起。这就像打开一把锁:所有的插销必须对齐才能进入下一个房间。

我用我之前写过的一本书《事情的运作方式》中的一张图片制作了这个Meme。

2022年11月,当ChatGPT推出时,最后一根针落地了:它证明了你可以将LLM技术包装成一个相对简单的聊天机器人,将其定位为谷歌的替代品,并获得比历史上任何其他消费者产品更快的采用。

一旦世界意识到对LLM驱动的聊天机器人的需求比任何人(包括ChatGPT创建者OpenAI)预期的都要大,重大改变就不可避免了。昨天,微软宣布它将在必应中直接建立一个由GPT-3驱动的ChatGPT式体验,而就在前一天,谷歌宣布了自己的名为Bard的AI聊天机器人。Platformer的Casey Newton以“微软启动人工智能军备竞赛”为标题总结了这些进展。

有一些明显的问题,比如“人工智能的算法足够好吗?”(可能还没有)和“谷歌会发生什么?”(没人知道),但我想退一步,问一些更基本的问题:为什么聊天?又为什么是现在?

大多数人都没有意识到,为ChatGPT提供动力的人工智能模型并不新鲜。这是2020年6月推出的基础模型GPT-3的一个调整版本。许多人以前都用它构建过聊天机器人。OpenAI的文档中甚至有一个指南,详细说明了如何使用其API制作一个机器人。

那么发生了什么?一个简单的说法是,人工智能最近变得越来越强大,所以现在很多人都想使用它。如果你缩小来看,这是真的。但如果你放大来看,你会发现发生了更加复杂和有趣的事情。

叙述具有网络效应

我记得在2020年第一次使用GPT-3,当时我想它有多酷,但不知道我能用它做什么。它在科技时代精神中引起了适度的轰动,围绕着它形成了一个规模虽小但充满激情的开发者社区,但最终我们中的大多数人都离开了。它并没有像今天这样以明显的轨迹改变所有的软件。

当目前的故事最终被讲述时,它要么会掩盖这部分内容,要么会辩称两年前它还没有起飞是因为技术还不够好。但我不认为这是真的。真正的问题是叙述无法解决冷启动问题。

为了让像GPT-3这样的人工智能发挥作用,开发人员必须相信,将它集成到应用程序中,或者尝试围绕它构建新的应用程序是有必要的。为了让这些应用程序成功,用户必须相信人工智能也会足够好。但信念是如何重拾的呢?

大多数人的信念是基于他们周围人的共识,他们不愿意接受对他们世界观的重大改变。信念的改变越大,就越需要内涵的证据和社会证明。因此,像 “使用GPT-3构建是值得的 ”或更广泛的 “人工智能能够改变许多类别的软件的用户体验 ”这样的叙述,需要建立社会动力,以取得突破。

最好的方法是做一个突出的技术演示,让人们对新的可能性敞开心扉,并开始正向传播。尽管GPT-3很了不起,但最初的演示并没有达到我们现在看到的效果。

这让我得出了一个令人惊讶的假设:没有DALL-E2和Stable Diffusion在今年早些时候发生,也许ChatGPT的时刻可能永远不会发生!

价值最重要

我对GPT-3的第一反应可能是,“很好,但不确定我会如何使用它,”但我对DALL-E2的第一反应更印象深刻;那是一个真正“天哪!”的时刻。

许多人同样感到震惊。我们以前见过AI生成的图像,但效果不是很好。DALL-E 2是在一个完全不同的水平上。

图片比文字更能打动你的内心。当你使用 GPT-3 生成文本时,需要花一些心思才能确定它是否有意义。一旦你读了它,它可能看起来像一个普通人会说的东西——也许甚至有点像机器人或重复性。输出结果与高质量的人类写作不相上下——而使用 DALL-E 2和Stable Diffusion,输出结果显然远远超出99%的人类所能创造的东西。

此外,有两个高质量的图像生成模型几乎同时出现,这也是一件大事。 它发出了一个明确的信息:这是可重复的。会有竞争和迭代改进,对于开发人员,不会被供应商独家垄断。

有思想准备

一旦我们都被人工智能生成的高质量图像所震撼,我们就可以相信人工智能是有用的和高质量的。

我们开始从新的角度阅读算法生成的文本。与此同时,像Jasper这样已经快速增长的初创公司开始更快地增长。更多的开发人员开始摆弄GPT-3,看看它能做什么。我就是其中之一!当我推出Lex时,它引起的轰动比我想象的大。人们注意到这些产品趋于成功,并开始使用GPT-3构建自己的工具。投资者们大张旗鼓地宣称,“生成型人工智能”是新的热门类别。

这种复合增长是由一个简单的逻辑循环驱动的:

循环将一直运行,直到该技术不再产生令人兴奋的结果。

目前,人工智能开发人员正在进行一场实地考察,当你推出一款人工智能产品时,很容易获得好的结果。部分原因是底层技术有很多尚未实现的潜力,但也有很大一部分原因是人们对人工智能感到兴奋。这不会持续下去。最终,人工智能将成为我们思考其他问题时使用的另一种标准工具。

(请注意,人工智能炒作的结果将与加密货币不同,只有在其他人想与你交易时,加密货币才有用。有了人工智能,因为它有更多的单人效用和更高的金融投机进入门槛,就少了反复无常的繁荣和萧条周期。)

我在Napkin Math的同事Evan甚至将当前围绕人工智能的炒作称为泡沫。这件作品的开场白是:

泡沫是指人们买了太多愚蠢的东西,因为他们认为有比他们更愚蠢的人可以卖给他们。

这是事实,但不是全部事实。泡沫也会发生在当人们对一项还不够好的发明的可能性感到兴奋时。那个转发无数个 “以GPT为动力的问答和一组文档”应用程序的人,并不是因为他想抽出和抛出一种投机性资产。他只是觉得这很酷! 一年后,它就不会让人感到兴奋了,我们可能会看到新的GPT驱动的应用程序和辅助项目的速度变缓,但这没关系。

进步就是这样发生的

当我们思考技术进步的历史时,我们倾向于想象严肃的发明家创造了改变世界的技术,比如汽车、电力和飞机。当我们想到今天正在部署的新技术时,很容易陷入一种愤世嫉俗的状态,将所有的建设者都解释为盲目追逐金钱,将所有狂热者都解释为傻瓜,被空洞的宣传所迷惑。

但过去和现在的共同点比看起来更多。那时也有骗子。今天的发明将像过去一样被人们铭记。

建设者的底线是将噪音排除在外,并专注于将其传递到无聊的部分,在那里人们将整天都在使用你的工具,而不是在推特上谈论它。

评论

所有评论

推荐阅读

  • Polymarket周一将发布重大公告

    3 月 21 日,Polymarket 团队成员 Mustafa 发文表示,将于周一公布一项「重大公告」,具体内容尚未披露。

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)