Cointime

扫码下载App
iOS & Android

开源人工智能模型何时才能取代闭源人工智能模型?

个人专家

作者:Janelle Teng. 编译:Cointime:QDD.

尽管一些基础的闭源公司已经捕捉了大部分风险投资机构对 GenAI 类别的投资,但越来越多的开源声音进入了这个系统,可能会动摇当前的范式。

几周前,我写了一篇关于 AI 模型层如何成为现代软件技术堆栈中最具战略和竞争性的层之一的文章。目前,最有价值的三家 GenAI 创业公司都是由深口袋的金融投资者和强大的战略合作伙伴支持的闭源公司。

1. Cohere 正式宣布其 2.7 亿美元 C 轮融资昨天由 Inovia 基金领导,估值约为 21 亿至 22 亿美元。该公司现在的支持者包括 NVIDIA 和 Oracle。

2. Anthropic 在几周前宣布了一笔 4.5 亿美元的 C 轮融资,由 Spark Capital 领导,估值约为 50 亿美元。Google 已经向该公司投资 3 亿美元

3. OpenAI 宣布从 Microsoft 获得了 100 亿美元的融资。这家公司据报道在今年 4 月份的一次认购中估值约为 290 亿美元,多家风险投资公司参与其中

这些知名基础模型公司的筹款活动非常引人注目,尤其是在 VC 活动放缓的背景下,这些大规模的融资规模更加令人印象深刻,因为市场下行后 1 亿美元以上的轮次变得越来越少。

来源:Carta,https://carta.com/blog/vc-megadeals-2022/

这些闭源投资所支撑的无限信心并不普遍在 VC 行业中被感受到。本周早些时候,Benchmark 的 Miles Grimshaw 被 TechCrunch 问及为什么他的公司在有机会投资基础模型公司时为什么没有投资,以及这些公司筹集的大量资金是否是一个因素。对此,Grimshaw 回答说:

“我们没有想象其中任何一家公司可能拥有的持久的过大的市场份额的信心。我认为你现在可以看到开源正在涌现并迅速追赶。随着时间的推移,你可以想象这些大型语言模型的输入会减少成本,无论是芯片上可用的计算量还是任何芯片的成本。这方面的知识显然是在扩散,越来越多的人知道如何做而不需要花很多钱去尝试找出如何做。你甚至可以看到像 OpenAI 模型这样的公司的折旧速度。想想看它们如何迅速地使 GPT-2 或 GPT-3 上的所有支出过时了。”

模型层的竞争动态正在发生变化。Grimshaw 的回应促使我深入了解当前的 GenAI 融资范式以及在“AI 的 Linux 时刻”期间开源势头可能如何影响当前状态。

GenAI 淘金热中,资金流向何方?

我们目前处于 AI 炒作周期(上图),因此风险投资正涌入这个领域应该并不意外。事实上,摩根士丹利发现截至2023年4月全球已经有超过120亿美元的融资流入了GenAI类别,这是2022年的增长函数:

正如阿马拉定律所述:“我们往往高估技术在短期内的影响,而低估它在长期内的影响”。即使已经有如此巨额的资金流入这个类别,作为技术范式的人工智能仍然处于 S 字形曲线的早期阶段,仍有很多方面尚未得到证实。那么资金流向了哪里呢?根据摩根士丹利的发现,约有80%的GenAI投资流向了模型层公司。我根据NFX的GenAI市场地图电子表格中的原始数据进行了类似的分析,并发现在过滤掉2013年之前的公司后,约70%的投资流向了模型平台或MLOps公司。

对此轻重缓急的关注在这个技术堆栈的这一部分是合乎情理的,因为我们处在早期的GenAI采用阶段,而模型层仍在不断发展,出现了一些新兴的领导者,但还没有确定的赢家。模型层与云基础架构提供商类似,在技术堆栈的其他层上形成了基础,我们可以预期随着模型层的成熟,将会产生更多的下游应用。此外,训练和开发LLMs往往比构建应用程序更昂贵,因此模型层公司具有更高的资本需求,往往需要筹集更大的融资。

来源:《经济学人》,https://www.linkedin.com/feed/update/urn:li:activity:7036730584655695872/

但重要的是要注意,即使在模型层这个“最热门”的资金流向中,也似乎出现了帕累托模式。这一层的绝大部分投资资金都被一些精选的闭源模型公司所获得。特别是如之前所述,OpenAI以惊人的100亿美元融资宣布,超过了2023年平均的风投融资轮次大小基准(其中约70%的所有风投轮次在2023年第一季度筹集的资金为1000万美元或以下),以及其他模型层大额融资。如上图所示,OpenAI的融资占GenAI初创企业累计融资总额的近50%。

在开放模型和闭源模型之间进行大卫与歌利亚之战

考虑到大量的投资流向模型层,支配这一技术堆栈的竞争是否仅限于这些资金充裕的闭源模型供应商?并非如此。

正如我之前所指出的,许多其他参与者,包括大型科技公司、非AI本土初创公司和学术机构,在该生态系统中引起了动荡,导致许多开源模型进入竞争。当我说长,我的意思真的是很长…只需查看这个开源LLM数据库(感谢Sung Kim的维护)。其中许多模型仅在六个月前不存在,但现在,由于引发了连锁反应,每天都会发布多达三个开源模型!

来源:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

斯坦福大学的Chris Ré将这种开源势头比拟为AI的Linux时刻(指朝向开源操作系统作为Microsoft封闭平台Windows的替代方案的运动):“自深度学习时代开始以来,AI就有着强大的开源传统。我所说的Linux时刻是指:我们可能正处于开源模型和建立重要、持久、广泛使用的重要开源努力的时代的开端。许多最重要的数据集(例如LAION-5B)和模型努力(例如来自稳定性和Runway 的 Stable Diffusion、来自EleutherAI 的GPT-J)都是由较小的独立玩家以开源方式完成的。今年我们看到这些努力激发了大量的进一步发展和社区激动。”

生态系统中的每个人都在关注,重新评估他们的防御能力,因为开源LLMs证明了它们作为可靠的竞争对手,与那些拥有更充足资金支持的闭源竞争对手相比,并非处于劣势地位。

在病毒式传播的“我们没有Moat,OpenAI也没有”泄露备忘录中,一位谷歌研究员声称,开源参与者正在缩小质量上的差距,并最终在各方面(如训练速度和成本)上击败专有的闭源模型:   “虽然我们的模型在质量上仍然有一定优势,但差距正在惊人地快速缩小。开源模型更快,更可定制,更私密,而且在每一方面都更能干。他们用100美元和13B params做出我们在10美元和540B时努力做出的事情。而且他们是在几周内,而不是几个月内做到的。这对我们有深刻的影响。”

该备忘录引用了Vicuna-13B作为例子,Vicuna-13B是一个开源聊天机器人,通过对用户共享的从ShareGPT收集的对话进行微调LLaMA进行训练。Vicuna-13B能够在很短的时间内轻松超过其前身LLaMA和斯坦福阿尔帕卡,实现了超过90% OpenAI的ChatGPT和Google的Bard的质量(下图)。特别值得注意的是,相对于将某些估计需要数百万美元的特定闭源LLMs进行训练的成本而言,Vicuna-13B的培训成本约为300美元

来源:SemiAnalysis,https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

但未来远非确定。有些人认为,“Linux时刻”并不足以使开源模型赢得闭源竞争对手,可能需要“Apache时刻”才能倾向于他们。

AILinux时刻为火上加油

资金最充足的玩家会获胜吗?会有几个赢家吗?市场结构会长期保持分散吗?GenAI的日子从未变得无聊,因为这个领域的变化速度是前所未有的快。近期出现的开源参与者的蓬勃发展增加了模型层上已经非常竞争的压力,但我认为这种活力很重要,因为它可以促进创新,推动更多的AI资源民主化,让下游公司在此基础上构建更多的产品和应用。

来源:Morgan Stanley

正如Marc Andreesen最近写道:“AI可能是我们文明创造的最重要和最好的事物,至少和电和微芯片不相上下,可能更加重要。” 因此,我以上图作为背景,来结束本文,以突显我们目前正在经历的深刻时刻,以及从众多投入到这个领域的燃料中催生出的前所未有的采用速度!

本篇文章及所提供的信息仅供参考。所表达的观点仅是作者个人观点,并不构成出售的要约或推荐购买,也不构成要求购买的要约,也不构成任何投资产品或服务的推荐。虽然本文中包含的某些信息源自被认为可靠的来源,但作者及其雇主或附属机构没有对此信息进行独立验证,其准确性和完整性不能得到保证。因此,不应根据此信息的公正性、准确性、及时性或完整性进行任何形式的陈述或保证,也不应依赖此信息。作者及其所有雇主及其附属人员对此信息不承担任何责任,并且不保证将来会更新此处所包含的信息或分析。

评论

所有评论

推荐阅读

  • 疑似Bitmine新建钱包从Kraken收到20,000枚ETH,约合4,167万美元

    据Onchain Lens监测,一个新创建的钱包从Kraken收到了20,000枚$ETH,价值约4,167万美元。该钱包很可能属于Bitmine。

  • 以太坊L2 TVL跌至317亿美元,七日跌幅10.6%

    据 L2BEAT 数据,当前以太坊 Layer2 总锁仓量(TVL)跌至317亿美元,7 日跌幅10.6%。其中锁仓量前五分别为:

  • Tether协助土耳其冻结5.44亿美元非法加密资产

    Tether应土耳其当局请求,冻结了超过5.44亿美元的加密资产,这些资金涉及某涉嫌非法线上博彩及洗钱网络。Tether首席执行官Paolo Ardoino表示,该公司在接到执法部门提供的信息后,依法采取冻结措施,这种合作是Tether全球合规工作的一部分,此前也曾配合美国司法部和FBI等机构行动。分析机构Elliptic数据显示,截至2025年底,Tether及Circle共将约5,700个钱包列入黑名单,冻结资金总额约25亿美元,其中约三分之二为USDT。

  • BTC突破69000美元

    行情显示,BTC突破69000美元,现报69039美元,24小时涨幅达到3.96%,行情波动较大,请做好风险控制。

  • 「BTC OG内幕巨鲸」再将6908万USDT充值进易理华关联的Binance充值地址

    据链上分析师Ai姨(@ai_9684xtpa)监测,「BTC OG内幕巨鲸」又将6908万枚USDT充值进了易理华关联的Binance充值地址。过去11小时已累计转入1万枚ETH和6908万枚USDT,总价值8947万美元。 此前消息,易理华与「BTC OG内幕巨鲸」使用同一Binance存款地址。Trend Research地址于1天前将798.9万USDT转入0xcdF开头地址,随后转移至0x28C开头的Binance热钱包地址。「BTC OG内幕巨鲸」于2小时前将1万枚ETH转入0xcdF开头地址,随后转移至0x28C开头的Binance热钱包地址。

  • “1011内幕巨鲸”从币安提出5500万枚USDC 或为变卖BTC所得

    据链上分析师Ai监测,“1011内幕巨鲸”于5分钟前从币安提出5500万枚USDC,他过去6小时向币安充值5000枚BTC(价值3.5亿美元),疑似已完成出售。

  • CoinList:AC新项目Flying Tulip代币销售已结束,成交额近1000万美元

    CoinList在X平台发文表示,其平台上的AC新项目Flying Tulip代币销售已结束,成交额接近1000万美元,参与者应该已收到FT NFT(代币+完全赎回权),该NFT已交付到相关非托管外部钱包。此外,用户还可以选择持有、赎回(随时可以销毁FT并按面值赎回您的原始资产且已赎回的FT将被销毁)、以及解锁和交易(将放弃赎回权,但FT将可以自由交易)。

  • Michael Saylor:出售比特币也是一个选项,不再坚持只买不卖

    据财新网披露,全球最大企业级比特币持有者Strategy在2025财年第四季度及全年财务业绩中表示,该公司Q4资产公允价值变动录得174亿美元未实现损失,净亏损达到124亿美元。虽然该公司持有22.5亿美元现金储备,可覆盖债务利息与股息,暂无抛售风险,但公司联合创始人Michael Saylor在财报电话会议上不再坚持“只买不卖”,称“出售比特币也是一个选项”,对此一位投资者表示“这无疑将进一步引发市场的提前抛售”。

  • 特朗普近来已20次声称通胀得到控制

    特朗普一直把自己塑造成是共和党中应对生活成本问题的主要代言人。自去年12月以来,特朗普就经济问题发表了五次演讲,其中近20次声称通胀已被控制或大幅下降,近30次声称物价正在下降。这些说法与过去一年接近3%的通胀率以及选民为生活必需品支付更高价格的切身感受相矛盾。例如,自特朗普一年前上任以来,牛肉价格上涨了18%,而咖啡粉价格上涨了29%。共和党策略师表示,特朗普在选民最关心的问题上给出矛盾的信息,可能会在11月中期选举前夕损害他本人和共和党的信誉,届时国会的控制权将面临考验。民意调查显示,美国选民对特朗普的经济政策深感不满。

  • ITA 2026 首届RWA全球峰会倒计时2天

    2月7日消息,为探讨RWA(现实世界资产)前沿趋势,搭建政、经、产、学、研多方高端交流合作平台,紫荆杂志社联合RWA生态国际联合会、三角形科技(香港)有限公司、WebX全球数字控股集团、Coin Found等公司,将于2月9日在香港举办的“ITA 2026 首届RWA全球峰会”,倒计时2天。