Cointime

扫码下载App
iOS & Android

开源人工智能模型何时才能取代闭源人工智能模型?

个人专家

作者:Janelle Teng. 编译:Cointime:QDD.

尽管一些基础的闭源公司已经捕捉了大部分风险投资机构对 GenAI 类别的投资,但越来越多的开源声音进入了这个系统,可能会动摇当前的范式。

几周前,我写了一篇关于 AI 模型层如何成为现代软件技术堆栈中最具战略和竞争性的层之一的文章。目前,最有价值的三家 GenAI 创业公司都是由深口袋的金融投资者和强大的战略合作伙伴支持的闭源公司。

1. Cohere 正式宣布其 2.7 亿美元 C 轮融资昨天由 Inovia 基金领导,估值约为 21 亿至 22 亿美元。该公司现在的支持者包括 NVIDIA 和 Oracle。

2. Anthropic 在几周前宣布了一笔 4.5 亿美元的 C 轮融资,由 Spark Capital 领导,估值约为 50 亿美元。Google 已经向该公司投资 3 亿美元

3. OpenAI 宣布从 Microsoft 获得了 100 亿美元的融资。这家公司据报道在今年 4 月份的一次认购中估值约为 290 亿美元,多家风险投资公司参与其中

这些知名基础模型公司的筹款活动非常引人注目,尤其是在 VC 活动放缓的背景下,这些大规模的融资规模更加令人印象深刻,因为市场下行后 1 亿美元以上的轮次变得越来越少。

来源:Carta,https://carta.com/blog/vc-megadeals-2022/

这些闭源投资所支撑的无限信心并不普遍在 VC 行业中被感受到。本周早些时候,Benchmark 的 Miles Grimshaw 被 TechCrunch 问及为什么他的公司在有机会投资基础模型公司时为什么没有投资,以及这些公司筹集的大量资金是否是一个因素。对此,Grimshaw 回答说:

“我们没有想象其中任何一家公司可能拥有的持久的过大的市场份额的信心。我认为你现在可以看到开源正在涌现并迅速追赶。随着时间的推移,你可以想象这些大型语言模型的输入会减少成本,无论是芯片上可用的计算量还是任何芯片的成本。这方面的知识显然是在扩散,越来越多的人知道如何做而不需要花很多钱去尝试找出如何做。你甚至可以看到像 OpenAI 模型这样的公司的折旧速度。想想看它们如何迅速地使 GPT-2 或 GPT-3 上的所有支出过时了。”

模型层的竞争动态正在发生变化。Grimshaw 的回应促使我深入了解当前的 GenAI 融资范式以及在“AI 的 Linux 时刻”期间开源势头可能如何影响当前状态。

GenAI 淘金热中,资金流向何方?

我们目前处于 AI 炒作周期(上图),因此风险投资正涌入这个领域应该并不意外。事实上,摩根士丹利发现截至2023年4月全球已经有超过120亿美元的融资流入了GenAI类别,这是2022年的增长函数:

正如阿马拉定律所述:“我们往往高估技术在短期内的影响,而低估它在长期内的影响”。即使已经有如此巨额的资金流入这个类别,作为技术范式的人工智能仍然处于 S 字形曲线的早期阶段,仍有很多方面尚未得到证实。那么资金流向了哪里呢?根据摩根士丹利的发现,约有80%的GenAI投资流向了模型层公司。我根据NFX的GenAI市场地图电子表格中的原始数据进行了类似的分析,并发现在过滤掉2013年之前的公司后,约70%的投资流向了模型平台或MLOps公司。

对此轻重缓急的关注在这个技术堆栈的这一部分是合乎情理的,因为我们处在早期的GenAI采用阶段,而模型层仍在不断发展,出现了一些新兴的领导者,但还没有确定的赢家。模型层与云基础架构提供商类似,在技术堆栈的其他层上形成了基础,我们可以预期随着模型层的成熟,将会产生更多的下游应用。此外,训练和开发LLMs往往比构建应用程序更昂贵,因此模型层公司具有更高的资本需求,往往需要筹集更大的融资。

来源:《经济学人》,https://www.linkedin.com/feed/update/urn:li:activity:7036730584655695872/

但重要的是要注意,即使在模型层这个“最热门”的资金流向中,也似乎出现了帕累托模式。这一层的绝大部分投资资金都被一些精选的闭源模型公司所获得。特别是如之前所述,OpenAI以惊人的100亿美元融资宣布,超过了2023年平均的风投融资轮次大小基准(其中约70%的所有风投轮次在2023年第一季度筹集的资金为1000万美元或以下),以及其他模型层大额融资。如上图所示,OpenAI的融资占GenAI初创企业累计融资总额的近50%。

在开放模型和闭源模型之间进行大卫与歌利亚之战

考虑到大量的投资流向模型层,支配这一技术堆栈的竞争是否仅限于这些资金充裕的闭源模型供应商?并非如此。

正如我之前所指出的,许多其他参与者,包括大型科技公司、非AI本土初创公司和学术机构,在该生态系统中引起了动荡,导致许多开源模型进入竞争。当我说长,我的意思真的是很长…只需查看这个开源LLM数据库(感谢Sung Kim的维护)。其中许多模型仅在六个月前不存在,但现在,由于引发了连锁反应,每天都会发布多达三个开源模型!

来源:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

斯坦福大学的Chris Ré将这种开源势头比拟为AI的Linux时刻(指朝向开源操作系统作为Microsoft封闭平台Windows的替代方案的运动):“自深度学习时代开始以来,AI就有着强大的开源传统。我所说的Linux时刻是指:我们可能正处于开源模型和建立重要、持久、广泛使用的重要开源努力的时代的开端。许多最重要的数据集(例如LAION-5B)和模型努力(例如来自稳定性和Runway 的 Stable Diffusion、来自EleutherAI 的GPT-J)都是由较小的独立玩家以开源方式完成的。今年我们看到这些努力激发了大量的进一步发展和社区激动。”

生态系统中的每个人都在关注,重新评估他们的防御能力,因为开源LLMs证明了它们作为可靠的竞争对手,与那些拥有更充足资金支持的闭源竞争对手相比,并非处于劣势地位。

在病毒式传播的“我们没有Moat,OpenAI也没有”泄露备忘录中,一位谷歌研究员声称,开源参与者正在缩小质量上的差距,并最终在各方面(如训练速度和成本)上击败专有的闭源模型:   “虽然我们的模型在质量上仍然有一定优势,但差距正在惊人地快速缩小。开源模型更快,更可定制,更私密,而且在每一方面都更能干。他们用100美元和13B params做出我们在10美元和540B时努力做出的事情。而且他们是在几周内,而不是几个月内做到的。这对我们有深刻的影响。”

该备忘录引用了Vicuna-13B作为例子,Vicuna-13B是一个开源聊天机器人,通过对用户共享的从ShareGPT收集的对话进行微调LLaMA进行训练。Vicuna-13B能够在很短的时间内轻松超过其前身LLaMA和斯坦福阿尔帕卡,实现了超过90% OpenAI的ChatGPT和Google的Bard的质量(下图)。特别值得注意的是,相对于将某些估计需要数百万美元的特定闭源LLMs进行训练的成本而言,Vicuna-13B的培训成本约为300美元

来源:SemiAnalysis,https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

但未来远非确定。有些人认为,“Linux时刻”并不足以使开源模型赢得闭源竞争对手,可能需要“Apache时刻”才能倾向于他们。

AILinux时刻为火上加油

资金最充足的玩家会获胜吗?会有几个赢家吗?市场结构会长期保持分散吗?GenAI的日子从未变得无聊,因为这个领域的变化速度是前所未有的快。近期出现的开源参与者的蓬勃发展增加了模型层上已经非常竞争的压力,但我认为这种活力很重要,因为它可以促进创新,推动更多的AI资源民主化,让下游公司在此基础上构建更多的产品和应用。

来源:Morgan Stanley

正如Marc Andreesen最近写道:“AI可能是我们文明创造的最重要和最好的事物,至少和电和微芯片不相上下,可能更加重要。” 因此,我以上图作为背景,来结束本文,以突显我们目前正在经历的深刻时刻,以及从众多投入到这个领域的燃料中催生出的前所未有的采用速度!

本篇文章及所提供的信息仅供参考。所表达的观点仅是作者个人观点,并不构成出售的要约或推荐购买,也不构成要求购买的要约,也不构成任何投资产品或服务的推荐。虽然本文中包含的某些信息源自被认为可靠的来源,但作者及其雇主或附属机构没有对此信息进行独立验证,其准确性和完整性不能得到保证。因此,不应根据此信息的公正性、准确性、及时性或完整性进行任何形式的陈述或保证,也不应依赖此信息。作者及其所有雇主及其附属人员对此信息不承担任何责任,并且不保证将来会更新此处所包含的信息或分析。

评论

所有评论

推荐阅读

  • Web3 AI平台ChainML完成620万美元种子轮扩展融资,Hack VC领投

    Web3 AI 平台 ChainML 宣布完成 620 万美元种子轮扩展融资,Hack VC 领投,Inception Capital、HTX Ventures、Figment Capital、Hypersphere Ventures 和 Alumni Ventures 等参投,该平台还宣布推出其代理基础层 Theoriq。

  • 元宇宙项目 Baby Shark Universe 以 3400 万美元估值完成种子轮融资

    元宇宙项目 Baby Shark Universe 宣布完成种子轮融资,估值为 3400 万美元,投资方包括 Animoca Brands、CREDIT SCEND、Sui Foundation、Comma3 Ventures、Creditcoin、GM Ventures、Neuler、Notch Ventures、X+ 和 Planetarium 等。具体金额暂未披露,所筹集的资金将用于开发和全球营销。

  • 5月13日晚间要闻速递

    1. BTC 突破 63000 美元

  • 香港证券交易所确认加密货币ETF对中国大陆投资者不可用

    据 Coindesk 报道,香港证券交易所确认加密货币ETF对中国大陆投资者不可用,香港的加密货币 ETF 由于其独特的实物赎回模式,将提供绕过中国大陆资本管制的手段。

  • Web3社交基础设施UXLINK ​​​​​​完成500万美元融资

    Web3 社交基础设施 UXLINK 宣布完成新一轮 500 万美元融资,由SevenX Ventures、INCE Capital和HashKey Capital领投,据悉,目前UXLINK 的融资总额已突破 1500 万美元。

  • 中国警方破获价值 2.96 亿美元非法加密货币交易案

    中国警方在吉林省磐石市打击了一个非法加密货币交易团伙,逮捕了六名涉案人员。他们经营的“地下银行”利用加密货币的匿名性和跨境转账特点,为韩元和人民币之间的非法兑换提供服务,涉及金额达21.4亿元人民币(约合2.96亿美元)。被捕人员中包括韩国采购代理商、电商公司和进出口企业。

  • 香港证监会告诫公众提防名为“LENA Network”的可疑拟资产投资产品

    香港证监会告诫公众提防名为“LENA Network”的可疑虚拟资产投资产品,该产品涉及与虚拟资产相关的质押及借贷安排,并声称向投资者提供高回报。该投资产品并未获证监会认可向香港公众发售。证监会注意到,香港公众可透过互联网取览关于该产品的资料及接触该产品。证监会提提切忌尽信那些“好得令人难以置信"的投资机会,及在作出投资决定时保持警惕。

  • 香港证监会:《打击洗钱条例》适用于虚拟资产业界

    有消息披露香港“虚币转ETF”机制惹洗钱忧虑,业界称需KYT(Know Your Token)等审查难度很高,有内地背景人士正尝试小额度“虚币转ETF”交易,借此机会透过人头帐户等形式“洗白”自己持有的以太币、比特币,并已部署部分虚币至香港的虚币交易所,未来将视情况决定是否增资。 香港证监会回应相关问题时强调,ETF产品运作当中,整个虚拟资产生态的每个环节,包括基金公司、托管行、资产交易平台、参与券商,等均需为持牌或认可机构,并须严格遵守资产保管、流动性、估值、信息披露、投资者教育等要求。证监会《打击洗钱条例》亦订明金融机构和指定非金融企业及行业人士,须遵守客户尽职审查及备存纪录规定,相关规定适用于虚拟资产业界。

  • TON社区成员:部分TON钱包收到“888”开头的虚拟账号NFT,系钓鱼项目

    据 TON 官方社区成员披露,TON 钱包多出一个近期爆火的“888”开头虚拟号码的 NFT,但每次转出的手续费高达 1 TON,系钓鱼项目更改 Gas 所导致。

  • Tether CEO:拥有一支内部调查团队,迄今已封锁超13亿美元

    Tether首席执行官Paolo Ardoino在X平台发文称,Tether 拥有一支专业内部调查团队,依靠各种工具来监控一级市场(核心平台Tether)和二级市场(区块链和交易所)。 - Tether 自成立以来与 40 多个不同国家的 124 个执法机构合作。 - 自成立以来,Tether封锁了超过13亿美元,主要与诈骗、黑客、ML有关。大约160万美元与恐怖主义融资有关。 - Tether 在过去 12 个月内自愿配合执法部门屏蔽钱包的 198 项请求(其中 90 项与美国执法机构合作),在过去 3 年中配合了 339 项要求(与美国执法机构合作 158 项)。 - Tether 与美国执法部门合作冻结了超过 6.39 亿美元。