Cointime

扫码下载App
iOS & Android

实地研究: 生成性AI的潜力

这篇文章是由真正的人类写的。

如今,生成性人工智能是最热门的话题:每天都有数百家创业公司在这个领域成立。作为密切关注生成性人工智能的投资者,我们想深入探讨一以下问题:

生成性人工智能的格局是怎样的,我们应该如何评估机会?

这是一个看似简单的问题。但正如你在下面所看到的,在这个新的和迅速扩大的领域中,有很多东西需要解读。在Alpaca VC,我们定期对我们看到机会的领域进行深入研究,我们称之为实地研究。作为这些研究的一部分,我们与愿意分享他们观点的思想领袖、专家、投资者和企业家交谈。在对生成性人工智能领域进行了数周的实地研究后,我们很高兴与大家分享这篇文章,以提供对该领域的高级概述以及我们对评估新兴创业公司的初步思考。

当然,我们仍然处于人工智能及其应用的早期阶段,这是一项真正的新技术。因此,我们将这种初步研究视为今年晚些时候更深入研究的一个起点。

第一部分:生成性人工智能趋势

生成式人工智能--为什么如此热门?

ChatGPT,来自OpenAI的生成性人工智能应用,已经吸引了大部分人的注意力,从高中或大学的学生,到在每天艰苦工作的知识工作者,再到寻找灵感的创意者。整个世界(不仅仅是硅谷深处的技术人员)似乎都在谈论及使用生成性人工智能而,这都要归功于ChatGPT,根据瑞银分析师的说法,它是互联网历史上增长最快的应用程序。据估计,到2023年1月,它的用户数将达到1亿--在2022年11月发布后仅两个月。从这个角度来看,TikTok在2018年8月发布后,都是在2019年才有了3570万美国用户

ChatGPT依靠大型语言模型(LLM)GPT 3.5来生产出看起来神奇的东西:对各种问题进行连贯一致的回答。在最近的一份白皮书中,OpenAI表示,通过LLM,美国大约15%的工人任务可以在相同的质量水平下明显加快完成。当软件和工具被纳入LLMs之上时,这一份额将增加到47-56%。

简而言之,生成性人工智能将对我们大多数人的工作方式产生重大影响。

有趣的是,我们很容易在商学院校园的自习室和教室里看到这方面的证据,这个研究的大部分研究都是在这里进行的:经常可以看到学生把ChatGPT作为一个标签打开,与谷歌搜索、Word或Excel等主要生产力工具放在一起。我们还在GitHub Copilot等产品中看到了这一证据,这是一个文本到代码的人工智能系统,调查结果显示,88%的受访者在使用该系统时感到更有效率,74%的人认为他们能够专注于更令人满意的工作。

随着这些LLMs的发布,初创公司正在左右逢源,在这些模型的基础上打造产品,并在这个经济低迷的时期争夺尽可能多的VC投资和关注。根据Pitchbook,从2013年到2022年,在生成性人工智能领域成立的公司数量的年复合增长率为22.5%。然而,在快速发展的情况下评估这些初创企业是一个有趣的挑战。首先,让我们退后一步先了解资本流动。

跟着金钱流动走

企业采用和支出

人工智能已经存在了相当长的一段时间,但ChatGPT等的发布,使AI比以往任何时候都更加引人注目。企业对人工智能的投资水平已经随着其采用率的增加而增加。

根据麦肯锡关于2022年人工智能的全球调查,人工智能的采用已经增加了一倍多。

2017年,20%的调查对象表示至少在一个业务领域采用了人工智能,而在2022年(在2022年11月ChatGPT发布之前),这一数字达到了50%。

当被问及公司对人工智能投资的预算分配时,63%的受访者预计其组织的投资将在未来三年内增加。

与过去的大数据技术不同,由于缺乏管理和分析数据集的组织人才和专业知识,利用数据获得洞察力和决策的潜力没有得到充分发挥(即大数据重现),鉴于LLMs完成了OpenAI和其他公司的繁重工作,生成性人工智能可能更容易被利用起来。Pitchbook报告说,与生成有关的用例已经为企业带来了巨大的商机,估计在2023年达到426亿美元,并以32.0%的年均增长率增长,到2026年达到981亿美元--即使不考虑生成性人工智能在当前用例扩展到消费者和客户服务和销售流程自动化之外的新用户角色。

风险投资资金

随着公司增加在人工智能领域的投资,风险投资界也在增加。

根据Pitchbook,在2022年全球范围内,生成性人工智能在375项交易中获得了47亿美元的资金。

在2023年第一季度,它在46项交易中获得了17亿美元。

这意味着尽管经济放缓,2023年已经有望超过2022年的融资。感觉这个数字每周都在更新(也就是增加很多)。

以极快的速度进行创新

OpenAI在2022年11月发布了ChatGPT,此后世界就变得不一样了。随后,它在2023年3月发布了GPT-4,带来了新的和改进过的大型多模态模型。GPT-5预计将在今年年底发布。为了应对来自OpenAI的ChatGPT的竞争,谷歌在2023年3月发布了Bard,评论乏善可陈;然而,可以肯定的是,在接下来的几个月里,我们可以期待谷歌的更多产品。

微软宣布了适用于微软365的AI Copilot,而Meta(也不甘落后地)最近指出,可以预期很快就会有AI驱动的工具来帮助创建广告。2023年4月,Meta公司发布了其Segment Anything Model(SAM),只需一次点击就能 "剪切"任何图片中的任何物体。中国搜索巨头百度发布了自己的语言模型Ernie(通过知识整合增强性其表现)。可以说,这个领域已经发生了很多事情。

GPT-4和迈向多模式的进程

生成式人工智能领域最大的事件之一是GPT-4的发布,据说它在许多方面比GPT 3.5更好,从 "更具创造性和协作性 "到推理能力和更好的语言理解力。最值得注意的是,它接受图像作为输入的能力改变了AI行业的游戏规则,因为这种能力拓宽了用例和可以建立在模型之上的应用类型。过去的模型,如GPT 3.5,一直是纯文本的,但随着GPT-4的发布,一个多模式的模型,我们越来越看到向能够接受多种类型的输入(图像、视频、文本、音频)的模型转变。

多模式正在兴起,并将继续存在。模型根据多种模式解释和产生反应的能力导致更准确和与上下文相关的输出,并最终为在应用层上构建的初创企业打开了一个可能性的世界。我们已经开始看到可汗学院这样的公司利用多模式能力,使用GPT-4为其人工智能助手Khanmigo提供动力,Khanmigo是学生的虚拟导师和教师的课堂助手。

GPT-4标志着OpenAI的行为从一个非营利性研究公司过渡到一个大科技公司。它没有透露任何关于GPT-4是如何建立的,没有关于训练技术或日期的细节。这与它在上次发布时与公众沟通的方式大相径庭。目前已知的是,使用了类似于GPT 3.5的人类反馈强化学习(RLHF)。与过去的模型一样,仍然有许多限制,如错觉、社会偏见、对2021年9月之后的事件缺乏了解、不正确的事实,以及用户无法将事实与权威来源联系起来。

第二部分:让我们来谈谈技术问题

什么是LLM,是真实存在的吗?

大型语言模型(LLM)是一种深度学习算法,可以根据从其他数据集获得的知识来识别、总结、翻译和生成内容。网络上大量的数字数据、计算机能力的进步以及图形处理单元(gpu)的发展使深度学习算法成为可能。有些模型是开放的,这意味着所有或部分公众成员都可以获得源代码,而另一些是封闭的专有源代码,公众无法访问。一些模型是多模式的,意味着它们可以处理一种以上的内容/数据格式(即文本、图像、视频等),而其他模型是单模式的。请看下面的表格,了解流行模型的细分及其按开放/关闭和模式的分类。

有趣的是:这个表格是用ChatGPT建立的。然后,我们根据外部来源验证了其内容,并将2021年(ChatGPT知识的截止日期)后发布的关键模型分层。资料来源: Aplaca VC

当我们询问专家,市场是否会向OpenAI等大公司倾斜时,Alpaca团队一直听到相同的观点: "很难知道其他人是否会迎头赶上,但OpenAI有巨大的领先优势。"

人们认为,鉴于OpenAI在自然语言处理(NLP)方面的领先地位,它仍将是最大和最主要的参与者,而较小的参与者将出现,专注于针对特定用例的高度专业化模型。我们的想法是,这种现象将继续在从文本到图像和视频等各种模式中发挥作用。类似于今天的公司在其技术堆栈中使用AWS、Azure和谷歌云产品的组合,作为一种风险缓解和多样化的形式,我们相信我们将看到初创企业走向利用各种模式的组合,从横向的、广泛的模式到那些更垂直的模式。我们还可能看到像OpenAI这样的公司开始发布不同层次的模型,具有不同的质量水平,因此也有不同的成本。

开放式与封闭式LLMs

LLM 通常基于 Transformer 架构,并使用适用于开源和闭源模型以及跨模态的强化学习进行训练。所有的LLM(开放或封闭)都是资本密集型的,需要占用大量的时间和金钱来建立。如果不是大的科技公司或资金非常充足的创业公司,这些模式几乎不可能建立。

开放式LLM对初创公司有很多好处,因为它们允许团队利用已经存在的模型和代码,加快开发者的实验步伐,而无需在LLM和机器学习方面有深厚的经验。这使得初创企业可以灵活地、低成本地快速测试、实验和推出人工智能产品。然而,导致不正确的事实和数据的 "错觉"可能会成为问题,特别是对于在特定的高准确性垂直领域(如医疗保健和银行业)推出的初创公司。需要进行事实核查,特别是在敏感行业的垂直应用方面。

另一方面,封闭式的专有LLM通常被吹捧为具有更好的隐私性,由于在特定的数据集和任务上进行微调而提高了准确性,以及更好的性能(因为这些模型可以针对特定的硬件进行优化)。然而,对于闭源的LLM来说,初创公司会受制于 LLM 开发人员。从成本结构的角度来看,API成本会侵蚀初创企业的利润,并对商业模式的可持续性产生负面影响。还有一个风险是,由于某种原因,初创企业建立在其上的LLM不复存在,或者由于监管部门的打击或其他不可控因素而不再提供给开发者。

在开放模型所允许的速度和创新与封闭的专有模型所能提供的隐私和准确性之间,需要取得一个平衡。开放式和封闭式模型之间的转换成本是否很高,在LLM游戏中是否会有一个主导者?当在不同模式之间转换时,整合和兼容性是需要考虑的关键因素--对于一家初创公司来说,调整其现有的基础设施、软件和应用程序以配合新的模式可能会很费时和昂贵。

人工智能堆栈有哪些层级?

由于OpenAI的出现,人工智能堆栈的基础模型层在过去一年中获得了大量的公众关注;然而,人工智能堆栈中还有多个层次,它们共同构成了初创企业在这一领域的启动和发展。

(1) 应用层: 首先,我们有应用层,这是本文章后半部分的重点。这是大多数日常消费者将与之互动的层。这个领域的产品已经爆炸性增长,Jasper、Runway、Harvey和Tome等公司都进入了这个领域。专家认为,应用层的利润率可能高达90%,低端利润率为50-60%。然而,随着时间的推移,这些利润率的变化还有待观察,特别是考虑到初创企业面临的高计算成本。

(2) 工具层: 其次,我们还有工具层,它使开发人员能够更快地建立基础模型应用程序。在这一层运作的初创公司的例子是LangChain和HumanLoop。在我们与专家和建设者的交谈中,这一层特别有棘手,因为它被嵌入到工程师和设计师的工作流程中。转换成本很高,并且这一层对于使基础模型对更广泛的开发人员更易于访问和用户友好是至关重要的。

(3) 基础模型层: 第三层是基础模型层,包括开源和闭源的大型语言模型(LLM),从OpenAI的GTP 4到c0;这里和谷歌的PaLM。

(4) 基础模型操作层: 基础模型运营层允许开发者更有效地优化、训练和运行他们的模型。OctoML和Modal是这个层的初创公司的例子。

(5) 基础设施层: 最后是第五层,即云和硬件基础设施,首先促进了LLM的训练。鉴于训练LLM所需的计算能力,基础设施层的供应商可以说是生成性人工智能革命现阶段的真正赢家。AWS、Azure和半导体制造商Nvidia等云供应商正在从中获利。举例来说,Nvidia在人工智能和ML行业所需的GPU市场中占据了95%的份额。如今据估计,生成性人工智能的总收入的10-20%都给了云供应商。

放大应用层

然而,应用层的开发通常是快速且成本较低的:

产品差异化很困难

留住人才很困难

利润率可能很低

网络效应并不总是很明显

退一步来讲,必须对生成性原生应用和生成性增强产品/公司进行区分。

生成式原生应用与生成式增强应用

生成式原生应用是一个新的类别,完全不同于我们历史上所习惯的SaaS产品。这些应用直接建立在LLM之上,除了简单的 "提示 "之外,不需要明确的指令就能生成内容--例子包括Jasper、Harvey、RunwayML、fireflies.ai。

这些应用通常表现为水平应用(稍后会详细介绍)。生成式原生应用可以从低成本构建中获益。当初创公司依靠API到外部LLM时,他们在一开始就不需要投入大量的资金来建立自己的模型。这可以缩短上市时间,类似于我们看到的云原生公司,它们不需要花费时间和资本来建立内部基础设施。此外,与云计算类似,生成性原生公司有能力调高和调低他们对LLM的使用,因为他们适应了工作负荷和需求的变化。也就是说,要想成为一个真正的人工智能创业公司,创始人需要建立一些自己的模型,而不是仅仅依靠API。

我们可以把生成性增强产品看作是已经存在的SaaS公司,如Notion和Canva,他们开始将人工智能或LLM功能整合到他们现有的产品中。在我们与学术界的人工智能专家和教授的交谈中,普遍的想法是:如果一家公司在未来两到三年内没有在其产品中整合某种LLM,那么他们基本上是注定要失败的。我们已经看到像Notion这样的公司发布了用于头脑风暴、总结和初稿的Notion AI。Canva发布了Magic Write。生成式原生应用与生成式增强应用之间的关键区别在于,生成式增强应用的核心和关键价值主张不以生成式人工智能技术或使用LLM为前提,这些只是附加功能。这些应用程序的缺点是,将生成性人工智能整合到现有的工作流程中可能具有挑战性,增加开发成本和时间,并可能导致兼容性问题,可能会或不会影响用户体验。众所周知,用户体验和是否易于集成是客户参与和粘性的关键。

生成式原生应用--垂直应用

生成式原生应用的范围可以有多种切割方式,按垂直应用的领域,按模式(文本、图像、视频等),或按桌面应用、移动应用、插件和Chrome扩展等形式。在这里,我们将专注于垂直切割。这些是服务于一个行业或工作线中典型的特定任务或问题的应用(银行、会计、销售和营销、法律、生产力等)。

帮助律师提高效率的法律工具 Harvey 是法律领域垂直应用的一个例子。它最近在2022年11月赢得了OpenAI的创业基金竞赛,获得了500万美元的资金。解决特定问题的垂直应用有一个好处,那就是能够专注于基于重点数据集(即医疗保健用例的患者数据)的模型微调。对于在特定垂直领域运营的初创企业来说,他们必须找到一个单一的问题/用例来解决,并通过简单和示例的用户体验将其做得很好,使用户无法想象没有它的生活--一旦开始,他们就会上瘾,无法停止使用。与特定的公司携手合作,对产品进行编码,可能是实现卓越用户体验和专有数据见解的关键。

第三部分:评估想法和机会

我们应该用什么框架来评估生成性人工智能初创企业?

初创公司正在快速启动和建设,但很难确定谁在真正建设生成性人工智能原生产品,而不是传统SaaS产品的功能。更重要的是,存在着缺乏产品差异化的风险。创始人正在使用类似的,甚至相同的,在相同的数据集上训练的模型和相同的架构来构建产品。由于现在有这么多的初创公司为一些相同的用例(如市场营销、文案写作、电子邮件写作)而构建,因此很难确定谁有独特的优势或“护城河”,以及哪些解决方案具有成本效益并准备取得成功。一个独特的优势会给客户创造价值,这些价值来自于更低的成本、更高的生产力和性能或更多的收入。在评估是否存在独特的优势时,我们要寻找以下一项或全部:

(1) 专有数据:

为了在ML时代脱颖而出,初创企业需要从用户互动和使用其产品的反馈中获得专有的新数据集。当初创公司使用其他人无法访问的特定领域数据或客户数据(例如患者数据、法律数据)来微调和改进基线 LLM 时,就会出现这种算法护城河或数据访问护城河。专有数据加上人工智能为终端用户增加了价值,使他们成为回头客。然而,随着获得这种类型的数据优势,需要获得具有深厚技术专长的人才、高成本、高资本要求,有时还有监管摩擦。初创企业必须平衡数据采集和培训成本与数据价值的增量,确保他们所获取、清理和标记的数据能带来一个明显更好、更有用户粘性的产品。我们看到,由于建立专有数据护城河所需的人才和计算成本很高,初创企业正在筹集大量的种子轮资金。作为一个例子,Jasper在2022年10月筹集了1.4056亿美元的A轮资金。

这里的关键问题是,多少数据才是足够的数据,增量的价值是多少?

(2) 用户体验:

用户体验可以成就一个产品,也可以破坏一个产品。我们已经看到了用户体验推动品牌忠诚度的案例(典型案例:苹果产品)。即使是生成性人工智能的广泛使用,也主要是由易于使用的ChatGPT用户界面推动的,它为任何想要使用OpenAI的LLM来回答问题的人提供了无缝的体验。在生成性人工智能时代,与以往不同的是,正确的设计选择包括考虑输入(即提示)的类型和格式,以及用户在其特定环境中想要的输出的类型、格式和质量。

这里的关键问题是:

用户自然输入的提示是否能被理解和解释,从而产生预期的、对用户有帮助的输出?

从输入和输出的角度看,该产品是否很容易融入用户的工作流程?

(3) 先发优势:

作为一个先行者,主导市场策略,使初创企业拥有强大的品牌知名度和庞大的安装用户群,这可能是一种优势。这种类型的优势可以阻止其他人推出产品,或者导致其他产品差距过大,以至于不太可能赶上的情况。应该注意的是:鉴于模型、数据的可及性增加,以及由于最近的技术裁员,专业人才库的增加,先行者的优势很难跟上。这里的关键问题是:

有多大的领先优势,能否保持?

其他人在这一领域的建设是什么,他们追赶和复制的难度如何?

(4) 生态系统优势:

一个值得考虑的有趣的护城河是初创公司能够与客户在当前工作流程中使用的已经建立的软件无缝协作的能力,或者能够创建生态系统产品套件来为用户解决多个问题的能力。深度融合到用户的日常任务中是关键。举例来说,Chrome、Zoom和微软产品的插件就是无缝整合的例子。一家初创公司在利用数据和用户投入的同时,开发出一个具有广泛集成、插件或内容的综合生态系统,这是难以复制的。

这里的关键问题是:

这家初创企业是否有可能通过多种产品创造自己的生态系统?

该产品的运作方式是否容易与客户使用的现有产品配合?

总结和结论

生成式人工智能领域的未来是令人兴奋的。随着我们继续进一步调查这个空间,我们将探索以下问题:

  • 两到五年后的世界会是什么样子?
  • 这个空间将如何彻底改变我们的工作、娱乐和生活方式?
  • 在生成性人工智能时代,正确的商业模式是什么(按使用、订阅、混合或其他方式)?堆栈的每一层的平均利润率是多少?
  • 商业模式将如何受到即将到来的数据权利和法规趋势的影响?
  • 初创企业应采取的最佳数据策略是什么?初创企业应该如何考虑数据管理和治理?
  • 生成式人工智能将如何塑造加密货币和网络3的未来?
  • 我们是否看到一些初创企业有可能取代传统的软件堆栈,如甲预言机、SAP或Salesforce?

我们期待着在这个实地研究系列的下一期中为您提供最新信息。

评论

所有评论

推荐阅读

  • 美国财政部将加强数字资产反洗钱和反恐融资工作

    美国财政部希望继续加强数字资产的反洗钱和反恐融资工作,作为其打击非法融资的更广泛战略的一部分。该部门在周四发布了其2024年《打击恐怖主义和其他非法融资的国家战略》战略,概述了其应对非法融资的优先事项。财政部强调了其围绕加密货币的持续工作,包括对某些交易所和组织(如Bitzlato和Lazarus)的制裁,与币安的和解以及对猪肉屠宰诈骗的警告。周四的战略文件总体上表示,其四个优先事项是关闭反洗钱监管的漏洞,支持“更有效和风险集中”的框架,提高执法机构的效力并利用技术创新。更新加密货币的现有监管框架将支持这些优先事项,战略文件表示。

  • 美联储梅斯特:利率应在更长时间内保持在高位

    美联储梅斯特表示,短期通胀预期已经上升;利率应在更长时间内保持在高位;作出通胀回落进程停滞的结论还为时过早;数据显示美联储的通胀目标面临的风险上升;需要在“未来几个月”收集更多价格数据;最近的数据表明就业市场面临的风险已经减弱;需要更长的时间才能确信通胀朝着2%回落。

  • LocalMonero关闭交易,加密货币监管压力加剧

    据AgoraDesk发布的声明,自5月14日起,LocalMonero上的所有交易都已停止。并且在六个月内,整个网站将被关闭。该公司表示:“经过近七年的运营,由于内部和外部因素的综合影响,我们做出了关闭平台的艰难决定。我们非常感谢这些年来得到的爱和支持。没有你们,我们无法做到这一切。我们爱你们。”虽然AgoraDesk没有提供关闭的具体原因,但最近几个月,包括LocalBitcoins和Paxful在内的一大批P2P加密货币交易平台已经退出,这一趋势主要是由监管风险驱动的。LocalMonero的问题主要是由于监管机构对隐私币的压力而加剧的。

  • 美国矿企CleanSpark购买了怀俄明州靠近导弹基地的矿场

    美国比特币挖矿公司CleanSpark从与中国投资人有关的公司购买了怀俄明州靠近美国导弹基地的矿场。 此前报道,拜登禁止中国投资人支持的加密矿企在美国导弹基地附近拥有土地。

  • 法国证券监管机构对Bybit发出了新的警告

    法国证券监管机构对加密货币交易所Bybit发出了新的警告,敦促客户为该平台可能突然停止向法国客户提供服务的可能性做出安排。金融市场管理局(AMF)在周四的通知中表示,该交易所并未注册为数字资产服务提供商(DASP),因此在法国非法提供服务。Bybit自2022年5月20日起因非法运营而被AMF列入黑名单。

  • 印度SEBI建议当地监管机构监控加密货币交易

    印度证券交易委员会(SEBI)建议多个监管机构应监督该国的加密货币交易。

  • 5月16日晚间要闻速递

    1. ETH跌破3,000.00美元

  • 游戏平台Param Labs完成700万美元融资,Animoca Brands领投

    游戏平台Param Labs完成700万美元融资,Animoca Brands领投,Delphi Ventures和Cypher Capital参投。Param Labs的目标是建立一个由其原生PARAM代币管理的游戏生态系统,该代币即将推出。该公司的第一款游戏“Kiraverse”是一款边玩边赚钱的多人射击游戏。

  • 区块链SaaS解决方案AfriDex完成500万美元Pre-Seed轮融资,Endeavor Ventures领投

    总部位于英国伦敦的区块链软件即服务解决方案 AfriDex 宣布完成 500 万美元 Pre-Seed 轮融资,Endeavor Ventures 领投,African Crops Limited、Oldenburg Vineyards 和 Hank Oberoi 参投。AfriDex 目前主要专注于农业市场,通过全面的链上解决方案为供应链参与者提供支持和保护,利用区块链技术实现可追溯性、无摩擦支付、防欺诈交易、经过验证的认证、简化税收和补贴管理。(finsmes)

  • 以太坊上假冒NOT代币发生Rugpull

    据PeckShield监测,以太坊上假冒Notcoin NOT下跌100%。0xE0eB开头地址抛售了 1,645,040,633,338,481.95枚NOT并兑换为93.5枚WETH(价值28.13万美元)。 注:Rugpull代币与合法代币名称相同。