Cointime

扫码下载App
iOS & Android

AI 时代科技公司的护城河是什么?

个人专家

作者:Seth Bannon

编辑:范阳

人类像是正在一个需要粘合和修补的世界里追求极致速度和效率,“ 再努力一下突破速度极限,就可以迎接美好未来,历史上我们都是这样过来的 ”。但是我觉得人们应该首先学会优化的是我们的适应力和灵活性(向自然进化学习),其次是我们的深度(比如信念、由热爱驱动的专业能力 )和长度(注意力、可持续性的生活、一份愿意投入耐心和时间的事业)。

最近听到过几次这样的探讨:人工智能和机器学习发展这么快,看起来要颠覆这个颠覆那个,让人兴奋又焦虑,但科技巨头们开启了军备竞赛,世界似乎被他们抓的更牢了,以后创业公司的护城河(moats) 又在哪里呢?

我对人工智能的快速发展还是感到期待和乐观的,如果我们把新技术看成进步必需的变革性力量,你自然会想更多理解和更好地利用它。而反倒是很多人只是看到了 “颠覆性” 的商业机会为了一己私利,很容易自己先被颠覆掉。

当然,世界不是非黑即白的,我们每个人的观点也都是有倾向性和随着时间变化的,找到适合自己的努力去践行就可以。就像我在之前的文章里分享过的,我相信当前人工智能进步的最大价值是帮助科学探索的进步,改变旧的文化和认知,帮助人类社会找到更可持续性的增长模式,创造能源,物质,文化,生物多样性都繁荣的世界,当前的人工智能可以把比特世界积累了几十年的先进技术和思想带入到原子世界,帮助人类的工业更新系统,更好地兼容生物世界和生态圈。当从这样的角度去看待人工智能的时候,我们也许并不需要保护一亩三分地的护城河,而需要的是降水充沛的辽阔大草原。

人工智能并不是一个短线 / 有限游戏,而是一个长线 / 无限游戏。无尽的前沿藏在科学探索里、原子世界、生物中间和宇宙深处。

今天分享一篇跟我共享一样对原子世界有倾向性的科技博客文章,来自于 Seth Bannon, 他是深层科技投资基金 Fifty Years 的创始合伙人,投资过 Solugen, Upside Foods, Substack 等公司,他的博客叫做 Happy Warrior, 最新的这篇文章叫做:Defensibility in the Age of AI。

这条评价很好的总结了这篇文章的核心观点:那些可以独特地生成自己专业知识和高质量数据的创业公司,将会更好地利用人工智能的发展。

简而言之:拥有能够独特地生成训练和微调模型(train and fine-tune models)所需数据的技术公司,能够很好地在人工智能时代创造持久的价值。最好的人工智能公司可能是那些以原子为基础去构建的公司,而不仅仅是比特为基础的公司。

“ The best AI companies may be those building in atoms and not just bits.”

AI 的发展速度让许多人感到世界正在经历地动山摇的变化。虽然令人兴奋,但这也导致了创业者之间的相当多的焦虑,他们想知道他们正在建造的东西是否真正有商业壁垒。在创业公司的世界中,一个公认的实战策略是构建一个产品,它比现有的产品至少更好10倍、更便宜10倍或让用户更容易使用10倍,同时朝着更长期的商业护城河前进。但是,考虑到现在 AI 发展的速度,上个月的 “10 倍好产品” 在这个月可能就已经过时了。就像下面这个由一位红杉资本的合伙人发起的投票结果显示的,这种担忧是真实存在的。

AI 的进展最近有多快?以下重大发布都发生在一个星期内,从 3 月 12 日到 3月 19 日:

OpenAI发布了GPT-4

Anthropic 发布了Claude

斯坦福大学的学生发布了 Alpaca

谷歌发布了 PaLM API

谷歌宣布了 Med-PaLM 2

谷歌在 Workspaces 中加入了 AI

PyTorch 2.0 发布

Microsoft Office 365 Copilot

Midjourney V5发布了并展示了精美的例子

仅在一个星期内,我们看到了比其他任何一年都多的重大 AI 公告。在这一星期内,以前只是一些初创公司的唯一关注点的工作流程,变成了具有大规模分发能力的公司的完善产品功能。许多公司一觉醒来后发现,他们的产品功能现在可以通过简单的英语书写指令就复制了。

那一周甚至引起了基础模型是否具有商业壁垒(whether foundation models are defensible)的讨论。斯坦福大学的一个团队采取了一种非常聪明的方法,从开源的 LLM “ LLaMA 7B ” 开始,并在 OpenAI 的 “text-davinvi-003” 中使用 52,000 个遵循指示的演示来对其进行微调。所得到的 LLM 被称为 “ Alpaca 7B ”,可以在苹果笔记本电脑 MacBook 上运行,并且其性能大致相当于依赖于大规模云计算的 OpenAI 推出的 GPT-3.5。OpenAI 花费了4.5 年时间,筹集了 1 亿美元以上的资金来训练推出 GPT-3。而 Alpaca 的培训成本不到 600 美元(你没看错这不是笔误)。这是一个非常重要的突破。

接下来的一周同样令人上头。OpenAI 发布了 ChatGPT 插件(ChatGPT plugins),有可能开启另一轮的让大多数大语言模型(LLM) 为基础的初创企业变得过时。谷歌发布了Bard,它的聊天界面 LLM 模型。英伟达 ( NVIDIA )发布了基础模型即服务 (foundation models-as-a-service),潜在地为客户抽离出以前需要许多 AI 科学家才能做的东西。

真是一阵阵旋风。一个月前还似乎很有商业壁垒的想法,今天就并非如此了。许多最近还是 “ ChatGPT for X ” 的做应用的公司意识到,在 OpenAI Plugins 推出后,他们可能再也没有任何产品优势了。虽然发展势头喜人,但也让许多人,包括经验丰富的创始人和产品创建者感到焦虑。一些资深的创始人甚至建议,如果他们在这种环境中考虑开始创造一些新事物,那么不如先让子弹飞一会儿不要那么冲锋在前。

那么,在人工智能时代中,商业护城河到底在哪里呢?我可以提供一个明确的答案。在人工智能时代中,商业壁垒在于通过原子构建世界,而不仅仅是通过比特建构虚拟产品。

“ Defensibility in the age of AI can be found by building with atoms, not just bits.”

由于机器人技术的发展暂时还没有跟上人工智能的速度,那些建立物理世界产品的公司(companies that build physically)在近期还不会被人工智能所颠覆。像 SpaceX、Cover 或 Solugen 这样的科技公司通过人工智能可以帮助获得效率的提升,但它们本质上都不是 “人工智能公司”。

注:Solugen 是一家总部位于休斯顿的以合成生物学为基础的绿色化学和化合物科技公司。他们也利用人工智能技术辅助酶的筛选,改良,合成和整体评估等。也通过生物信息学和机器学习等技术应用在他们的化学品设计和智能工厂的设计上。

那么,对于以人工智能为技术驱动(AI-first)的公司呢?随着创造基础模型变得更加容易,以及在现有模型之上构建应用的速度加快,依赖公开可访问或轻松就能获得的数据的公司可能面临最激烈的竞争。今天比其他产品好 10 倍的产品,在几个月后可能就比不过别家的产品了。这种现象在技术史上也是独一无二的。以前从未有过能力以如此之快的速度跃升。幸运的是,对于人工智能公司来说,护城河还可以在数据本身中找到。

每个模型都需要用数据进行训练,然后使用更多的数据进行微调。DeepMind的 AlphaFold 很好地说明了这些数据的重要性。通过阐明几乎所有已知蛋白质的可能结构并免费提供这些结构的预测,AlphaFold 帮助生物学发展迈出了重要一步。从加速基础科学发展到实现更好的生物工程能力,再到推动生物医药开发和帮助解锁生物制造的潜能,AlphaFold 的作用不容小觑。

那么,为什么我们能够在蛋白质结构预测领域利用人工智能取得比在其他生物学领域更多的成果呢?要理解这一点,我们需要把目光转向原子世界,而不是比特世界。

使用机器学习预测蛋白质结构的关键是有大量高质量的真实数据可用于模型训练。AlphaFold 主要依赖于两个数据集:蛋白质数据银行(PDB)和UniProt。

RCSB PDB:RCSB.org

PDB 包含近 175,000 个蛋白质的精确三维结构。UniProt 是一个蛋白质序列和功能数据库(protein sequence and function database),包含超过 2 亿个蛋白质序列,其中超过 55 万个蛋白质序列被人工注释过。建立这两个数据库都需要来自原子世界的技术。UniProt 数据集的规模、多样性和精度是在下一代测序技术的支持下才得以实现的,而解析 PDB 中的蛋白质结构则依赖于X射线晶体学、NMR 核磁共振光谱学和冷冻电镜技术(cryo-electron microscopy)。多亏有这些现有的数据集,这些数据集都需要原子世界的技术进步来采集,否则 AlphaFold 根本不可能实现。

想象一下,如果这些公共数据库不存在,而某个初创公司开发出了唯一能够大规模找到蛋白质三维结构的技术,那么除了这个初创公司,没有人能够开发出AlphaFold 相同的能力。这将是一个非常强的护城河!

生物学和化学特别适合被 AI 的进步所推动发展,因为它们本质上是 “结构化” 的。生物反应在很大程度上以可预测的方式发生,底层机制遵循物理定律,但我们在物理学中使用的非 AI 建模方法(mathematical non-AI based modeling)并不能让生物学从中获得太多收益。生物学也具有内在的高维度特性(highly dimensional),需要越来越强大的计算能力才能让我们解释和理解这些数据。不幸的是,生物学中今天依然有大量领域尚未存在 PDB + UniProt 一样的可用数据库。在这些领域,利用 AI 进行大规模进步突破的能力还受限。

DeepMind 联合创始人 Demis Hassabis 表示,“ 显然对于人工智能来说,还有很多生物学和化学的前沿需要攻克。” 在生物学和化学这些其他领域释放类似人工智能的飞速进步的关键是什么?主要是访问大型、高质量数据集的能力(access large, high quality datasets)。如果一家初创公司能够开发出创建这种 “大量且高质量” 数据的技术,那么它就能在该领域向前推进,同时能够建立一个相当强大的护城河。任何能够独家所有最高质量用来训练和微调数据的创业公司都具有强大的护城河能力。

“Any startup that can alone access the best data to train and fine-tune with will have strong defensibility. ”

那些具有收集更高质量、更高分辨率、更高维度和/或更好注释数据技术的公司将有望在即将到来的 AI 大发展中获得更好的机会。那些能够以高通量和低成本独特地生成这些数据集的初创公司掌握着通往城堡的钥匙。

有人可能会说,只要通过足够巧妙的 AI 工程能力或强大的计算资源,就可以规避对高质量用于训练和微调数据的需求。那我举一个反例,就是 OpenAI 为什么放弃了在机器人领域的努力。OpenAI 的联合创始人和首席技术官 Ilya Sutskever 最近被问到在机器人领域为什么他们不能取得令人满意的进展。问题出在哪里呢?其实就是没有足够的高质量数据源。Ilya 说:“当时在机器人领域继续推进工作真的是巧妇难为无米之炊,因为那时可用的数据太少了。当时如果你想在机器人领域做研究,你首先需要成为一家机器人技术公司。你需要有一个很大的团队来工程制造机器人并对其进行维护。即使这样,如果你拥有 100 台机器人,这已经是一个巨大的运营了,但你得到的数据仍然不会很多。因此,在一个大部分人工智能的进展都来自计算和数据的世界中,在机器人领域,没有看到已有的数据路径可走。” OpenAI 的另一位联合创始人 Wojciech Zaremba,当时是机器人项目的负责人,说:“ 事实证明,只要我们有数据,我们就可以取得巨大进展。” 他解释说,因此对我们更有意义的是专注于 “ 已有大量数据的领域 ”。

深科技超自然,赞25如果一家创业公司能够快速、廉价、独特地方式生成某个领域所需的数据,以训练和微调人工智能模型,他们就能释放出令人难以置信的价值。确保你拥有训练模型所需的数据集的所有权的最好方法是自己生成。在原子世界中构建和工作可以帮助实现这一目标。范阳注:至少在这个阶段,和当下更多经济体发展和普通人生活的需要来看,进入到真实世界和人类生活,帮助创造和探索新的可持续经济发展的 real world AI, 可能才是通用人工智能初级阶段的正途。

来源:https://mp.weixin.qq.com/s/quGlelP5BQgjJUjKKws5tg

评论

所有评论

推荐阅读

  • Polymarket周一将发布重大公告

    3 月 21 日,Polymarket 团队成员 Mustafa 发文表示,将于周一公布一项「重大公告」,具体内容尚未披露。

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)