科技界的一些事情会令人震惊,但并不出乎意料--想想一个陷入困境的公司的首席执行官失去工作。当然,这个消息虽然是出乎意料,但如果你仔细想想也是有道理的。然而,其他新闻才是令人震惊和意外的,谷歌2月份在巴黎的主题演讲--这似乎是对微软gpt支持的必应声明的恐慌回应——两者兼而有之。
令人震惊的部分是演讲部分的糟糕程度:陈旧的内容,幻灯片和扬声器不同步,当一位演讲者开始演示时,才意识到他们没有手机可以演示,这场演讲真的挺失败。
令人惊讶的是,谷歌在人工智能方面会损失之大,这不仅仅是因为人工智能似乎是谷歌的最佳选择:事实上,谷歌多年来一直在谷歌I/O大会上特别谈论人工智能,而且我一直认为该公司对其工作的框架令人印象深刻。回到2016年,当时我摘录了首席执行官桑达尔-皮查伊(Sundar Pichai)对机器学习如何用于其产品的长篇大论,并写道:
“请注意具体内容--对于一场主题演讲来说,这个内容似乎太多了,但这绝对不是废话。毫不奇怪:Pichai所谈的一切正是谷歌创建时要做的事情。这与鲍尔默感叹他有多爱Windows没有什么不同:那是微软使命的产品代表,这种观点也许只是给予被罢免的CEO一丝宽慰,因为他无法继续前进。
接下来的30分钟很精彩: Google Now,尤其是Now on Tap,给人留下了深刻印象,Google Photos看起来也很不错。而且,我想补充的是,它有一个致命的标语: Gmail for Photos。当你在做你本该做的事情,以及你在世界范围内最擅长的事情时,很容易搞清楚。”
两年后,我称谷歌I/O大会很无聊,但其实这是对它的赞美:
这就是为什么我认为Pichai的 "无聊 "开场是一件好事。不,没有早期谷歌I/O的好战性,坚持认为安卓可以对抗iPhone。也没有上周纳德拉的宏伟愿景,或苹果产品发布会的兴奋感。有的只是一种确定性和近乎舒适的感觉: 鉴于Pichai认为未来是关于人工智能的,特别是在数据上运行的机器学习变体,这意味着谷歌将在这个新世界中取得成功,只需做自己。对于一个人和一个公司来说,这是最好的地方。
那一年,谷歌发明了转换器,这是支撑支持ChatGPT的大型语言模型的关键发明,这个产品在过去六个月中似乎让谷歌陷入慌乱。今年的谷歌I/O大会令人印象深刻的是,它成功地将谷歌过去几次I/O大会的引人注目之处--其清晰的人工智能能力和体现这些能力的产品——与你所需要的紧迫感和进取心结合起来。 希望看到一家公司多年来第一次感到受到威胁。
谷歌的人工智能发展
我在上面提到过,谷歌将谷歌照片介绍为照片的Gmail;在Pichai的开幕词中,我最喜欢的两张幻灯片显示了这两种产品是如何证明谷歌不断发展的AI能力的。Gmail从 "智能回复 "到 "智能撰写 "再到 "帮助我写作":

谷歌的Gmail人工智能发展历程
谷歌照片从 "查找照片 "到 "魔术橡皮擦 "再到 "魔术编辑器":

谷歌照片的人工智能进展
这是一种非常聪明的方式,以加强谷歌在人工智能方面已经有一段时间的想法,这是真的!这也提醒我们,谷歌在人工智能方面的一个特点是,它是一个非常重要的组成部分!这也提醒我们,谷歌的一大优势与微软的优势相吻合:该公司有一堆面向用户的产品,在其中以真正有用的方式展示人工智能能力。Pichai指出,谷歌有15种产品,拥有超过5亿用户:
谷歌的15种产品拥有超过5亿用户

还有六个产品拥有20亿用户:

谷歌的六种产品拥有超过20亿的用户
不过,主题演讲中最值得注意的部分也许是皮查伊的开场白:
作为一家AI-first的公司,我们的旅程已经进行了七年,我们正处于一个激动人心的拐点。我们有机会使人工智能对人、对企业、对社区、对每个人都更有帮助。一段时间以来,我们一直在应用人工智能,使我们的产品从根本上变得更有帮助。有了生成性人工智能,我们正在迈出下一步。我们正以一种大胆而负责任的方式,重新构想我们所有的核心产品,包括搜索。
值得注意的是,在 "负责任 "之前加上了 "大胆";谷歌I/O大会传达的首要信息是,谷歌要赢得胜利,正如皮查伊所说,这包括搜索。
生成性人工智能和搜索
在2019年谷歌I/O大会之后--我也觉得印象深刻--我提出了谷歌的长期商业模式问题:
更重要的是,虽然Google Assistant继续给人留下深刻印象--将一切都放在设备上,有望在速度上取得重大突破,这是当今Assistant的一个主要限制因素--完全不清楚谷歌的商业模式是什么。很难想象有什么东西能像搜索广告那样赚钱,它不仅受益于精确的目标定位--更是用户可以明确地说出他们想要什么!而且还有一种拍卖的形式,即利用用户来挑选赢家,并激励这些赢家为与用户形成持续关系的机会而支付过高的费用。
正如我所料,谷歌正在采取一种混合方法:大多数搜索都不是商业性的,所以谷歌要把生成的文本直接放在最前面:

谷歌的生成性人工智能搜索结果
对于那些确实具有商业可能性的搜索,广告仍然会被放在首位:

谷歌的生成性人工智能搜索结果,还是将广告置于顶部
这似乎是一个合理的方法,因为非商业搜索更有可能从人工智能中受益;这也是一个看起来比微软在传统搜索边上嫁接Bing Chat更有说服力的方法,是的,也更大胆。
当然,微软实际上已经推出了其新的搜索体验,Satya Nadella对蚕食谷歌的市场份额和利润率的渴望仍然是一个威胁:生成这些答案需要钱,谷歌的模型在同类产品上可能仍落后于GPT-4。不过,这个演示和今年的谷歌I/O大会都是对Sam Altman在必应发布后接受Stratechery采访时所说的话的一个相当有力的回应:
“我认为这对我们双方来说都是很好的。我认为这对我们双方都有很大的发展空间。我们将发现这些新模式能做些什么,但如果我坐在一个“昏昏欲睡”的搜索垄断地位上,不得不考虑一个世界,在这个世界上,这种工作的货币化方式和新的广告单位将面临真正的挑战,甚至可能是暂时的下行压力,我不觉得这会很好。”
这些挑战仍然存在,但至少 "昏昏欲睡的搜索垄断者 "已经醒来了。
持续的和颠覆性的创新
如果有一件事是每个人都肯定的,那就是人工智能将会非常具有颠覆性;不过,在1月份的《人工智能与五大行业》中,我注意到人工智能似乎更有可能成为一种持续的创新:
2022年的故事是人工智能的出现,首先是图像生成模型,包括DALL-E、MidJourney和开源的Stable Diffusion,然后是ChatGPT,第一个以重大方式突破的文本生成模型。在我看来,这显然是一个新的技术纪元。
为了确定这个时代如何发展,回顾一下26年前最著名的战略书籍之一是很有意义的: 克莱顿-克里斯坦森(Clayton Christensen)的《创新者的困境》(The Innovator's Dilemma),特别是关于不同种类创新的这段话:
大多数新技术促进了产品性能的提高。我称这些技术为持续性技术。一些维持性技术可能具有连续性的或激进性,而其他的技术则是渐进的。所有维持性技术的共同点是,它们根据主要市场的主流客户历来重视的性能维度,改善现有产品的性能。特定的行业的大多数技术进步都具有持续性。
颠覆性技术给市场带来了与以往非常不同的价值主张。一般来说,颠覆性技术在主流市场上的表现不如成熟产品。但它们有一些边缘(一般是新)客户看重的其他特点。基于颠覆性技术的产品通常更便宜,更简单,更小,而且经常使用起来更方便。
通过观察创新进入市场后现有公司的表现,似乎很容易回顾并确定一项创新是维持性的还是破坏性的:如果创新是维持性的,那么现有公司就会变得更强大;如果是破坏性的,那么估计初创公司会获得大部分价值。
我在那篇文章中的结论是,人工智能将是苹果、亚马逊、Meta和微软的持续创新;最大的问题是谷歌和搜索:
那篇文章假设Google Assistent将作为独家产品用于区分谷歌手机;这最终是错误的,但基本分析仍然有效。在过去的七年里,谷歌的主要商业模式创新是将越来越多的广告塞进搜索,这在移动设备上是一个特别有效的策略。而且,公平地说,谷歌挣钱最多的那种搜索--旅游、保险等--可能无论如何都不太适合聊天界面。
不过,这只会增加谷歌管理层的担忧,即在特定的搜索背景下下,生成性人工智能可能代表一种颠覆性创新,而不是一种可维持性创新。颠覆性创新,至少在开始的时候,不如现有的创新好;这就是为什么它很容易被经理们驳回,他们可以通过(正确的!)告诉自己,他们目前的产品更好,来避免思考商业模式的挑战。当然,问题是颠覆性的产品会变得更好,即使在职者的产品变得越来越冗杂和难以使用--这听起来当然很像谷歌搜索目前的轨迹。
我不是在为谷歌叫好;我以前也确实这么做过,但错得很离谱。不过,出错往往是时间问题:是的,谷歌有它的云服务,YouTube的主导地位似乎只是在加固,但搜索的峰值轮廓似乎很清楚,即使它浪费现金和利润多年。
也可能不是。我倾向于认为,颠覆性创新实际上相当罕见,但当它们到来时,在位公司基本上不可能做出反应:它们的商业模式、股东和最重要的客户让管理层不可能做出反应。不过,如果这是真的,那么在位者的回应实际上就证明了一项创新实际上不是破坏性的,而是持续性的。
为此,我认为这次谷歌I/O大会证明人了工智能实际上是包括谷歌在内的所有大型科技公司的一项可持续技术。此外,如果真的是这样的话,那就有理由不那么悲观地看待这家搜索公司,因为所有期待他们拥有领导地位的理由--从能力到数据到基础设施到大量的消费者接触点--仍然存在。不过,目前搜索所面临的挑战--特别是其广告模式--仍然存在。
改革或结盟
我一直在思考的另一个问题是,人工智能是否是Carlota Perez在《技术革命和金融资本》中所记载的那种技术革命。
传统观点再次认为,人工智能代表了一种全新的范式;比尔-盖茨这样的大人物也曾写道:"人工智能的发展就像人类社会发展的根本一样:
人工智能的发展与微处理器、个人电脑、互联网和移动电话的诞生一样具有根本意义。它将改变人们工作、学习、旅行、获得医疗保健和相互交流的方式。整个行业将围绕它重新定位。企业将通过他们如何很好地使用它来区分自己......
我很幸运地参与了个人电脑革命和互联网革命。我对这一时刻同样感到兴奋。这项新技术可以帮助世界各地的人们改善他们的生活。同时,世界需要建立道路规则,以便人工智能的任何缺点都远远超过它的好处,并使每个人都能享受这些好处,无论他们住在哪里或有多少钱。人工智能时代充满了机遇和责任。
盖茨暗示,个人电脑革命、互联网革命和人工智能革命不是连续的事件,但它们也可以被视为数字化的决定性经济特征--零边际成本--在信息方面的三种应用:
- 个人电脑允许零边际成本的信息重复;这就是文字处理器和电子表格以及盖茨擅长的其他生产力应用等突破的基础。
- 互联网允许信息的零边际成本分配。这导致了基于丰富性而非稀缺性的市场,产生了像谷歌这样的聚合器。
- 人工智能是零边际成本的信息生成(嗯,相对于人类而言几乎是零)。正如我去年所写的,生成模式将想法的创造与想法的证实分开,然后可以在零边际成本下进行复制和传播。
此外,这三次革命必须以这样的顺序出现:如果没有不同的计算机,互联网的概念就没有意义,而这些人工智能模型是在互联网上训练的。
我还要指出,这一进展与我在2020年的《起点的终点》中提出的论点一致:我在那篇文章中的论点是,各种科技革命都是同一趋势的表现,即到处都是持续的计算;我在那篇文章中没有提到人工智能,但人工智能似乎是一种持续的创新,这支持了这样的观点:科技之初的大赢家将是未来科技发展的基础。
佩雷斯则认为,目前的革命仍处于安装阶段(我在这篇文章中阐述了她的论点);对她来说,缺少的成分是同政府的一起协调以及政府单方面的协调。
Bard和欧盟
谷歌的其他I/O公告之一是其ChatGPT的竞争对手Bard的广泛可用性。更有趣的消息是查不到它的出处;来自Android Authority:
谷歌在其I/O开发者大会上宣布,其Bard聊天机器人将在180个市场广泛使用。这标志即时该平台最初的发展很有限,但现在有了重大扩展。不过,加拿大和欧洲没有出现在支持的市场名单上。现在,谷歌在回复Android Authority询问的电子邮件中暗示了这些遗漏的可能原因。谷歌的一位发言人指出如下:
Bard很快就能支持40种顶级语言,虽然我们还没有最终确定扩展计划的时间表,但我们将逐步和负责任地推出它,并在我们共同驾驭这些新技术的过程中,继续成为监管机构的有益和参与的合作伙伴。
该公司声称它是 "对监管机构有帮助和参与的伙伴",这表明Bard由于监管方面的考虑,暂时跳过了欧盟和加拿大。
再一次有一种传统的看法:"哈哈愚蠢的欧洲和它的法规意味着它将错过人工智能",而且,就目前而言,这显然是真的。不过,这似乎是一个安全的赌注,谷歌、微软、Meta和其他科技巨头确实将成为 "对监管机构有帮助和参与的伙伴",以实现其最终的利益。毕竟,考虑一下这些法规可能是什么样子的,从加拿大和同一篇文章中的这段话开始:
加拿大立法者最近推出了旨在监管人工智能的立法。人工智能和数据法案(AIDA)规定了围绕人工智能系统的评估、风险管理、监测、数据匿名化、透明度和记录保存做法。人工智能和数据法案还将引入惩罚措施,最高可达公司全球收入的3%或1000万美元。
这是大量的繁文缛节,对谷歌等公司来说,管理起来肯定会很烦,但考虑到他们的规模和资源,也是很容易管理的;在欧盟,拟议的人工智能法将有更大的监管负担。
值得注意的是,我在上面追踪的技术弧线正向更多的政府控制倾斜: 个人电脑赋予了个人难以置信的自由和能力,但互联网演变为以聚合器为中介的网络,使政府有了明显的控制点,无论是在中国,还是在西方大部分国家,都可以推动对传播的控制。同时,人工智能在很大程度上集中于主要参与者,意味着对信息的实际生成有直接的控制。
这使Perez的论点得到了证实,即信息技术革命尚未实现政府调整:这在以前在结构上是不可能的。上述调整是否真的像Perez预测的那样意味着一个即将到来的 "黄金时代",还有待观察。值得注意的是,这种调整变得具体化非常符合谷歌的利益:阻止真正的颠覆性技术的最好方法是将其监管起来。
人工智能的彻底改革
欧盟法规的另一个方面似乎更加险恶。
作为一个大胆的举措,欧盟修订后的人工智能法案将禁止OpenAI、亚马逊、谷歌和IBM等美国公司提供生成性人工智能模型的API访问。如果未经许可的生成模型在欧洲可用,修正后的法案将于周四被委员会否决,将制裁美国的开源开发商和软件分销商,例如 GitHub。虽然该法案包括传统机器学习模型的开源例外,但它明确禁止开源生成系统的安全港条款。
任何在欧盟提供的模型,如果没有首先通过广泛和昂贵的许可,将使公司遭受巨大的罚款,罚款金额为2000万欧元或全球收入的4%,以较高者为准。开放源码开发商和GitHub等托管服务--作为进口商--将为提供未经许可的模型而承担责任。从本质上讲,欧盟正在命令大型美国科技公司让美国的小企业破产,并威胁要制裁美国科技生态系统的重要部分。
如果这条法案颁布,执法权将脱离欧盟成员国的掌控。根据《人工智能法》,第三方可以起诉国家政府,迫使其缴纳罚款。该法案具有治外法权。欧洲政府可以在第三方的强迫下寻求与美国开发商和企业的冲突。
这是一个相当有爆炸性的指控,但作者Delos Prime引用了拟议中的法律来支持它,我认为这是一个合理的解释。就像这样的提案一样,没有明确的语言,比如说,禁止API访问;相反,Prime的结论是,这是有效的结果,比如说,API供应商要对其API的所有使用负责,就像开源作者和分销商要对其模型的所有使用负责。
美国将如何回应这样的法律显然是一个非常重要的问题:有理由认为,让美国公司为简单的开源模式承担责任是对主权的公然侵犯;我相信欧盟会争论说,美国互联网公司有效地输出美国的价值观,如言论自由,是完全相同的事情。
这就是历史值得考虑的地方,特别是我一直认为与互联网最相似的发明:印刷术。我在《互联网和第三产业》中写道:
在中世纪,欧洲的主要组织实体是天主教会。与此相关的是,天主教会也在事实上垄断了信息的传播:大多数书籍都是拉丁文,由僧侣们辛苦地手工抄写。各个贵族成员和他们土地上的平民之间有一定程度的种族亲和力,但在天主教会的保护伞下,主要是独立的城邦国家。
印刷机改变了这一切。突然间,马丁-路德对天主教会的批判与100年前的扬-胡斯惊人地相似,他的信仰不再局限于在当地(就胡斯而言是布拉格)传播,而是可以看到这些信仰在整个欧洲传播;贵族们抓住机会,以适合他们当地利益的方式解释圣经,逐渐摆脱天主教会的控制。
同时,印刷书籍的经济性与手工复制的经济性有着根本性的不同。后者纯粹是一项业务开支:产出严格地由劳动力的投入决定。而前者则主要是资本支出:首先是建造印刷机,其次是为一本书设置字体。支付这些重要的前期费用的最佳方式是生产尽可能多的可以出售的特定书籍的副本。
那么,如何最大限度地增加可销售的数量呢?答案是使用最广泛使用的特定语言的方言进行印刷,这反过来又激励了人们采用这种方言,使整个欧洲的语言标准化。这样一来,就加深了拥有共同语言的城邦之间的亲和力,尤其是在数十年间,围绕着书籍和后来的报纸形成了一种共同的文化。这种巩固的速度各不相同--英格兰和法国比德国和意大利早了几百年--但几乎在每一种情况下,第一阶层都不是天主教会的神职人员,而是国家君主,即使是在君主将权力交给以伯克为代表的新型功勋贵族的时候。
这场动荡的高潮是《威斯特伐利亚和约》,威斯特伐利亚体系的名称由此而来;引用于维基百科:
威斯特伐利亚体系是国际法中的政治秩序,即每个国家对其领土拥有专属主权,并垄断了进行战争的能力。这一原则是在1648年威斯特伐利亚和平之后在欧洲发展起来的,其基础是让-博丹的国家理论和雨果-格鲁修斯的自然法学说。它是现代国际主权国家体系的基础,并体现在《联合国宪章》中,其中规定:"没有任何东西......授权联合国干预本质上属于任何国家国内管辖的事务。"
威斯特伐利亚体系面临着许多的挑战,从全球化到人道主义干预到互联网。欧盟监管人工智能的尝试是一个完美的例子:鉴于互联网没有边界--无论如何,在防火墙之外--欧盟似乎准备让美国公司为在美国服务器上发布的模型承担责任;就谷歌而言,它暂时发现单方面不为欧盟服务是明智的,以免它面临OpenAI所面临的同样挑战。
在某种意义上,这场斗争可以被类比为欧洲的新教和天主教之争;在这种情况下,美国的科技公司是普遍的互联网,而欧洲则在寻求保护其主权。或者,你更喜欢相反的比喻,欧洲正在寻求向世界其他地方输出它的信仰,而且,考虑到到处都有一种产品的经济激励,很可能会成功(见cookie横幅)。
不过,开源部分是截然不同的:在本地运行的开源模式可能是Apple的一大福音,但它们是对谷歌和OpenAI等中心化公司的真正颠覆性威胁。换句话说,他们是不同于监管机构和中心化运营商的第三方力量; 他们是激进的改革。
我在阅读Owen Cyclops关于美国宗教的这一引人入胜的主题时,产生了这个想法。很难找到一个单一的推特来捕捉这个话题,但Cyclops的观点是,印刷术导致了三个不同的宗教团体:天主教徒、新教徒,然后是一大批受到两者迫害的边缘团体,并由此在美国历史上发挥了突出作用。
在这种观点下,将印刷术的影响应用于现代欧洲的形成是不完整的;你还必须考虑边缘群地区,也就是美国。
而且,推而广之,如果数字转型,从个人电脑到互联网到人工智能,具有与印刷术类似的影响,那么眼前的问题就不仅仅是民族国家向前发展的性质,而且还有边缘地区的潜力。
诚然,这是一篇颇具推特性和影响深远的文章,特别是考虑到我从谷歌I/O开始。不过,我认为很有意义的是,谷歌明确表示它将人工智能视为一种持续的创新,并打算在其业务中全面实施生成性人工智能,包括搜索。当然,这意味着在这一背景下还会有竞争:我们从这些大型科技公司看到的积极性和竞争力,与前十年的停滞不前相比是一个令人耳目一新的变化。
同时,所有的大科技公司都加入了进来,而且鉴于他们的超国家性质,将不可避免地被激励成为 "对监管者有帮助和参与的伙伴",这一事实表明,真正的斗争将是集中模式和开放源码之间的斗争:普世天主教会和民族宗教新教徒有他们的冲突,但他们在蔑视再洗礼派等方面是统一的。
在这种观点下,这些拟议的欧盟法规仅仅是可能成为数字时代决定性战争的第一枪:集中化--因而可控--的实体将获胜,还是会在开放模式的边缘开花结果,知道真正探索人工智能的潜力,无论好坏。
所有评论