Cointime

扫码下载App
iOS & Android

微软将数万颗芯片串联成一台价格不菲的超级计算机用于OpenAI

Cointime Official

现在,这家软件制造商的云技术为公司和客户的人工智能产品提供支持,同时它还在组建一款后继产品。

当微软公司于2019年向OpenAI投资10亿美元时,它同意为这家人工智能研究初创公司建造一台大规模的尖端超级计算机。唯一的问题是:微软没有像OpenAI所需要的东西,也不完全确定它能在其Azure云服务中建造这么大的东西而不至于崩溃。

OpenAI试图训练一套越来越大的被称为模型的人工智能程序,这些程序正在吸收更多的数据,并学习越来越多的参数,即人工智能系统通过训练和再训练而发现的变量。这意味着OpenAI需要长期使用强大的云计算服务。

为了应对这一挑战,微软不得不想方设法将数以万计的英伟达公司(Nvidia Corp.)的A100图形芯片(训练人工智能模型的主力)串联起来,并改变其在机架上放置服务器的方式以防止断电。负责云计算和人工智能的微软执行副总裁Scott Guthrie不愿透露该项目的具体成本,但他说 “可能会大于”几亿美元。

微软Azure AI基础设施总经理Nidhi Chappell说:“我们建立了一个系统架构,可以在非常大的规模下运行和可靠。这就是ChatGPT成为可能的原因。这就是其中的一个模型。以后将会有很多很多其他的模式。”

这项技术让OpenAI发布了ChatGPT,这个病毒式的聊天机器人在去年11月上市后几天内就吸引了100多万用户,现在正被拉入其他公司的商业模式,从亿万富翁对冲基金创始人Ken Griffin经营的公司到食品配送服务Instacart Inc. 随着ChatGPT等生成型人工智能工具获得企业和消费者的兴趣,微软、亚马逊公司和Alphabet公司旗下的谷歌等云服务提供商将面临更多压力,以确保其数据中心能够提供所需的巨大计算能力。

现在,微软使用它为OpenAI建立的那套资源来训练和运行自己的大型人工智能模型,包括上个月推出的新的Bing搜索机器人。它还将该系统卖给其他客户。这家软件巨头已经开始着手开发下一代人工智能超级计算机,这是微软与OpenAI扩大交易的一部分,微软在其中增加了100亿美元的投资。

Guthrie在采访中说:“我们没有为他们建造一个定制的东西,它一开始就是一个定制的东西,但我们总是以一种方式来构建它,使任何想要训练大型语言模型的人都可以利用同样的改进。这确实帮助我们成为一个更好的人工智能广泛的云。”

训练一个大规模的人工智能模型需要像微软组装的人工智能超级计算机那样,在一个地方有一个大型的连接图形处理单元池。一旦一个模型投入使用,回答用户提出的所有查询(称为推理)需要一个稍微不同的设置。微软也部署了用于推理的图形芯片,但这些处理器(数十万个)在地理位置上分散在该公司60多个地区的数据中心。微软周一在一篇博文中说: 现在,该公司正在为人工智能工作负载添加最新的Nvidia图形芯片(H100)以及Nvidia最新版本的Infiniband网络技术,以更快地分享数据。

新的必应仍处于预览阶段,微软正在逐步从等待名单中增加更多的用户。Guthrie的团队每天与大约二十几名员工举行会议,他们被称为 “维修人员”,因为他们是在比赛中调整赛车的“机械师”。该小组的工作是弄清楚如何快速上线更多的计算能力,以及解决出现的问题。

Guthrie说:“这在很大程度上是一种集合,就像,'嘿,任何人有一个好主意,让我们今天把它放在桌子上,让我们讨论一下,让我们弄清楚,我们能在这里减少几分钟吗?我们可以减少几个小时吗?几天?”。

云服务依赖于数以千计的不同部件和物品(服务器、管道、建筑物的混凝土、不同的金属和矿物等各个部分)任何一个部件的延迟或短缺,无论多么微小,都会使一切都中断。最近,维修人员不得不处理电缆托架的短缺问题,这种篮子一样的装置用来放置机器上的电缆。所以他们设计了一种新的电缆盘,微软可以自己生产或找地方购买。Guthrie说,他们还在研究如何在全球现有的数据中心中尽可能多地压缩服务器,这样他们就不必等待新的创造。

当OpenAI或微软正在训练一个大型的人工智能模型时,工作在同一时间发生。它被分到所有的GPU上,在某些时候,这些单元需要相互交谈,以分享它们所做的工作。对于人工智能超级计算机,微软必须确保处理所有芯片之间通信的网络设备能够处理这种负载,而且它必须开发软件,使GPU和网络设备得到最佳利用。该公司现在已经提出了一个软件,可以让它训练具有几十万亿个参数的模型。

因为所有的机器都是一次性启动的,所以微软必须考虑到它们的放置位置和电源的位置。Guthrie说,否则就会出现数据中心的情况,就像你在厨房里同时打开微波炉、烤面包机和吸尘器一样。

Azure全球基础设施总监Alistair Speirs说,该公司还必须确保它能够冷却所有这些机器和芯片,并使用蒸发,在较凉爽的气候下使用外部空气,在炎热的气候下使用高科技沼泽冷却器。

Guthrie说,微软将继续研究定制的服务器和芯片设计以及优化其供应链的方法,以获得任何速度上的提高、效率和成本上的节省。

他说:“现在让世界惊叹的模型是建立在我们几年前开始建造的超级计算机上的。新的模型将建立在我们现在正在培训的新的超级计算机上,这台计算机大得多,将实现更多的复杂性”。

评论

所有评论

推荐阅读

  • 贝莱德向Coinbase存入价值2.26亿美元BTC和ETH,或将继续存入

    据 Onchain Lens 监测,贝莱德向 Coinbase 存入 2700 枚 BTC,价值 1.61 亿美元,以及 4.1996 万枚 ETH,价值 6516 万美元,并可能继续存入。

  • Strategy优先股STRC将于6月30日除息并重设月度股息率

    Strategy 的 STRC 优先股交易价格约为 73 美元,较 100 美元面值低约 27%,投资者关注与 6 月 30 日相关的两项事件。 STRC 将于 6 月 30 日除息,符合条件的持有人将于 7 月 15 日获得每股 0.48 美元派息;另一项事件是月度股息率重设,目前 STRC 有效收益率接近 15%,投资者预计 Strategy 将把股息率从 11.50% 上调至至少 12% 或 12.50%。(CoinDesk)

  • Framework Ventures完成4亿美元第四期基金募资

    6月26日,据《Fortune》报道,Framework Ventures已完成4亿美元第四期基金募资,用于支持新一代技术项目投资,标志着该机构进一步扩大投资范围,不再局限于加密资产领域。

  • OpenAI内部ChatGPT基本被废弃,99.8%的AI输出已由Codex接管

    6月26日消息,OpenAI 发布的经济学论文《The Shift to Agentic AI: Evidence from Codex》通过追踪智能体平台 Codex 的数据,揭示了知识工作模式的转变。工作的基本单位正在从单次对话,转变为向 AI 异步委托更长、更复杂的任务。 在 OpenAI 内部,智能体已彻底接管日常工作,传统聊天接口 ChatGPT 接近被废弃。截至 2026 年 6 月,内部员工每周生成的 Token 中有 99.8% 来自 Codex。其中工程师人均 Codex Token 占比达 99%,法务和招聘等非技术员工占比也超 85%。深度使用使员工开始像协调团队一样运行 AI,近 28.6% 的员工曾同时管理 5 个以上智能体,最重度员工的日均累计运行时间超 71 小时。 与 OpenAI 的极限状态相比,外部用户也在加速转向智能体。针对外部个人用户的抽样显示,估算耗时超 8 小时的人类工作任务提交比例在半年内从 2.1% 升至 25.6%。自 2025 年 8 月以来,外部个人和组织的非开发周活跃用户数分别暴增 137 倍和 189 倍。此外,以复用工作流为核心的 Skills 技能在全部 Codex 活跃用户中的使用率,在三个月内从 5.4% 跃升至 26.6%。

  • 2025年至今我国已经研制发布40余项人工智能国家标准

    6月26日,据央视,从国家标准委了解到,2025年至今我国已经研制发布40余项人工智能国家标准。在基础支撑领域,发布《人工智能 服务器系统性能测试方法》,孵化人工智能计算产品的性能测试基准,引导我国AI服务器生态向规模化、协同化方向升级。在关键技术领域,发布《人工智能 大模型》系列标准,统一大模型研发、评估、部署全流程规范,筑牢人工智能核心技术创新底座。在产品应用领域,出台《人工智能 终端智能化分级》标准,明确智能终端分级判定依据,有效甄别“伪智能”产品、规范市场秩序,同时为相关产业扶持政策落地提供支撑,带动终端产业链整体智能化升级。一系列重点标准推动人工智能技术从单点突破走向体系化迭代,有效降低行业研发成本与规模化落地门槛,全方位支撑产业规范有序发展。

  • 全球半导体市场规模今年或超10万亿元 半导体市场规模狂飙

    6月26日,据央视财经,世界半导体贸易统计组织近期发布预测称,受AI热潮拉动,2026年全球半导体市场规模将超1.5万亿美元,创历史新高。半导体行业正围绕AI需求加速重构。在存储芯片市场,行业研究机构的报告显示,今年第一季度主要品类“动态随机存取存储器”,也就是DRAM的市场营收规模达970亿美元,同比增长260%,创历史新高。其中三星电子占据约38%市场份额,位居第一;SK海力士和美光科技位列其后。据了解,三星电子已连续两个季度位居DRAM市场首位。逻辑芯片是半导体市场的另一大品类,涵盖CPU、GPU、AI加速器等各类用于执行逻辑运算的芯片。在AI加速器与数据中心赛道,英伟达凭借GPU主导训练市场。博通与美满科技在专业集成电路ASIC定制推理芯片领域占据主导地位。而在通用计算领域,英特尔在服务器CPU市场仍具有传统优势,但面临AI算力需求向GPU和ASIC转移的挑战。 世界半导体贸易统计组织本月初发布的报告预测,今年全球半导体市场规模将较2025年增长近90%,达到1.51万亿美元,约合人民币10.2万亿元,2027年将进一步增长26.6%,市场规模升至1.914万亿美元,约合人民币13万亿元。

  • 中央结算公司:将做市商对手方通过真实做市成交的现券交易结算服务费降低至7.5折

    6月26日,中央结算公司:为进一步降低做市商交易结算成本,中央国债登记结算有限责任公司(以下简称中央结算公司)决定将做市商对手方通过真实做市成交的现券交易结算服务费由8折进一步降低至7.5折。对真实做市交易的识别和认定,以中国外汇交易中心(全国银行间同业拆借中心)传送并经中央结算公司核对确认的数据为准。以上优惠措施自2026年7月1日起至2028年12月31日止有效。

  • 世界油阀通航量回升 油轮租金大幅跳涨

    6月26日,据央视财经,标普全球能源公司25日发布报告说,24日共有78艘船舶通过霍尔木兹海峡,创下美以伊战事爆发以来单日最高通航纪录。本月霍尔木兹海峡的船舶日均通航量已恢复至冲突前水平的约57%。据了解,霍尔木兹海峡通航量回升,叠加多国秋冬能源补库,国际油轮租金大幅跳涨,传导到国内上下游呈现冷暖分化。一方面航道局势缓和后,航运企业避险保费回落,叠加运价上涨,盈利空间上升。而炼化企业承压明显,海运成本抬升直接推高原油到岸价,压缩炼油加工利润。由于我国原油高度依赖进口,不少炼化企业仍抢抓当前窗口期加快原油补库。

  • STRC盘前交易价格触及73美元 创历史新低

    行情显示,STRC 盘前触及 73 美元,创历史新低;SATA 报 83.5 美元,为 2 月以来最低水平。Strive 在该熊市中继续支付每日股息。

  • 马光远:美联储的制度性变革,是未来数年全球资产最大的黑天鹅

    6月26日,经济学家马光远表示,黄金今年从高点回撤接近30%,白银更是腰斩。金银疲软的核心根源,不是地缘局势,而是美联储主席沃什强硬的信用重塑政策、高利率常态化、强美元虹吸效应的持续压制。 长期来看,若沃什顺利推进资产负债表收缩、通胀目标刚性落地、美联储体系改革,将彻底修复多年宽松透支的美元信用,从底层巩固美元全球霸权地位,利好美国长期货币体系、金融格局。但对全球资本市场而言,这意味着全品类资产定价逻辑彻底重构。当前美股看似仍在震荡走高,实则是市场严重低估了沃什结构性改革的深远影响。 沃什开启的美联储新时代,没有常态化宽松、没有市场兜底、没有模糊博弈,底层定价逻辑彻底改写。这场超越加息降息的制度性变革,才是未来数年全球资产最大的黑天鹅,也是最核心的定价主线。