Cointime

扫码下载App
iOS & Android

英伟达又要赚翻了,国产GPU谁能分一杯羹?

北京时间3月21日晚11点,英伟达2023春季GTC大会正式上线,英伟达CEO黄仁勋围绕AI、量子计算、芯片等前沿科技,发布了一系列前沿技术和产品,包括:四款AI推理芯片、三个大模型云服务、超级计算机,以及针对场景优化的应用100个、更新功能的工业元宇宙Omniverse。其中最重磅的,就是针对ChatGPT打造的、提速10倍的NVIDIA H100 NVLIN芯片。

在半导体下行周期,ChatGPT以摧枯拉朽之势,迅速拉升高算力GPU需求,在这样的关键时刻,手握GPU算力技术的英伟达已成最大赢家。

据中国台湾电子时报报道,微软等客户对英伟达A100/H100芯片需求强劲,后者订单能见度已至2024年,更紧急向代工厂台积电追单。英伟达GPU已陷入严重短缺。

GPU短缺再掀缺芯潮,厂商打响价格战

现代的GPU拥有两大功能,一是充当强大的图形引擎,广泛应用于游戏、图像处理和加密货币等场景。二是用作高度并行的可编程处理器,处理各种神经网络或机器学习任务,主要应用在大规模人工智能计算、数据中心及超算等场景,以支持更大的数据量和并发吞吐量。

最近一个月,AI技术接二连三地刷爆科技新闻版面。从ChatGPT,到百度发布文心一言,再到微软发布Office的AI助手Microsoft 365 Copilot,以及Midjourney发布能“画手指”的V5版本,甚至谷歌也上线了Bard聊天机器人接受排队测试。

这对于GPU厂商来说,毫无疑问是值得期待的算力红利。调研机构TrendForce在一份报告中提到,GPT-3训练时大概用到了20000个NVIDIA A100 GPU左右的算力,而ChatGPT商业化后所需的GPU数量将达到30000个以上。

同时,有人猜测推理环节是否需要双倍甚至更多的GPU,毕竟从刚刚面试不久的GPT-4来看,其推理功能显然更加先进。

另有消息指出,由于需求激增,博通与英伟达的GPU网络设备供应严重短缺,即便两家公司正全力扩产,但供需鸿沟依然极大。微软为了给新版必应聊天机器人与新款Office365留下足够资源,内部已陷入AI服务器短缺,甚至必须对GPU采取“配额供给”机制。分析师Dylan Patel指出,微软为新Office Copilot部署的GPU并不能支撑一年,公司会在模型大小与质量上作出“重大妥协”。

英伟达GPU已陷入严重短缺,可能已超出了三个多月前所有人的预期。

甚至有人以2021—2022年席卷全球的缺芯潮,来类比眼下的GPU短缺:成千上万的AI初创公司、甚至是大型云服务商,将如当年因缺少关键芯片而停产的车企,或因缺少GPU面临相似困境。

极度焦虑之下,多家公司已开始寻求AMD等其他品牌的替代品。而为了揽客,英特尔已率先掀起了GPU价格战。J. Gold Associates分析师Jack Gold表示,英特尔的GPU定价“相当激进,尤其是一些低端产品”;一些超大规模的厂商很有可能会向自家客户提供英特尔的高端GPU。

英伟达是是GPU概念的提出者,也是全球独立GPU的绝对领导者。AMD一直是独立GPU的第二大供应商,且一直保持着高速成长步伐,2022年AMD数据中心事业部的营业额实现了高达64%的同比增长。英特尔一直是全球最大的集成显卡供应商,在宣布重返独立GPU市场后,推出了面向数据中心和 AI 的Xe HP架构以及面向高性能计算的Xe HPC架构。与此同时,乘着AI东风崛起的一批中小GPU企业,也对新的市场机会虎视眈眈。

国产GPU达到什么水平

GPU是数码爱好者茶余饭后的一项乐趣:“一卡一栋楼,两卡毁地球,三卡银河系,四卡创世纪”。它曾一度挑战甚至超越同时期的CPU,它曾让无数游戏玩家为之疯狂,它也正向更深、更广领域延伸触角。

GPU不仅在当下是一门空间广阔的生意,未来更是潜力无限。

根据Verified Market Research数据显示,从2021年到2030年,GPU将以33.3%的年复合成长率,从330亿美元成长至4773亿美元。

一直以来,GPU市场由国外巨头垄断,桌面级GPU市场被英伟达、AMD和英特尔所垄断,移动级GPU市场被Arm、Imagination和高通所垄断。在软件层面,上述国外公司也对如CUDA和OpenCL等一系列异构计算标准提供了支持。

行业早已苦垄断久矣,近两年,国内掀起GPU融资潮。

从2020年开始,GPU便成为国内芯片领域“最吸金”的赛道之一,融资总额已超过200亿元。据统计,仅2020—2021年,通用GPU领域就有近20起融资事件发生。市场研究公司Verified Market Research的数据显示,2020年中国大陆的独立GPU市场规模为47.39亿美元,预计2027年将超过345.57亿美元。

01

景嘉微:中国第一家成立的GPU公司

2015年该公司推出了第一代GPU,称为JM5400,采用65nm CMOS工艺制造。

公司产品主要分为图形图像处理系统、小型雷达系统、GPU芯片,广泛应用于军工行业。公司图形显控领域产品包括图显模块和加固类产品,其中图显模块是核心产品。

2022年前三季度营,景嘉微营收约7.29亿元;归属于上市公司股东的净利润约1.73亿元。相比英伟达2023财年第四财季营收超60亿美元,营收规模差距较大。

公司称,基于在图形处理芯片设计领域十余年的技术积累,目前已成功自主研发JM5400、JM7200和JM9系列三代图形处理芯片,实现在专用领域和通用领域的广泛应用。

02

海光信息:基于通用GPGPU架构,推出深度计算处理器DCU

海光信息的DCU也属于GPGPU的一种,其DCU协处理器全面兼容ROCm GPU计算生态。

据悉,ROCm和CUDA在生态、编程环境等方面高度相似,CUDA用户可以以较低代价快速迁移至ROCm平台,因此ROCm也被称为“类CUDA”,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。

目前公司的系列产品“深算一号”已经实现商业化应用,主要应用于大数据处理、人工智能、商业计算等应用领域。海光DCU系列产品已于2021年实现商业化应用。

03

龙芯中科:国内PC CPU龙头,自主研发GPGPU产品

公司2022年上半年完成了第一代龙芯图形处理器架构LG100系列图形处理器核的研制,并随7A2000芯片产品发布。基于龙芯最新一代的LG100三维GPU核,完成了GPU驱动、显示需求和系统配套组件的研发,可满足日常桌面办公使用需求,提高产品性价比和商业竞争力。

龙芯中科透露,目前已启动第二代龙芯图形处理器架构LG200系列图形处理器核的研制。

04

壁仞科技

壁仞科技创立于2019年,团队由国内外芯片和云计算领域核心专业人员、研发人员组成,截止2021年末,壁仞已完成总额超50亿元人民币的融资。

从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。

2022年8月,壁仞科技在上海发布首款通用GPU芯片BR100,该芯片集成了770亿个晶体管,其16位浮点算力能达到1000T以上、8位定点算力能达到2000T以上,单芯片峰值算力达到了每秒千万次计算(PFLOPS)的级别。

05

沐曦

沐曦成立于2020年9月,其研发的高性能GPU芯片可应用于AI推理、AI训练、高性能数据分析、科学计算、数据中心、云游戏、自动驾驶、元宇宙等众多需要高算力的前沿领域。

沐曦的三位创始人均来自AMD公司,曾完整负责10多款世界顶尖高性能GPU产品开发及应用落地,拥有丰富的5nm流片和7nm芯片量产经验。

产品方面,沐曦第一颗高性能通用GPU芯片MXN于2022年1月顺利流片,采用7nm工艺,以AI推理为主,公司预计2023年量产。第二款主要用于科学计算、AI训练、数据中心弹性计算的旗舰GPU芯片MXC的研发也进入收尾阶段,公司计划2023年会进入量产。

06

芯动科技

芯动科技的技术研发团队包括前AMD图形框架开发领军人物。

公司2021年发布了国产显卡GPU——“风华1号”,面向桌面、服务器市场,采用12nm制造,架构授权来自Imagination。 

风华1号芯片的FP32 浮点算力为5T FLOPS;渲染能力为160G Pixel/s;编解码能力:同时4路4K60帧,16路1080P60帧,32路720P30帧;AI 计算的算力为25TOPS(INT8)。

07

摩尔线程

摩尔线程创始人是前英伟达公司全球副总裁、中国区总经理James Zhang,核心成员主要来自NVIDIA。

2022年3月,摩尔线程推出MUSA架构,基于MUSA统一系统架构苏堤核心晶片打造了数据中心级多功能GPU产品MTT S2000。MTT S2000采用12nm制程,使用4096个MUSA核心,最大配置32GB显存,FP32单精度算力最高可达到12TFlops,支持H.264、H.265、AV1多路高清视频编解码,以及广泛的AI模型算法加速,支持PyTorch、Tensorflow、PaddlePaddle等主流深度学习框架。

08

天数智芯

天数智芯于2020年12月成功点亮国内第一款7nm云端训练通用GPU产品“天垓100”,并于2021年3月正式对外发布。目前已经实现大规模量产和销售,截止至2022年3月底,已实现销售订单近2亿元,并且帮助客户落地了两百多个应用场景。

天垓100芯片采用全自研的架构、计算核、指令集及基础软件栈,不受国外IP制约。

天数智芯的第二款产品7nm云边推理芯片“智铠100”在2022年5月成功点亮,目前在开发第二三代AI训练芯片天垓200及300。

09

登临科技

登临成立于2017年底,专注于高性能通用计算平台的芯片研发与技术创新。登临首款基于GPU+的创新AI计算加速器-Goldwasser已规模化运用在边缘至云计算的各个应用场景,填补了国内高性能GPGPU领域技术、产品及商业方面的空白。

登临第二代产品将于2023年上半年进入市场,其能效比将是第一代产品的2倍。

10

芯瞳半导体

2020年8月,芯瞳半导体第一代GPU芯片GenBu01问世。enBu01显卡平均功耗3W,为应用提供超长续航能力,满足对功耗有特殊需求的场景;满足国产操作系统2D显示、3D渲染需求,支持OpenGL 4.3图形标准、1080P高清显示、多窗口显示、具有VGA和HDMI双路显示输出接口等,集成1GB DDR3存储等。

据悉,芯瞳半导体的第二代芯片正在研发阶段,预期2023年完成市场化应用。

写在最后

可能让英伟创始人都未曾预料到的是,成立30年后,在半导体遭遇罕见逆风的当下,让英伟达股价飞升、市值超越英特尔、撑起财报表现的,不是游戏显卡,而是包含AI加速、高性能计算、超算等业务的数据中心业务。

正如黄仁勋在本次演讲中所说“生成式AI正在推动AI的快速应用,并重塑无数行业。”“我们正处于AI的‘iPhone时刻’,初创公司竞相构建具有颠覆性的产品和商业模式,老牌公司则在寻求应对之策。”

当前,国内GPU芯片的研制虽然可满足目前大多数图形应用需求,但在科学计算、人工智能及新型的图形渲染技术方面仍然和国外领先水平存在不小差距。因为GPU真的很难设计和制造,它与CPU并称两大最难芯片。行业人士一致认为,造GPU比造CPU还难,对运算性能、安全性、稳定性要求极高,要复杂完整的系统设计,才可能完成。

以自动驾驶、AI智能等领域为主的商用及工业市场,是目前国内的强势区,国产GPU未来凭借在新能源汽车及相关领域的突破及份额提升,或许会走出一条与英伟达、AMD截然不同的发展道路。

评论

所有评论

推荐阅读

  • 数字资产高频交易公司ABEX完成600万美元新一轮融资

    总部位于英国伦敦的数字资产高频交易公司ABEX宣布完成600万美元融资,MMC Ventures领投,新资金拟用于其推出衍生品交易和算法执行解决方案,以提高中心化和去中心化金融场所的交易执行效率,据悉该公司已在英国金融行为监管局 (FCA) 注册,允许从事加密货币交易活动。

  • BSC生态meme币BUBB市值触及3500万美元创历史新高,24小时涨幅516%

    3月21日消息,据 GMGN 行情信息,BSC 生态 meme 币 BUBB 市值短时触及 3500 万美元创历史新高,现报 3130 万美元,近 24 小时涨幅达 516%,24 小时成交量 4170 万美元。 今日凌晨,Binance 联合创始人何一在 X 平台与该 meme 币官推互动,并关注其官推。 meme 币无实际价值,价格波动较大,用户投资需谨慎。

  • 特朗普在数字资产峰会上发表的讲话已结束

    美国总统特朗普在数字资产峰会上发表的讲话已结束。

  • 多引擎Web3游戏平台PlaysOut完成700美元种子轮融资,Kenetic Capital等领投

    多引擎Web3游戏平台PlaysOut宣布完成700美元种子轮融资,Kenetic Capital、KBW Ventures等领投,Gam3Girl Ventures、Oak Grove Ventures、Aptos、Yugana Labs、Sentor Investments、Longling Capital等参投,估值达到7000万美元。新资金拟用于推动其弥合Web2和Web3之间的差距,使开发人员能够通过在链上构建资产并探索基于代币的激励、NFT集成和区块链驱动的经济来解锁货币化模式。

  • RedotPay完成4000万美元A轮融资,Lightspeed领投

    3月14日消息,据RedotPay官方公告,其已完成4000万美元A轮融资,由Lightspeed领投,HSG、Galaxy Ventures、DST Global Partners、Accel、Vertex Ventures等参投。本轮融资将用于加速全球加密支付解决方案的扩展。 RedotPay成立于2023年4月,已发展超300万用户,提供无缝的加密货币支付及法币转换服务,致力于为无银行账户群体提供金融服务。

  • 监控技术公司 Flock Safety 获 A16z 领投 2.75 亿美元融资

    总部位于亚特兰大的监控技术公司 Flock Safety 完成了由 Andreessen Horowitz (A16z) 领投的 2.75 亿美元融资,公司估值达到 75 亿美元。参与此轮投资的还包括 Greenoaks Capital 和 Bedrock Capital。 至此,Flock Safety 累计融资额已超过 9.5 亿美元。公司计划于 2025 年开发美国本土制造的无人机,并在佐治亚州建设一座面积 10 万平方英尺的制造工厂。该公司专注于提供基于人工智能的安全监控解决方案,主要面向政府和企业客户。

  • 特朗普加密项目WLFI已结束公开发行,总融资额达5.5亿美元

    据官方网站显示,特朗普家族加密项目 World Liberty Financial 已完成全部社区公开发行融资(此前曾追加一轮),总融资额达 5.5 亿美元。

  • nunu.ai完成600万美元种子轮融资,TIRTA Ventures与a16z speedrun领投

    据nunu.ai 官方消息,该公司已完成600万美元种子轮融资,由TIRTA Ventures 和 a16z speedrun 共同领投,其他参投方包括 Factorial Funds、Y Combinator、Earthling、Hartmann Capital、FOV Ventures 和 New Renaissance Ventures。 nunu.ai 专注于人工智能、游戏与机器人技术的交叉领域,致力于构建首个能够测试和游玩游戏的AI智能体,推动游戏产业的智能化发展。

  • Cointime精选 ·

    发布1周年,一文理清ChatGPT时间线

    AI 元年,历史上的今天。

  • ChatGPT语音功能向所有用户免费开放

    OpenAI宣布,ChatGPT语音功能已向所有用户免费开放,用户可下载手机App使用该功能。