Cointime

扫码下载App
iOS & Android

IO.NET项目投研报告

io.net是一个去中心化AI计算网络,支持在Solana区块链上开发、执行和扩展机器学习应用程序,它聚合来自未充分利用的资源(例如独立数据中心、加密矿工以及 Filecoin、Render 等加密项目)的GPU来解决这个问题。

io.net的主要卖点有:

  • 弹性组合:AI工程师可以自由挑选、组合自己所需要的芯片来组成“集群”,来完成自己的计算任务
  • 快速部署:无需数周的审批和等待(目前AWS等中心化厂商的情况),在几十秒内就可以完成部署,开始任务
  • 低价:服务的成本比主流厂商低90%

io.net提供了算力服务io cloud,需求方可以根据需求来定义自己想要的GPU群组,来完成AI计算任务。

ion.net根据不同算力任务,把需求场景划分为三类:General、Train、Inference。这把GPU的性能,比如内存、带宽等做了划分,方便了用户选择。

io.net提供了IO Worker产品,可以简化和优化供应方的操作,包括用户帐户管理、实时活动监控、温度和功耗跟踪、安装支持、钱包管理、安全性和盈利能力分析。

总供应量为 8 亿,在TGE时将拥有 5 亿枚IO的初始供应量,分为五个类别:种子投资者、A 轮投资者、核心贡献者、研发与生态系统以及社区。

随着$IO的发行以激励网络增长和采用,将在 20 年内增长至 8 亿枚的固定最大供应量。

奖励将在 20 年内每小时释放给供应商及质押者。奖励采用通缩模型,从第一年的 8% 开始,每月减少 1.02%(每年约 12%),直到达到 8 亿枚IO的上限。

除了$IO代币的发行,项目还采取双代币机制。计划推出与美元挂钩的 IOSD 代币,IOSD 是通过燃烧 IO 币生成的。

  • 供给端扩张迅速
  • 硬件方面,截至5月20日,根据官方数据,IO.NET在供应端的GPU总供给为28889张,CPU供给为6605张。此外,Render Network作为其合作伙伴,还有1152张GPU和27张CPU接入了网络的供给。Fileoin有1024张GPU。可用量最多的是GeForce RTX 4090。活跃的硬件上线率达到42%左右。
  • 需求端表现不尽人意。
  • IO.NET依旧处于市场培育的早期阶段,目前实际使用IO.NET来执行计算任务的总量不多。大部分在线的GPU的任务负载量为0%,只有A100 PCIe 80GB K8S、RTX A6000 K8S、RTX A4000 K8S、H100 80GB HBM3四款芯片有在处理任务。且除了A100 PCIe 80GB K8S之外,其他三款芯片的负载量均不到20%。
  • 网络处理AI推理任务的业务数据,截止5月20日,已经处理和验证的任务数量超过31.9万个,不过这部分业务量大部分都产生于IO.NET所赞助的项目BC8.AI。
  • 在网络费用规模上,io.net已经产生了$1,024,107的费用,近一日的费用为$624。
  • 价格费用优势:io.net的价格是A100($0.89/小时)、522 RTX 3090($0.38/小时)、301 RTX3080($0.23/小时)、8426 RTX A6000($0.75/小时),A4000K8S(0.23 美元/小时)。以A100为例,比谷歌云便宜82.45% ,比亚马逊AWS便宜82.62%。

核心团队在成立之初的业务为量化交易,2022年6月之后转为去中心化计算。团队总部位于美国纽约,规模为50人以上。创始人Ahmad Shadid在IO.NET之前一直从事量化和金融工程相关的工作,同时还是以太坊基金的志愿者。

项目最新估值达到10亿美金,项目获得了solana官方,rndr,fil官方的支持,A轮融资由 Hack VC 领投,@multicoincap、6th Man Ventures、M13、Delphi Digital、Solana Labs、Aptos Labs等参投。

  • 可访问性:使用 AWS、GCP 或 Azure 等云服务获取算力芯片的访问权限通常需要几周时间,而且流行的 GPU 型号经常无货。此外为了拿到算力,消费者往往需要跟这些大公司签订长期、缺少弹性的合同。而分布式算力平台可以提供弹性的硬件选择,有更强的可访问性。
  • 定价低:由于利用的是闲置芯片,再叠加网络协议方对芯片和算力供给方的代币补贴,分布式算力网络可能可以提供更为低廉的算力。
  • 抗审查:目前尖端算力芯片和供应被大型科技公司所垄断,加上以美国为代表的政府正在加大对AI算力服务的审查,AI算力能够被分布式、弹性、自由地获取,逐渐成为一个显性需求。
  • 消费者大都为专业开发者,或是中小型机构。这类用户对于协议所能提供的服务的稳定性、持续性有更高的要求。
  1. 技术难点:
  • 工作验证问题:深度学习模型的计算,由于层级化的结构,每层的输出都作为后一层的输入,因此验证计算的有效性需要执行之前的所有工作,无法简单有效地进行验证。为了解决这个问题,分布式计算平台需要开发新的算法或使用近似验证技术,这些技术可以提供结果正确性的概率保证,而不是绝对的确定性。
  • 并行化难题:分布式算力平台汇聚的是长尾的芯片供给,也就注定了单个设备所能提供的算力比较有限,单个芯片供给方几乎短时间独立完成AI模型的训练或推理任务,所以必须通过并行化的手段来拆解和分配任务,缩短总的完成时间。而并行化又必然面临任务如何分解(尤其是复杂的深度学习任务)、数据依赖性、设备之间额外的通信成本等一系列问题。
  • 隐私保护问题:如何保证采购方的数据以及模型不暴露给任务的接收方
  1. 算力需求如何破圈:

虽然Depin项目可以利用代币来快速激励供应端,实现扩张,但crypto+AI的算力需求端仍然表现不足。

  • 一是由于消费端的拓展还未开始,大部分项目还处于早期阶段,服务体验尚且不稳定,因此缺少大规模的采用;
  • 二是AI领域主要由大公司把持,中小型机构还未真正认可分布式算力提供的服务。
  1. 监管合规问题:

分布式计算平台由于其供给和采购双边市场的无许可性,一方面可以作为卖点吸引到部分客户。另一方面则可能随着AI监管规范的完善,成为政府整顿的对象。此外,部分GPU的供应商也会担心自己出租的算力资源,是否被提供给了被制裁的商业或个人。

  1. 为算力供需方提供了很好的服务工具:包括IO Cloud、IO Worker和IO Explorer。
  2. 核心技术:IO-SDK多层架构。解决了分布式算力任务并行运行的问题。与关键的 ML 框架配合良好,使 Io.net 能够灵活高效地满足各种计算需求。
  3. 隐私保护:利用反向隧道技术和网状VPN架构。反向隧道技术使工程师能够绕过防火墙和 NAT 进行远程访问,而无需进行复杂的配置。同时确保通信受到保护,维护数据隐私。网状VPN架构可以对节点故障具有鲁棒性、可扩展性、减少延迟以及更好的流量分配。

在 Web3 领域,已经有许多计算市场,其中著名的包括Akash、Render、Nosana、Clore.ai、Golem、Inferx、Kuzco、Aioz、Fluence Labs和GPU.NET等。

  • 这些项目在服务内容的细分市场上有所不同。比如Akash是点对点云服务市场,为用户提供 GPU 部署、租赁以及 AI 模型训练等服务。Render是去中心化 GPU 的渲染解决方案提供商。
  • 从项目公开数据分析,Akash和Clore.ai在供应端上有很好的表现。其中Akash的GPU数量达到382张,CPU数量达到20.89K,CPU租用率:33%,GPU租用率:26%Clore.ai的GPU数量达到19590张,租用率71%。
  • 从网络费用上看,Akash的24h费用($2.73K)与io.net相差不大。
  • 大部分项目都属于早期阶段和测试网阶段,与io.net的实力还有一段距离。但这些新项目发展迅速,需要持续关注。比如Kuzco的在线工作节点达到1400个,单卡使用率达到90%。
  1. 分布式算力/算力平台叙事被看好的主要原因有4点:(1)分布式AI计算有区别于中心化算力的优势,包括更强的可访问性,提供算力的定价更低;(2)现实原因,包括GPU供需紧张,监管扩张;(3)项目代币价格刺激,尤其在牛市行情下;(4)普通用户参与门槛降低,AI红利不仅仅是大公司和机构独享。
  2. 分布式算力主要面临三大难点:技术、需求和监管。技术方面的难点有工作验证问题、并行化问题和隐私保护问题。
  3. io.net收到持续热捧,被称为下一个filecoin,是因为其叠加solana生态+ai+depin 三大24年牛市爆发概念。从技术上看,为解决分布式算力的技术难点问题,推出了其核心技术IO-SDK的分层架构,以及解决安全连接和数据隐私问题的反向隧道技术和网状VPN架构。在产品上,它为算力供需端提供了丰富的服务产品,包括IO Cloud、IO Worker和IO Explorer。
  4. 在实际应用方面,io.net要优于其他分布式算力平台:(1)无论是拥有的芯片硬件数量和在线率都远超其他网络,io.net已经是分布式GPU算力赛道最大的供应网络。(2)执行计算任务的总量不大,大部分芯片处于在线待机状态,这是分布式算力平台的通病。
  5. 随着计算资源的稀缺,Io.net 的目标是降低租用 GPU/CPU 能力的成本,这对于 AI 和 ML 可扩展性至关重要。对计算能力的需求激增,但供应却没有跟上,这表明类似io.net这样的分布式算力项目将会有很大的前景。
  6. io.net负面影响因素有:(1)算力平台竞争的激烈化,项目种类多,且服务内容有部分重叠;(2)大规模创建和管理去中心化集群的复杂性涉及重大的技术挑战;(3)需求端仍然不足,广泛采用仍处于早期阶段。人工智能初创公司、开发商和 GPU 供应商的采用速度低于预期可能会限制增长;(4)监管风险;(5)双代币机制带来的复杂性。
评论

所有评论

推荐阅读