Cointime

扫码下载App
iOS & Android

使用 Pinax 数据集和 Snowflake 轻松进行区块链数据分析

项目方

TL;DR:了解如何利用 Pinax 提供的数据集高效分析区块链数据。学习我们的解决方案如何通过 Parquet 文件和 Snowflake 等托管数据库简化对 ETH 数据的访问,从而能够执行 SQL 查询以提取有价值的见解,例如每日活跃用户和热门合约活动。

我们很高兴演示一款正在改变区块链数据分析的产品:与 Snowflake 集成的 Datasets on The Graph。在这篇文章中,我们将探讨我们正在解决的问题、我们的创新解决方案、人们如何使用我们的数据集以及我们对未来的愿景。

视频链接:https://youtu.be/7CxFGgNmu-Y


有关我们数据集的更多信息,请阅读文章:

区块链会生成大量数据,这些数据量很大,难以管理。提取此数据,尤其是在涉及来自 RPC 节点的详细交互时,需要自定义检测。

习惯了 SQL 等传统工具的分析师难以应对区块链数据提取的复杂性。再加上处理多个区块链网络的挑战,它成为一种运营负担。

高效访问这些数据还意味着最大限度地减少下载大量数据集的需求。这就是为什么我们需要一个支持数据存储的解决方案,以便您可以只查询所需的数据。

我们利用两项强大的技术:Firehose 和 Substreams。这些服务在 The Graph 上运行,并允许高效提取和存储区块链数据。我们首先为各种链(基于 EVM、Solana、BTC)定义区块架构,然后将它们导出为 Parquet 文件——本质上是具有数据库属性的平面文件。这些文件托管在 AWS S3 或其他与 S3 兼容的存储桶上。

为了使数据更易于访问,我们不会止步于原始存储。我们还在 Snowflake Marketplace 上列出了数据。您可以从 S3 查询原始数据,也可以直接连接到托管数据库 Snowflake,以对托管数据集运行 SQL 查询。这种多功能性使您可以以自己喜欢的方式访问区块链数据。

您有多种选项来访问数据。您可以:

  • 使用外部表或直接复制方法将原始数据从 S3 加载到数据库中。
  • 使用 SQL 直接查询 Snowflake 等托管数据库中的数据。
  • 使用 Polars 或 pandas 等 Python 库以编程方式读取单个 Parquet 文件。
---视频幻灯片中的屏幕截图, MVP 架构的数据管道。


数据管道从 Firehose 开始,它支持对区块链数据集进行检测,从而创建流经 Substreams 的标准化区块类型。在这里,我们为不同的数据类型(区块、交易跟踪、日志)定义架构,并将它们转换为 Parquet 文件。

提取的数据可以托管在 S3 上,然后以各种方式使用,例如 SQL 计算引擎或 Python 库。我们还支持两种不同的网关方法:

  1. 请求方支付:计费基于 S3 存储使用量,允许您为访问的特定数据量付费。
  2. Snowflake 市场:您可以直接访问数据集而无需复制,并享受 SQL 就绪托管数据库的额外便利性。
---视频幻灯片中的屏幕截图, MVP 架构的网关。


Snowflake 提供了一个市场,您可以在其中轻松找到数据集。例如,搜索 “Ethereum” 将显示来自知名数据提供商的列表。我们的以太坊数据集可以免费试用,不收取上架费用。

您可以通过查看区块、日志和交易哈希等表格来预览数据以熟悉其结构。目前,Snowflake 在单个区域(美国东部弗吉尼亚州北部)托管这些数据,我们计划在未来根据需要添加更多区域。

在我们的演示中,我们将展示如何使用 Snowflake 的 Python 笔记本来分析以太坊上的每日活跃用户,并使用 pandas 可视化数据。我们还按活动探讨了排名靠前的合约,强调了深入了解合约级别的详细信息是多么容易。

目前,我们在 Snowflake 和 S3 上托管了以太坊。我们正在积极扩展以支持其他 EVM 链,如 Base、Arbitrum、BSC 和 Polygon,以及非 EVM 链,如 Solana 和 BTC。此外,我们的目标是将数据刷新率从 24 小时缩短到尽可能低的水平,使近乎实时的分析成为现实。

我们很高兴能够继续构建和发展该产品,扩大对更多区块链的支持,并增强实时功能,使每个人都能访问区块链数据,从分析师到开发人员。

根据客户反馈和我们在 Snowflake 上进行数据集试点的成功,您将来可能会在 The Graph 上看到数据集作为完全受支持的数据服务产品。

如果您有兴趣探索我们如何根据您的需求简化区块链数据访问,请访问我们的网站或直接联系我们以了解更多信息。申请演示,了解我们如何转变您的区块链数据洞察方式。

(相关专业名词、注释、代码库、超链接等请关注博客查找)

小提示,我们的 ETH 数据集可以在Snowflake上免费试用!

💡 本文回答以下问题:

- 什么是区块链数据集?

- 分析人员如何处理托管在Snowflake上的数据集?

- 访问集中的数据有哪些不同的方法?

- 如何免费试用我们的ETH有限历史数据集?

评论

所有评论

推荐阅读

  • 伯克希尔哈撒韦现金储备激增至创纪录的3970亿美元

    Cointime 报道,5月2日讯, 在格雷格·阿贝尔担任首席执行官的第一个季度,伯克希尔哈撒韦现金储备跃升至历史最高水平,达到3970亿美元。在去年年底,该公司现金储备略有下降,但在第一季度大幅增加,因为在此期间净出售了81亿美元的股票。(金十)

  • 伯克希尔哈撒韦公布一季报

    Cointime 报道,5月2日讯,伯克希尔哈撒韦A(BRK.A.N)2026年Q1 营收936.75亿美元,上年同期为897.25亿美元,市场预期为892.74亿美元;净利润101.06亿美元,上年同期为46.03亿美元,市场预期为117.62亿美元。(金十)

  • 美国政府:持有的英特尔(INTC.US)10%股份已获得了400亿美元的收益

    Cointime 报道,5月2日,美国政府:持有的英特尔(INTC.US)10%股份已获得了400亿美元的收益。(东新社)

  • BTC跌破78000美元

    Cointime 报道,行情显示,BTC跌破78000美元,现报77977.99美元,24小时涨幅达到1.9%,行情波动较大,请做好风险控制。

  • 特朗普称美国目前不会离开霍尔木兹海峡

    Cointime 报道,5月2日,美国总统特朗普表示,美国目前“不会离开”霍尔木兹海峡,他为美国的封锁行动辩护,并称该行动“很强大”。特朗普表示,封锁措施正在奏效,并声称一旦战争结束,能源价格将大幅下降。“这场战争结束后,石油、天然气以及所有东西的价格都会暴跌,”他说。他还赞扬美国股市创下历史新高,并表示在他执政期间的项目都在“按时”和“按预算”完成。(金十)

  • 特朗普:个人倾向于不重启对伊轰炸行动

    Cointime 报道,5月2日,美国总统特朗普表示,他在伊朗问题上的选项归根结底只有两个:要么进行大规模军事升级,要么达成协议。“确实有选项。我们是想直接杀过去,把他们彻底炸个稀巴烂,从而一劳永逸地解决问题?还是想尝试达成一项协议?这就是摆在面前的选项,”特朗普说道。他同时证实,自己昨晚刚听取了美国中央司令部就军事选项所作的最新简报。特朗普表示,他个人倾向于不重启轰炸行动。“从人道主义角度出发,我更倾向于不这么做,”他在白宫说道。(CNN)

  • 特朗普:对伊朗最新提案不满意

    Cointime 报道,5月2日,美国总统特朗普:(关于伊朗)对最新提案不满意,我们正在通过电话进行谈判,不确定我们是否能达成协议。(金十)

  • ETH跌破2300美元

    Cointime 报道,行情显示,ETH跌破2300美元,现报2299.48美元,24小时涨幅达到1.5%,行情波动较大,请做好风险控制。

  • 贝森特:封锁将持续下去,直到伊朗恢复战前的航行自由

    Cointime 报道,5月1日,美国财长贝森特在X平台上发文称,身处下水管道中的老鼠,很难知晓外部世界正在发生什么。以下是为伊朗领导层提供的一些“现实图景”——毕竟他们确实处于信息隔绝的黑暗之中:1. 美国已完全控制霍尔木兹海峡。2. 硬通货(即美元)出现短缺。3. 食品和汽油已实行配给制。4. 整个国际社会都已转向反对你们。5. 封锁将持续下去,直到恢复2月27日之前的航行自由。