本报告由 Tiger Research 撰写,分析了 Subsquid 的去中心化数据基础设施,该设施旨在弥合区块链数据透明度与可访问性之间的差距。
要点总结
Subsquid(以下简称 SQD)通过去中心化基础设施简化了区块链数据访问。它支持超过 200 条区块链,并将数据分布到多个节点。
SQD 网络采用模块化结构,允许开发者自由配置数据处理和存储方法。这使得用户能够在多链环境中通过统一结构高效利用数据。
Subsquid 旨在成为 Web3 的数据支柱,类似于 Snowflake 以”一个平台,多种工作负载”树立的标准。通过近期对 Rezolve AI 的收购,它正将业务扩展至 AI 和支付领域。SQD 有望成为连接 Web3 与智能体经济的核心基础设施。
1. 区块链数据真的对所有人开放吗?
区块链技术的定义特征之一是其所有数据对所有人开放。传统行业将数据存储在外部无法访问的封闭数据库中。区块链的运作方式不同。所有记录都透明地发布在链上。
然而,数据透明并不保证易于利用。数据透明度并不能确保可访问性。区块链经过优化,旨在安全地执行交易并达成网络共识。它并非为数据分析而设计的基础设施。验证和存储数据的功能已经进步,但用于高效查询和利用该数据的基础设施仍然不足。从十年前到今天,查询链上数据的方法并未发生显著变化。
考虑一个类比。一个名为”老虎镇”的城镇有一条名为”以太坊”的巨大河流。这条河流是公共物品。任何人都可以从中取水。然而,取水困难且效率低下。每个人都必须带着水桶到河边直接取水。要将其用作饮用水,他们必须经过净化过程进行煮沸或过滤。
当前的区块链开发环境就是这样运作的。丰富的数据唾手可得,但缺乏利用它的基础设施。例如,假设一名开发者希望使用去中心化交易所 Uniswap 的交易数据构建一个 dApp。该开发者必须通过以太坊的 RPC 节点请求数据,进行处理并存储。然而,RPC 节点对于大规模数据分析或复杂查询执行存在局限性。区块链生态系统在包含多条区块链的多链环境中运行。这使得问题更加复杂。
开发者可以使用像 Alchemy 或 Infura 这样的中心化服务来解决这些局限性。然而,这种方法破坏了去中心化这一区块链技术的核心价值。即使智能合约是去中心化的,中心化的数据访问也会带来审查风险和单点故障。区块链生态系统需要在数据访问方法上进行根本性的创新,以实现真正的可访问性。
2. Subsquid:区块链数据基础设施的新范式
Subsquid(以下简称SQD)是一个去中心化的数据基础设施项目,旨在解决区块链数据访问的复杂性和低效问题。SQD 的目标是让任何人都能轻松利用区块链数据。
回到之前的类比。过去,每个人都必须带着水桶到河边直接取水。现在,分布式的净水厂从河流中取水并进行净化。镇上的人们不再需要去河边。他们可以在需要时随时获得清洁的用水。SQD 团队通过“SQD网络”提供了这种基础设施。
SQD 网络作为一个分布式查询引擎和数据湖运作。它目前支持处理来自超过 200 个区块链网络的数据。自 2024 年 6 月主网上线以来,其规模已增长至每月处理数亿次查询。这种增长源于三个核心特性。这些特性使 SQD 超越了一个简单的数据索引平台,并展示了区块链数据基础设施的演进方向。
2.1. 用于高可用性的去中心化架构
现有区块链数据基础设施的很大一部分依赖于像 Alchemy 这样的中心化提供商。这种方法在初始可访问性和管理效率方面具有优势。然而,它限制了用户只能使用提供商支持的链,并且随着使用量的增加会带来高昂的成本。它也容易受到单点故障的影响。这种中心化结构与区块链去中心化的核心价值相冲突。
SQD 网络通过去中心化架构解决了这些局限性。数据提供商从以太坊和 Solana 等多个区块链收集原始数据。他们将数据分成块,进行压缩,并附上元数据上传到网络。工作节点将数据提供商创建的永久存储中的数据分割成块进行分布式存储。当查询请求到达时,它们快速处理并响应。每个工作节点都像一个迷你 API,提供自己存储的数据。整个网络就像数千个分布式 API 服务器一样运行。网关运营商充当最终用户与网络之间的接口。他们接收用户查询并将其转发给适当的工作节点进行处理。
任何人都可以作为工作节点或网关运营商参与。这使得网络容量和处理性能可以横向扩展。数据在多个工作节点上冗余存储。即使某些节点发生故障,整体数据访问也不会受到影响。这确保了高可用性和弹性。
在初始引导阶段,数据提供商目前由 SQD 团队管理。此策略确保了初始数据质量和稳定性。随着网络的成熟,外部提供商将能够通过代币治理参与进来。这将使数据采购阶段完全去中心化。
2.2. 保障网络可持续性的代币经济学
对于一个分布式网络要正常运作,参与者需要自愿行动的动力。SQD 通过围绕原生代币 $SQD 的经济激励结构来解决这个问题。每个参与者根据其角色和责任质押或委托代币。这共同构建了网络的稳定性和可靠性。
工作节点是管理区块链数据的核心运营商。要参与,他们必须质押 100,000 $SQD 作为抵押,以应对恶意行为或提供不正确数据的情况。如果出现问题,网络将罚没他们的保证金。持续提供稳定准确数据的节点将获得 $SQD 代币奖励。这自然激励了负责任的操作。
网关运营商必须锁定 $SQD 代币才能处理用户请求。锁定代币的数量决定了他们的带宽,即他们可以处理的请求数量。更长的锁定期允许他们处理更多的请求。
代币持有者可以在不自行运行节点的情况下间接参与网络。他们可以将自己的权益委托给受信任的工作节点。获得更多委托的节点获得处理更多查询并赚取更多奖励的权限。委托者分享这些奖励的一部分。目前,没有最低委托要求或锁定期限制。这创建了一个无需许可的策展系统,社区可以实时选择节点。整个社区通过这种结构参与网络质量管理。
2.3. 实现灵活性的模块化结构
SQD 网络的另一个显著特征是其模块化结构。现有的索引解决方案采用单体结构,将数据收集、处理、存储和查询等所有环节都在单一系统中处理。这简化了初始设置,但限制了开发者选择数据处理方法或存储位置的自由度。
SQD 将数据访问层与处理层完全分离。SQD 网络仅处理 ETL(提取-转换-加载)流程中的 E(提取)部分。它仅作为一个“数据馈送”,快速可靠地提取区块链原始数据。开发者使用 SQD SDK 自由选择如何转换和存储数据。
这种结构提供了实际的灵活性。开发者可以将数据存储在 PostgreSQL 中并通过 GraphQL API 提供服务。他们可以将其导出为 CSV 或 Parquet 文件。他们可以直接将其加载到像 Google BigQuery 这样的云数据仓库中。未来的计划包括通过 Snowflake 支持大规模数据分析环境,以及通过 Kafka 集成直接流式传输数据而无需单独存储,来实现实时分析和监控平台。
SQD 联合创始人 Dmitry Zhelezov 将此比作”提供乐高积木”。SQD 不是提供成品,而是将性能最高、最可靠的原材料交给开发者。开发者根据自己的需求组合这些材料,以完成自己的数据基础设施。传统企业和加密项目都可以使用熟悉的工具和语言处理区块链数据。他们可以灵活地构建针对其特定行业和用例优化的数据管道。
3. Subsquid 的下一步:迈向更好的数据基础设施
SQD 团队通过 SQD 网络降低了区块链数据访问的复杂性和低效性,并为去中心化数据基础设施奠定了基础。然而,随着区块链数据使用的规模和范围迅速扩大,简单的可访问性已不再足够。生态系统现在需要更快的处理速度和更灵活的利用环境。
SQD 团队正在推进网络结构以满足这些需求。该团队专注于提高数据处理速度和创建能够在不依赖服务器的情况下处理数据的结构。为了实现这一目标,SQD 正在分阶段开发 1) SQD Portal 和 2) Light Squid。
3.1. SQD Portal:去中心化并行处理与实时数据
在现有的 SQD 网络中,网关充当连接最终用户和工作节点的中介。当用户请求查询时,网关将其转发给适当的工作节点,并将响应返回给最终用户。这个过程是稳定的,但一次只能顺序处理查询。大规模查询需要相当长的时间。即使有数千个工作节点可用,系统也未能充分利用它们的处理能力。
SQD 团队旨在通过SQD Portal解决这个问题。Portal 的核心在于去中心化并行处理。它将单个查询拆分成多个部分,并同时向大约 3000 个或更多的工作节点发送请求。每个工作节点并行处理分配给它的部分。Portal 然后实时收集这些响应并通过流式传输交付。
Portal 会预先将数据预取到缓冲区。这确保了即使在发生网络延迟或临时故障时也能不间断地交付。就像 YouTube 缓冲视频以实现无缝播放一样,用户无需等待即可接收数据。该团队还将原来基于 Python 的查询引擎重构为 Rust。这显著提高了并行处理性能。整体处理速度相比之前提高了数十倍。
Portal 更进一步解决实时数据问题。无论数据处理变得多快,工作节点只保存已确认的历史区块。它们无法检索刚刚生成的最新交易或区块信息。用户此前仍不得不依赖外部 RPC 节点来获取这些信息。Portal 通过称为”Hotblocks”的实时分布式流解决了这个问题。Hotblocks 从区块链 RPC 节点或专用流服务实时收集新生成的未确认区块,并将其存储在 Portal 内部。Portal 将来自工作节点的已确认历史数据与来自 Hotblocks 的最新区块数据合并。用户可以在一个请求中接收从过去到现在的数据,而无需单独的 RPC 连接。
SQD 团队计划将现有网关完全过渡到 Portal。Portal 目前处于封闭测试阶段。未来,任何人都将能够直接运行 Portal 节点,并在网络中执行网关角色。现有的网关运营商将自然地过渡为 Portal 运营商。(SQD 网络架构可在此链接中找到。)
3.2. Light Squid:本地环境中的索引
SQD 网络可靠地提供数据,但开发者仍然面临操作独立服务器的限制。即使通过 Portal 从工作节点检索数据,也需要像 PostgreSQL 这样的大型数据库服务器来处理并将其交付给用户。这个过程需要大量的基础设施构建和维护成本。数据仍然依赖于单一提供商(开发者服务器),这与真正的分布式结构相去甚远。
Light Squid 简化了这个中间步骤。原有的结构就像批发商(开发者)运营大型仓库(服务器)向消费者分发数据。Light Squid 将其转变为一种 D2C(直接面向消费者)的方法,将数据直接从源头(SQD 网络)交付给最终用户。用户通过 Portal 接收必要的数据,并将其存储在本地环境中。他们可以直接在浏览器或个人设备上进行查询。开发者无需维护单独的服务器。即使用户网络连接中断,也可以查看本地存储的数据。
例如,一个显示 NFT 交易历史的应用程序现在可以直接在用户的浏览器中运行,而无需中央服务器。这类似于 Web2 中 Instagram 在离线状态下显示信息流的方式。它旨在为 dApp 在本地环境中提供流畅的用户体验。然而,Light Squid 是作为一种选项设计的,旨在在本地实现相同的索引环境。它并不能完全取代以服务器为中心的结构。数据仍然通过分布式网络供应。随着利用范围扩展到用户层面,SQD 生态系统有望演变成一种更易于访问的形式。
4. Subsquid 在实践中如何运作
SQD 网络仅仅是一个提供数据的基础设施,但其应用范围是无限的。正如所有基于 IT 的行业都始于数据一样,数据基础设施的改进扩展了构建于其上的所有服务的可能性。SQD 已经在改变区块链数据在各个领域的利用方式,并交付了具体的成果。
4.1. DApp 开发者:统一的多链数据管理
去中心化交易所 PancakeSwap 是一个代表性案例。在多链环境中,交易所必须实时汇总每条链的交易量、流动性池数据和代币对信息。过去,开发者必须为每条链连接 RPC 节点,解析事件日志,并单独对齐不同的数据结构。每次添加新链时,这个过程都会重复。每次协议升级,维护负担都会增加。
采用 SQD 后,PancakeSwap 现在可以通过统一的管道管理来自多条链的数据。SQD 以标准化格式提供每条链的数据。现在一个索引器就可以同时处理所有链。添加新链现在只需要更改配置。数据处理逻辑从中央位置进行一致管理。开发团队减少了花在数据基础设施管理上的时间。他们现在可以更多地专注于核心服务的改进。
4.2. 数据分析师:灵活的数据处理与集成分析
像 Dune 和 Artemis 这样的链上分析平台,通过允许使用 SQL 快速轻松地进行数据查询,提供了高可访问性和便利性。然而,它们的局限性在于,工作只能在平台支持的链和数据结构内进行。在结合外部数据或执行复杂转换时,需要额外的流程。
SQD 补充了这种环境,使数据分析师能够更自由地处理数据。用户可以直接提取必要的区块链数据,将其转换为所需的格式,并加载到自己的数据库或仓库中。例如,分析师可以检索特定去中心化交易所的交易数据,按时间段进行聚合,将其与现有的金融数据结合,并应用于自己的分析模型。SQD 并不取代现有平台的便利性。它增加了数据处理的自由度和可扩展性。分析师可以通过更广泛的数据范围和定制化的处理方法,扩展链上数据分析的深度和应用范围。
4.3. AI 智能体:智能体经济的核心基础设施
为了让 AI 智能体能够自主决策和执行交易,它们需要保证可靠性和透明度的基础设施。区块链为自主智能体提供了合适的基础。所有交易记录都透明公开且难以篡改。加密货币支付实现了自动执行。
然而,AI 智能体目前难以直接访问区块链基础设施。每个开发者必须单独构建和集成数据源。网络结构各不相同,阻碍了标准化访问。即使是中心化的 API 服务也需要多个步骤,包括账户注册、密钥发放和支付设置。这些流程预设了人为干预,不适合自主环境。
SQD 网络弥合了这一差距。基于无需许可的架构,智能体通过 $SQD 代币自动化数据请求和支付。它们实时接收必要信息并独立处理。这为无需人工干预、直接连接到数据网络的自主 AI 建立了运营基础。

2025 年 10 月 9 日,Rezolve AI宣布收购 SQD,进一步明确了这一方向。Rezolve 是一家在纳斯达克上市的基于 AI 的商业解决方案提供商。通过此次收购,Rezolve 正在构建 AI 智能体经济的核心基础设施。Rezolve 计划将先前收购的 Smartpay 的数字资产支付基础设施与 SQD 的分布式数据层相结合。这将创建集成的基础设施,使 AI 在单一流程中处理数据、智能和支付。一旦 Rezolve 完成此集成,AI 智能体将实时分析区块链数据并独立执行交易。这标志着 SQD 作为 AI 智能体经济数据基础设施的一个重要转折点。
4.4. 机构投资者:面向机构市场的实时数据基础设施
随着现实世界资产代币化(RWA)的扩展,机构投资者正在链上积极参与。机构需要保证准确性和透明度的数据基础设施,以利用链上数据进行交易、结算和风险管理。
SQD 推出了 OceanStream 以满足这一需求。OceanStream 是一个去中心化的数据湖仓平台,可实时流式传输来自 200 多条区块链的数据。该平台旨在提供机构级的数据质量和稳定性。它结合了亚秒级延迟的流式传输和超过 3PB 的索引历史数据,以改善金融机构的回测、市场分析和风险评估环境。这使得机构能够以更低的成本实时监控更多的链和资产类别。他们可以在一个统一的集成系统内执行监管报告和市场监控。
OceanStream参加了美国证券交易委员会主办的加密工作组圆桌会议,讨论链上数据的透明度和可验证性如何影响市场稳定性和投资者保护。这表明 SQD 正在将自己确立为一种基于数据的结构,连接代币化金融市场与机构资本,而不仅仅是简单的开发基础设施。
5. SQD 的愿景:构建 Web3 的数据支柱
Web3 行业的竞争力取决于其利用数据的能力。然而,由于不同的区块链结构,数据仍然处于碎片化状态。有效处理这一问题的基础设施仍处于早期阶段。SQD 通过构建一个在单一结构内处理所有区块链数据的标准化数据层来弥合这一差距。除了链上数据,SQD 还计划整合包括金融交易、社交媒体和企业运营在内的链下数据,以创建一个跨越两个世界的分析环境。
这一愿景类似于 Snowflake 如何以”一个平台,多种工作负载”为传统行业树立数据集成标准。SQD 旨在通过整合区块链数据并连接链下数据源,将自己确立为 Web3 的数据支柱。
然而,SQD 需要时间才能发展成为完全去中心化的基础设施。该项目目前处于引导阶段,SQD 团队仍然扮演着重要角色。在开发者社区规模和生态系统多样性方面存在局限性。尽管如此,自主网上线仅一年多一点时间所展现的增长,以及通过 Rezolve AI 收购进行的战略扩张,都展示了明确的方向。SQD 正在为区块链数据基础设施指明前进的道路,并演变为支持整个 Web3 生态系统——从 dApp 开发到机构投资,再到 AI 智能体经济——的数据基础。其潜力预计将显著增长。
免责声明
本报告部分资金由 SQD 提供。本报告是根据我们认为可靠的材料编写的。但是,我们并不明示或暗示保证信息的准确性、完整性和适用性。对于因使用本报告或其内容而造成的任何损失,我们不承担任何责任。本报告中的结论和建议基于编写时可用的信息,如有更改,恕不另行通知。本报告中表达的所有项目、估计、预测、目标、意见和观点如有更改,恕不另行通知,并且可能与其他人或其他组织的意见不同或相反。
本文件仅供参考,不应视为法律、商业、投资或税务建议。任何对证券或数字资产的引用仅供说明之用,不构成投资建议或提供投资咨询服务的要约。本材料不针对投资者或潜在投资者。
使用条款
Tiger Research 允许对其报告进行合理使用。“合理使用”原则广泛允许出于公共利益目的使用特定内容,只要不损害材料的商业价值。如果使用符合合理使用的目的,则无需事先许可即可使用这些报告。但是,引用 Tiger Research 的报告时,必须 1) 明确注明“Tiger Research”为来源,2) 包含 Tiger Research 徽标(黑色/白色)。如果要重新组织和发布材料,则需要单独协商。未经授权使用报告可能会导致法律诉讼。