Sui 主网首次中断问题总结
事件概述
太平洋时间2024年11月21日上午大约1:15至3:45之间(东八区时间:2024年11月21日下午5:15至7:45),Sui主网发生了全面网络停滞。所有验证节点陷入崩溃循环,导致交易处理完全中断。
问题原因
阻塞控制代码中的assert!触发了错误:如果估算的执行成本为零,则会导致验证节点崩溃。此问题发生需满足以下所有条件:
1. 阻塞控制设置为TotalGasBudgetWithCap模式:
-
该模式在协议版本63中短暂启用后被撤销,随后在协议版本68中随累积调度器再次启用。
2.网络接收到同时包含以下条件的交易:
-
可变共享对象输入
-
零个MoveCall指令
当网络接收到此类交易时,所有验证节点立即崩溃。
什么是阻塞控制?
Sui网络基于对象的架构支持大规模并行处理不同的用户交易,这在大多数其他网络中无法实现。然而,如果多笔交易同时写入同一共享对象,则这些交易必须按顺序执行,且涉及该特定对象的交易处理量存在上限。
阻塞控制系统通过限制写入同一共享对象的交易速率,防止网络因执行时间过长的检查点而过载。
我们最近升级了阻塞控制系统,以通过更准确地估算交易复杂度来提高共享对象的利用率。但新模式TotalGasBudgetWithCap的代码中存在一个bug,导致此次问题的发生。
如何解决问题?
在问题确立后,代码修复十分直接(详见 PR #20365)。该修复已部署到主网(v1.37.4)和测试网(v1.38.1)。
PR #20365:将bump_object_execution_cost修改为使用饱和加法,并允许0成本交易。
🌟 主网v1.37.4:https://github.com/MystenLabs/sui/releases
在验证节点社区的积极响应下,从修复发布到Sui网络恢复正常仅用了15分钟。
我们学到了什么?
-
事件检测与响应系统运行良好: 自动警报与社区报告几乎同时触发,我们迅速调动团队资源进行诊断和修复。
-
验证节点社区表现出色: 修复发布后,Sui网络几乎立刻恢复正常。
预防措施
-
改进测试系统: 增加更多类似触发此次崩溃的对抗性交易类型,以发现潜在问题。
-
优化构建流程: 提高调试和发布二进制文件的生成速度,进一步减少事件响应时间。此次中断过程中的一部分时间是由于等待构建发布版本。
感谢社区和验证节点的支持,共同确保了Sui网络的快速恢复!
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
你也可能喜欢
Perena 推出 Numeraire:一个多稳定币流动性池
简单来说 Perena 引入了 Numeraire,通过利用统一的枢纽资产 USD* 来优化市场流动性并提高运营效率。
Synthetix 推出“Synthetix Vaults”产品线,并宣布计划收购杠杆代币协议 TLX
简单来说 Synthetix 推出了新的产品线“Synthetix Vaults”,以补充其去中心化衍生品平台并使该协议的收入来源多样化。
QCP Capital:杠杆过高导致市场超买,回调在所难免
简单来说 QCP Capital 指出,由于大选之后市场严重超买,比特币正在回撤至上周初的水平,因此回调是自然而然的结果。
Anthropic 推出模型上下文协议,用于改善 AI 模型生成的响应
简单来说 Anthropic 已经开源了其模型上下文协议,使 Claude 能够连接到本地计算机上的任何资源并与任何 API 或云服务器进行交互。