Skip to content

测试矩阵

sandbox 场景的完整网格。每一行都链接到一个完整的、符合 template.md 形态的场景页面,包含步骤、 预期结果以及运行记录。

网格

#test-id阶段IDE语言Fixture状态
01install-cursor-nodeinstallCursorNode 20 + TSsandbox-node-ts
02install-claude-pythoninstallClaude CodePython 3.12sandbox-python
03install-codex-goinstallCodex CLIGo 1.22sandbox-go
04install-aider-rustinstallAiderRust 1.78sandbox-rust
05boot-cursor-nodeboot(首次 demand)CursorNode 20 + TSsandbox-node-ts(在 01 之后)
06boot-claude-pythonboot(首次 demand)Claude CodePython 3.12sandbox-python(在 02 之后)
07update-cursor-nodeupdate(v0.1.0 → v0.1.1)CursorNode 20 + TSsandbox-node-ts(在 01 之后)
08update-cli-without-cliupdate 使用 --without=cliCursorNode 20 + TSsandbox-node-ts(在 01 之后)
09sync-cleansync(预期无 drift)CursorNode 20 + TSsandbox-node-ts(在 01 之后)
10sync-modifiedsync(检测到 drift)CursorNode 20 + TSsandbox-node-ts(在 01 之后,注入手工编辑)
11uninstall-preserveuninstall(保留 ledger)Claude CodePython 3.12sandbox-python(在 02 之后)
12uninstall-archiveuninstall(归档 ledger)CursorNode 20 + TSsandbox-node-ts(在 01 之后)

状态图例:✅ 通过 · ❌ 失败 · ⏳ 待定。 状态按版本发布更新:在框架打 tag 之前,每个场景 都必须针对候选 manifest 版本通过测试。

覆盖率视图

按阶段

阶段场景数Test IDs
install401–04
boot205, 06
update207, 08
sync209, 10
uninstall211, 12
总计12

按 IDE

IDE场景数Test IDs
Cursor701, 05, 07, 08, 09, 10, 12
Claude Code302, 06, 11
OpenAI Codex CLI103
Aider104
Continue / Windsurf0(延后 —— 参见 KNOWN-ISSUES.md

按语言

语言场景数Test IDs
Node + TypeScript701, 05, 07, 08, 09, 10, 12
Python302, 06, 11
Go103
Rust104

依赖关系图

某些场景会复用更早场景安装完成后的状态。 如果你想串联运行,请按以下顺序执行(否则每个场景 都会从 fixture 自行完成准备):

本矩阵尚未覆盖的内容

缺口延后原因添加触发条件
Continue / Windsurf IDE 覆盖没有活跃使用者;现在做就是合成测试任一 IDE 出现首位采用者
Java / Kotlin / Swift / C++ fixtures参见 fixtures/README.md出现首位采用者
archon doctor 深度场景doctor 是 check + structural 的封装;已通过 09 间接覆盖当其行为与 sync 出现差异时
多 agent / 并行写竞态单 agent 不变量写在 soul.md 中;竞态测试不在范围内当该不变量被放宽时
跨 OS 矩阵(Linux × macOS × Windows × WSL)一方 CI 跑在 Linux;macOS/Windows 通过手工抽查在宣布 1.0.0 之前

记录这些缺口,是为了让矩阵对当下"sandbox 已测试" 究竟意味着什么保持诚实。

依据 Apache-2.0 许可证发布。