StochStack

Site 启动 + 招募仿真 Ops Twin

临床运营数字孪生中的 A2A x MCP

操作指引

如何操作

  1. 1.先配置场景输入(治疗领域/分期/国家/目标样本量),建议开启 Deterministic Seed 保证演示可复现。
  2. 2.开启 A2A 远程模式后点击 Run Simulation,观察 orchestrator 按步骤把任务 handoff 给不同 agent。
  3. 3.点击任意 agent 回复的 View context diff,查看它对共享上下文写入了哪些 patch。
  4. 4.在校准区域录入一个实际入组点(actual),执行自动校准。
  5. 5.再次运行模拟,对比置信度、偏差和更新后的预测轨迹。

预期结果

  • - A2A 线程会展示 request -> response 顺序,并标注 local/remote 传输模式与延迟。
  • - 每次 patch 写入后,共享上下文 version 会递增,Assumptions/Sites/Risks/Decisions 会同步更新。
  • - 置信度面板会显示 MAPE、signed bias、追踪点数量与参数回调幅度。
  • - Decision Log 会记录每次关键结论、理由和 tradeoff,便于审阅与审计。

如何解读结果

  • - 当 confidence 高于 75% 且 bias 较低时,说明当前预测可用于运营层面的执行决策。
  • - 若 signed bias 长期为负,表示实际入组持续落后于预测,应优先优化筛选转化和站点执行。
  • - 若参数回调波动持续过大,通常代表模型漂移或执行不稳定,应先补充实际数据再放大决策。

Scenario Console

Countries

A2A 运行层

开启后,非 orchestrator 的 agent 会通过 `/api/a2a/inbox` 远程路由,并在线程中显示 remote 传输信息。

开启后,远程 agent 会追加模型推理说明(已配置通义千问时调用,否则使用确定性兜底)。

运行历史

本地最多保留 5 条历史,每条都包含完整 context 与 event log。

MCP 服务器状态

检查中...

可将 Claude Desktop、Cursor 或其他 MCP 客户端连接到该 Ops Twin API。

/api/mcp

8

工具

7

资源

4

Prompts

可用工具
  • • create_session - Create new simulation session
  • • run_simulation - Execute full 6-agent workflow
  • • get_context - Retrieve simulation context
  • • calibrate_with_actuals - Calibrate with real data
  • • analyze_scenario - AI-powered analysis
  • • export_simulation - Export data (JSON/CSV)
  • • list_sessions - List active sessions
  • • replay_simulation - Replay from event log
Claude Desktop 配置
{
  "mcpServers": {
    "stochstack-ops-twin": {
      "url": "/api/mcp"
    }
  }
}

A2A Conversation Thread

A2A 拓扑图

远程重试计数器

0

远程调用次数

0

回退次数

0

ORCHCountrySiteStartUpRecruitmentRisk

MCP-like Shared Context

Run a simulation to populate shared context.

Simulation Output

Run a scenario to generate recruitment and startup simulation outputs.

update log

Prototype Change Log

  1. 2026-03-02 · v0.5.0

    Agent 评估控制台

    • - 新增按 agent 的评分卡(accuracy、bias、stability、adoption)。
    • - 新增 trial 维度筛选与版本对比(vA vs vB)。
    • - 新增人工反馈闭环面板,支持 accept/reject 与理由记录。
  2. 2026-03-02 · v0.4.1

    A2A 安全与可靠性 + LLM-native 推理

    • - 新增 A2A envelope 的 HMAC 签名与验签,并加入时间戳新鲜度校验。
    • - 新增 inbox 侧 messageId 幂等去重,避免重复处理。
    • - 新增按 agent 配置的 retry backoff 策略(maxRetries/baseDelay/backoff/jitter),并保留回退本地执行。
    • - 新增 A2A 拓扑图与远程重试计数器,增强运行态可观测性。
    • - 新增可选 LLM-native agent 推理链路(配置通义千问时调用,否则确定性兜底)。
  3. 2026-03-01 · v0.4.0

    A2A 远程协作层

    • - 新增 A2A 远程路由层:agent registry、envelope 协议和 inbox API 接口。
    • - 非 orchestrator agent 支持可选远程执行,并提供失败回退到本地的重试机制。
    • - A2A 线程新增传输信息:local/remote、endpoint、延迟与投递状态。
    • - 新增操作指引面板:清晰步骤、预期结果与结果解释,便于评审与演示。
  4. 2026-03-01 · v0.3.0

    MCP 服务器集成

    • - 新增完整的 MCP (Model Context Protocol) 服务器实现,支持外部工具集成。
    • - 暴露 8 个 MCP 工具:create_session, run_simulation, get_context, calibrate_with_actuals, analyze_scenario, export_simulation, list_sessions, replay_simulation。
    • - 暴露 7 个 MCP 资源:context schema, current context, history, KPIs, recruitment curve, risk register, agent registry。
    • - 新增 4 个 MCP Prompts:ops_twin_analyst, risk_assessor, site_selection_advisor, forecast_calibrator。
    • - 在 /api/mcp 创建 SSE 端点,支持实时 MCP 客户端连接。
    • - 在 Ops Twin Studio UI 新增 MCP 状态面板,显示连接详情和可用工具。
    • - 提供 Claude Desktop 和 Cursor 配置示例。
  5. 2026-03-01 · v0.2.0

    预测校准与置信度层上线

    • - 新增实际值录入与预测误差追踪,持续比较 predicted 与 actual 入组轨迹。
    • - 实现参数自动回调,动态调节 startup/screen-fail/dropout/competition/patient-pool 假设。
    • - 新增置信度面板:MAPE、signed bias、追踪点数量与参数变动诊断。
  6. 2026-03-01 · v0.1.0

    Ops Twin MVP 发布

    • - 新增三栏交互界面:场景控制台、A2A 对话流、MCP-like 共享上下文面板。
    • - 实现六个 agent 的有序 handoff 流程,并支持可复现 seed 仿真。
    • - 新增 patch/event log 上下文机制,支持 diff 抽屉、JSON 导出、回放与本地历史运行。