ops 数字孪生

Site 启动 + 招募仿真 Ops Twin

临床运营数字孪生中的 A2A x MCP

操作指引

如何操作

1.先配置场景输入（治疗领域/分期/国家/目标样本量），建议开启 Deterministic Seed 保证演示可复现。
2.开启 A2A 远程模式后点击 Run Simulation，观察 orchestrator 按步骤把任务 handoff 给不同 agent。
3.点击任意 agent 回复的 View context diff，查看它对共享上下文写入了哪些 patch。
4.在校准区域录入一个实际入组点（actual），执行自动校准。
5.再次运行模拟，对比置信度、偏差和更新后的预测轨迹。

预期结果

- A2A 线程会展示 request -> response 顺序，并标注 local/remote 传输模式与延迟。
- 每次 patch 写入后，共享上下文 version 会递增，Assumptions/Sites/Risks/Decisions 会同步更新。
- 置信度面板会显示 MAPE、signed bias、追踪点数量与参数回调幅度。
- Decision Log 会记录每次关键结论、理由和 tradeoff，便于审阅与审计。

如何解读结果

- 当 confidence 高于 75% 且 bias 较低时，说明当前预测可用于运营层面的执行决策。
- 若 signed bias 长期为负，表示实际入组持续落后于预测，应优先优化筛选转化和站点执行。
- 若参数回调波动持续过大，通常代表模型漂移或执行不稳定，应先补充实际数据再放大决策。

Scenario Console

Therapeutic AreaPhase

Countries

Target Sample SizeRecruitment Duration (months)

avg_startup_days75

screen_fail_rate0.35

dropout_rate0.18

competition_index0.5

patient_pool_index0.6

Show agent messages in real-timeDeterministic Seed

A2A 运行层

远程 Agent 执行

开启后，非 orchestrator 的 agent 会通过 `/api/a2a/inbox` 远程路由，并在线程中显示 remote 传输信息。

LLM-native 推理

开启后，远程 agent 会追加模型推理说明（已配置通义千问时调用，否则使用确定性兜底）。

运行历史

本地最多保留 5 条历史，每条都包含完整 context 与 event log。

MCP 服务器状态

检查中...

可将 Claude Desktop、Cursor 或其他 MCP 客户端连接到该 Ops Twin API。

/api/mcp

工具

资源

Prompts

可用工具

• create_session - Create new simulation session
• run_simulation - Execute full 6-agent workflow
• get_context - Retrieve simulation context
• calibrate_with_actuals - Calibrate with real data
• analyze_scenario - AI-powered analysis
• export_simulation - Export data (JSON/CSV)
• list_sessions - List active sessions
• replay_simulation - Replay from event log

Claude Desktop 配置

{
  "mcpServers": {
    "stochstack-ops-twin": {
      "url": "/api/mcp"
    }
  }
}

A2A Conversation Thread

A2A 拓扑图

远程重试计数器

远程调用次数

回退次数

MCP-like Shared Context

Run a simulation to populate shared context.

Simulation Output

Run a scenario to generate recruitment and startup simulation outputs.

update log

Prototype Change Log

2026-03-02 · v0.5.0
Agent 评估控制台
- - 新增按 agent 的评分卡（accuracy、bias、stability、adoption）。
- - 新增 trial 维度筛选与版本对比（vA vs vB）。
- - 新增人工反馈闭环面板，支持 accept/reject 与理由记录。
2026-03-02 · v0.4.1
A2A 安全与可靠性 + LLM-native 推理
- - 新增 A2A envelope 的 HMAC 签名与验签，并加入时间戳新鲜度校验。
- - 新增 inbox 侧 messageId 幂等去重，避免重复处理。
- - 新增按 agent 配置的 retry backoff 策略（maxRetries/baseDelay/backoff/jitter），并保留回退本地执行。
- - 新增 A2A 拓扑图与远程重试计数器，增强运行态可观测性。
- - 新增可选 LLM-native agent 推理链路（配置通义千问时调用，否则确定性兜底）。
2026-03-01 · v0.4.0
A2A 远程协作层
- - 新增 A2A 远程路由层：agent registry、envelope 协议和 inbox API 接口。
- - 非 orchestrator agent 支持可选远程执行，并提供失败回退到本地的重试机制。
- - A2A 线程新增传输信息：local/remote、endpoint、延迟与投递状态。
- - 新增操作指引面板：清晰步骤、预期结果与结果解释，便于评审与演示。
2026-03-01 · v0.3.0
MCP 服务器集成
- - 新增完整的 MCP (Model Context Protocol) 服务器实现，支持外部工具集成。
- - 暴露 8 个 MCP 工具：create_session, run_simulation, get_context, calibrate_with_actuals, analyze_scenario, export_simulation, list_sessions, replay_simulation。
- - 暴露 7 个 MCP 资源：context schema, current context, history, KPIs, recruitment curve, risk register, agent registry。
- - 新增 4 个 MCP Prompts：ops_twin_analyst, risk_assessor, site_selection_advisor, forecast_calibrator。
- - 在 /api/mcp 创建 SSE 端点，支持实时 MCP 客户端连接。
- - 在 Ops Twin Studio UI 新增 MCP 状态面板，显示连接详情和可用工具。
- - 提供 Claude Desktop 和 Cursor 配置示例。
2026-03-01 · v0.2.0
预测校准与置信度层上线
- - 新增实际值录入与预测误差追踪，持续比较 predicted 与 actual 入组轨迹。
- - 实现参数自动回调，动态调节 startup/screen-fail/dropout/competition/patient-pool 假设。
- - 新增置信度面板：MAPE、signed bias、追踪点数量与参数变动诊断。
2026-03-01 · v0.1.0
Ops Twin MVP 发布
- - 新增三栏交互界面：场景控制台、A2A 对话流、MCP-like 共享上下文面板。
- - 实现六个 agent 的有序 handoff 流程，并支持可复现 seed 仿真。
- - 新增 patch/event log 上下文机制，支持 diff 抽屉、JSON 导出、回放与本地历史运行。