对标 Flatiron Health 的"非结构化病历 → 真实世界证据"路径, 我们聚焦中国肝胆肿瘤单病种, 从 MEDOCR Connection 接入的真实单据聚合数据开始, 14 节点纵向复查、AI 结构化抽取、原文溯源、人工复核、Log-rank/Cox 统计、CONSORT/STROBE 自动核对、数据冻结快照, 一键产出主任汇报版 + 论文初稿框架。
下方数字直接从在跑的演示项目实时拉取,反映目前已建成的样板能力。
这些不是规划中的功能,是已经在跑的服务端代码 + 真实接口。
134 个肝癌真实世界研究变量,涵盖基线 / 诊断 / 治疗 / 化验 / 复查 / 结局六大类,每条字段都有定义 / 数据来源 / 是否必填 / 是否 AI 抽取 / 是否人工复核标签。
Kimi LLM 兜底 + 正则规则双引擎。每个字段保留来源文件 / 原文片段 / 置信度 / 复核人 / 修改记录,Flatiron 模式的"可追溯 RWE"完整落地。
医生收到的化验单 / MR 报告通常是手机翻拍照片。系统可从上游 MEDOCR 动态校验聚合记录,也可用 moonshot-v1-8k-vision-preview 直接识别新增图片。
按 NCCN/CSCO 肝癌指南:术后 0-2 年每 3 月、2-5 年每 6 月,自动生成 14 个复查节点。文件按上传日期自动归属到对应节点,医生不用手动归类。
实时监控肝癌三大标志物纵向趋势,任意两次复查间翻倍且超过临床阈值自动触发"疑似生化复发"告警,推送给医生复核。
Kaplan-Meier 生存曲线 (Greenwood CI) + Log-rank 检验 + score-based Cox HR + 95% CI;10 个亚组 Forest plot;RECIST/mRECIST best overall response;CONSORT 纳入流程图。
3 个候选 SCI 题目 + IMRaD 摘要 + 引言 / 方法 / 结果 / 讨论 / 期刊推荐;主任汇报 8 条要点 + readonly 演示链接 + 投稿验收清单 + STROBE 22 项自动状态。
一键把当前队列状态 (患者 + 变量 + 抽取 + 报表) 冻结成 JSON 快照存档,质量门禁自动告警 (复核率 / 失访率 / 缺失字段),投稿时数据可追溯到日。
按课题生成字段 Query,在工作台直接补录、复核、待补充或关闭;变量字典可发布 eCRF 版本;分析数据集冻结后,开放 Query 或质量告警会拦截锁库签名。
输入"接入 N 家医院 × M 例/家",基于当前队列实际事件率,用 Schoenfeld 公式估算 Log-rank power 与 95% CI 收窄度,主任谈联盟时直接看数据。
医生最关心两件事:这玩意儿替我省了多少时间;这玩意儿能不能让我多发文章。
真实世界肿瘤数据平台代表两条路。我们是 Flatiron 模式在中国肝胆肿瘤的早期复刻。
| 维度 | Flatiron Health (Roche) | Tempus AI | 国内通用 EDC | 本平台 |
|---|---|---|---|---|
| 定位 | 真实世界肿瘤证据平台 | 分子检测 + 临床数据 | 多病种数据采集 | 肝胆肿瘤单病种结局数据样板 |
| 变量字典 | ✓ 肿瘤专用 | ✓ 含分子 | 通用,需自配 | ✓ 134 项肝癌专用 + eCRF 发布 |
| 非结构化文本抽取 | ✓ NLP + LLM | ✓ 含病理 | ✗ 仅表单 | ✓ Kimi LLM + Vision |
| 原文溯源 | ✓ | ✓ | ✗ | ✓ 字段级 6 件套 |
| 纵向随访时间表 | ✓ 嵌入 EHR | 通过合作 | 需手配 | ✓ 14 节点自动 |
| 结局事件预警 | ✓ | ✓ | ✗ | ✓ AFP/DCP/CEA 翻倍 |
| SCI 级统计 | 需另接 | 需另接 | ✗ | ✓ KM/Log-rank/Cox/Forest 内置 |
| STROBE / CONSORT 自动核对 | ✗ | ✗ | ✗ | ✓ 自动状态标记 |
| Query 闭环与锁库门禁 | ✓ | 部分 | 需配置 | ✓ 字段 Query + eCRF + 分析集签名 |
| 主任演示 readonly 链接 | N/A | N/A | ✗ | ✓ 一键生成 |
| 本地部署 / 数据不出院 | 云端 | 云端 | 部分 | ✓ 单机部署 |
我们清楚自己是什么,以及不是什么。
✓ 肝癌单病种科研数据工厂
✓ 医生主导,主任背书
✓ 数据脱敏,本地部署
✓ Flatiron 模式的早期中国版
✓ SCI 投稿数据治理工具
✓ 字段 Query / eCRF / 锁库门禁工作流
✗ 不是 HIS / EMR 替代品
✗ 不是诊断或治疗建议系统
✗ 不是多病种通用 EDC
✗ 不是面向患者的咨询 App
✗ 不替代统计师 / 不替代研究助理
· 仅处理脱敏样本
· 患者知情同意 + 可撤回
· AI 结果必须人工复核才进入研究数据集
· 不输出诊断 / 治疗建议
· 全量审计日志,字段级版本可追溯
欢迎肝胆肿瘤科室与我们共建一个 30-50 例的样板研究,跑通从数据到主任汇报到 SCI 投稿的闭环。
进入推荐工作流