把医院散落的肝癌随访资料,
变成可发 SCI 的研究级数据资产

对标 Flatiron Health 的"非结构化病历 → 真实世界证据"路径, 我们聚焦中国肝胆肿瘤单病种, 从 MEDOCR Connection 接入的真实单据聚合数据开始, 14 节点纵向复查、AI 结构化抽取、原文溯源、人工复核、Log-rank/Cox 统计、CONSORT/STROBE 自动核对、数据冻结快照, 一键产出主任汇报版 + 论文初稿框架。

当前演示队列实测

下方数字直接从在跑的演示项目实时拉取,反映目前已建成的样板能力。

50+ 例
脱敏样本量
134 项
肝癌专病变量 / eCRF
70.3%
AI 节省时间比例
18/22
STROBE 22 项已覆盖

十大核心能力

这些不是规划中的功能,是已经在跑的服务端代码 + 真实接口。

📋 肝癌专病变量字典 v1.0

134 个肝癌真实世界研究变量,涵盖基线 / 诊断 / 治疗 / 化验 / 复查 / 结局六大类,每条字段都有定义 / 数据来源 / 是否必填 / 是否 AI 抽取 / 是否人工复核标签。

🤖 AI 抽取 + 原文溯源

Kimi LLM 兜底 + 正则规则双引擎。每个字段保留来源文件 / 原文片段 / 置信度 / 复核人 / 修改记录,Flatiron 模式的"可追溯 RWE"完整落地。

📸 Kimi Vision 直读手机照片

医生收到的化验单 / MR 报告通常是手机翻拍照片。系统可从上游 MEDOCR 动态校验聚合记录,也可用 moonshot-v1-8k-vision-preview 直接识别新增图片。

📅 14 节点纵向复查时间表

按 NCCN/CSCO 肝癌指南:术后 0-2 年每 3 月、2-5 年每 6 月,自动生成 14 个复查节点。文件按上传日期自动归属到对应节点,医生不用手动归类。

📈 AFP / DCP / CEA 翻倍预警

实时监控肝癌三大标志物纵向趋势,任意两次复查间翻倍且超过临床阈值自动触发"疑似生化复发"告警,推送给医生复核。

📊 SCI 级统计分析自动跑

Kaplan-Meier 生存曲线 (Greenwood CI) + Log-rank 检验 + score-based Cox HR + 95% CI;10 个亚组 Forest plot;RECIST/mRECIST best overall response;CONSORT 纳入流程图。

📝 论文 + 主任汇报一键出

3 个候选 SCI 题目 + IMRaD 摘要 + 引言 / 方法 / 结果 / 讨论 / 期刊推荐;主任汇报 8 条要点 + readonly 演示链接 + 投稿验收清单 + STROBE 22 项自动状态。

🗄️ 数据冻结快照

一键把当前队列状态 (患者 + 变量 + 抽取 + 报表) 冻结成 JSON 快照存档,质量门禁自动告警 (复核率 / 失访率 / 缺失字段),投稿时数据可追溯到日。

🧾 Query / eCRF / 锁库治理

按课题生成字段 Query,在工作台直接补录、复核、待补充或关闭;变量字典可发布 eCRF 版本;分析数据集冻结后,开放 Query 或质量告警会拦截锁库签名。

🏥 专科联盟扩展模拟器

输入"接入 N 家医院 × M 例/家",基于当前队列实际事件率,用 Schoenfeld 公式估算 Log-rank power 与 95% CI 收窄度,主任谈联盟时直接看数据。

真实 ROI

医生最关心两件事:这玩意儿替我省了多少时间;这玩意儿能不能让我多发文章。

单例肝癌随访数据整理
人工 30 分钟 / 例
AI + 复核 ≈ 9 分钟 / 例
100 例样本基线 Table 1 + KM 曲线 + Forest plot
研究助理 1-2 周
一键导出 < 1 分钟
SCI 投稿 STROBE 核对
逐条手填 22 项
自动核对 + 证据链接
复发预警
医生人工翻历史化验单
AFP/DCP/CEA 翻倍自动告警
主任汇报材料
研究生 PPT 加班
主任演示链接 + PPTX 导出

对标行业

真实世界肿瘤数据平台代表两条路。我们是 Flatiron 模式在中国肝胆肿瘤的早期复刻。

维度 Flatiron Health (Roche) Tempus AI 国内通用 EDC 本平台
定位真实世界肿瘤证据平台分子检测 + 临床数据多病种数据采集肝胆肿瘤单病种结局数据样板
变量字典✓ 肿瘤专用✓ 含分子通用,需自配✓ 134 项肝癌专用 + eCRF 发布
非结构化文本抽取✓ NLP + LLM✓ 含病理✗ 仅表单✓ Kimi LLM + Vision
原文溯源✓ 字段级 6 件套
纵向随访时间表✓ 嵌入 EHR通过合作需手配✓ 14 节点自动
结局事件预警✓ AFP/DCP/CEA 翻倍
SCI 级统计需另接需另接✓ KM/Log-rank/Cox/Forest 内置
STROBE / CONSORT 自动核对✓ 自动状态标记
Query 闭环与锁库门禁部分需配置✓ 字段 Query + eCRF + 分析集签名
主任演示 readonly 链接N/AN/A✓ 一键生成
本地部署 / 数据不出院云端云端部分✓ 单机部署

定位与边界

我们清楚自己是什么,以及不是什么。

✓ 肝癌单病种科研数据工厂
✓ 医生主导,主任背书
✓ 数据脱敏,本地部署
✓ Flatiron 模式的早期中国版
✓ SCI 投稿数据治理工具
✓ 字段 Query / eCRF / 锁库门禁工作流

不是

✗ 不是 HIS / EMR 替代品
✗ 不是诊断或治疗建议系统
✗ 不是多病种通用 EDC
✗ 不是面向患者的咨询 App
✗ 不替代统计师 / 不替代研究助理

合规底线

· 仅处理脱敏样本
· 患者知情同意 + 可撤回
· AI 结果必须人工复核才进入研究数据集
· 不输出诊断 / 治疗建议
· 全量审计日志,字段级版本可追溯

下一步

欢迎肝胆肿瘤科室与我们共建一个 30-50 例的样板研究,跑通从数据到主任汇报到 SCI 投稿的闭环。

进入推荐工作流