Skip to content

健康管理咨询师 GraphRAG 智能助手

三胞医疗医院信息部"健康管理咨询师辅助方案"POC 阶段产物的工程化实现 · 对比 GraphRAG 与普通 RAG 在医疗多跳推理场景的差异

首次访问提示

HuggingFace Spaces 冷启动需 30-60 秒。若加载较慢请耐心等待依赖装载与图谱加载完成。


业务背景

📝 待补充:健管师角色 / 3 大业务痛点 / 为什么需要 GraphRAG 而不是普通 RAG / POC 阶段为何未在医院落地的合规与流程考量。

引导问题(填写时回答以下 3 点即可成段):

  1. 健康管理咨询师在客户咨询场景中,最高频的 3 个查询场景是什么?
  2. 普通 RAG 在你试过的 POC 中,卡在哪些问题上?(命中率?跨章节关联?)
  3. 这套系统的边界(必须由人工咨询师在场)是怎么定的?

系统截图

RAG 对比问答(双引擎并排回答)

RAG 对比问答

同一问题让普通 RAG(Chroma + top-k=3) 与 GraphRAG(LightRAG hybrid mode) 同时回答, 直接对比检索质量与多跳推理能力差异。内置 10 个示例问题,覆盖单跳 / 多跳 / 跨主题 3 种类型。

知识图谱可视化(140 实体 + 103 关系)

知识图谱可视化

由 LightRAG 自动从知识库文档抽取构建,pyvis 渲染为可交互前端图谱:

  • 8 主题颜色编码:高血压 / 糖尿病 / 失眠 / 肥胖 / 营养 / 运动 / 药物 / 其他
  • 物理引力布局:节点拖拽自适应、滚轮缩放
  • 悬停看实体详情:连接数、主题分类、相关 chunk

技术架构

┌─────────────────────────────────────────────────────────────┐
│  Gradio Web UI (3 Tab: 对比问答 / 图谱可视化 / 项目说明)        │
└───────────────┬──────────────────────────────┬──────────────┘
                │                              │
        ┌───────▼─────────┐          ┌─────────▼──────────┐
        │  普通 RAG 引擎    │          │  GraphRAG 引擎      │
        │  LangChain 1.3.1│          │  LightRAG 1.4.16   │
        │  + Chroma 1.5.9 │          │  + NetworkX        │
        └───────┬─────────┘          └─────────┬──────────┘
                │                              │
                └──────────────┬───────────────┘

              ┌────────────────────────────────────┐
              │  通义千问(qwen-turbo + emb-v2)     │
              │  OpenAI 兼容接口 / 国内免 VPN        │
              └────────────────┬───────────────────┘

              ┌────────────────────────────────────┐
              │  6 主题健管师 KB(3209 字)          │
              │  公开科普 + 自制 FAQ                 │
              └────────────────────────────────────┘

技术选型与理由

选型选择理由
LLM通义 qwen-turbo国内免 VPN、中文质量高、免费额度覆盖 demo 量级
Embedding通义 text-embedding-v2(1536 维)与 LightRAG 默认维度匹配,避免维度适配开销
普通 RAG 框架LangChain 1.3.1主流 RAG 框架,生态最全,作为基线对比标准
GraphRAG 框架LightRAG 1.4.16港大 HKUDS 团队,比微软 GraphRAG 更轻量、中文场景表现好
向量库Chroma + NanoVectorDB本地零配置部署,无需独立向量数据库服务
图谱可视化pyvis + NetworkX浏览器交互式渲染,iframe 隔离避免 sanitize 冲突
前端Gradio 5.50与 LightRAG 异步 API 原生兼容,UI 开发成本低

核心差异:GraphRAG vs 普通 RAG

完全相同的数据集 / LLM / Embedding 条件下,基于 10 道对比测试题的结果:

评分题数典型问题
GraphRAG 显著优于3肥胖 + 糖尿病轻断食 / 肥胖减重计划 / 肥胖导致哪些慢病
GraphRAG 偏强1糖尿病每日水果摄入量建议
双方平局6单跳事实型问题(如"高血压一线用药是什么")
普通 RAG 更优0

最强证据:Q9「肥胖会导致哪些慢性病?」

  • 普通 RAG:答 4 条慢病(命中知识库直接表述的内容)
  • GraphRAG:通过知识图谱跨章节多跳推理,答 6 大类(多出心血管疾病、代谢综合征、肝病、癌症)

诚实结论

数据集 FAQ 部分预先写好了多跳答案,因此普通 RAG 在这类问题上也能"够用"。 GraphRAG 真正的价值在没有预置 FAQ 总结的开放问题——它能从知识图谱中跨章节多跳走出,补出 普通 RAG 无法关联的内容。

完整 10 题对比数据见 comparison.md(433 行,含每题双方完整输出 + 评分理由)。


GraphRAG 核心原理(一句话)

不是图数据库会"关联",是 LLM 在帮你建立关联,图数据库只是存储容器。

LightRAG 的 3 步工作流:

  1. 切块(机械切分,无智能成分)
  2. ★ LLM 抽取实体 + 关系(智能在这一步)——给 LLM 发 prompt,要求返回结构化"实体 + 关系" JSON
  3. 跨 chunk 合并去重(也用 LLM)——不同章节提到同一实体时合并为图节点

跨章节关联能自动建立的原因:LLM 训练时已内化"高血压是疾病 / 卡托普利是 ACEI 类药物"这类世界知识。 读 chunk A 看到"褪黑素 → 慢性病客户慎用",再读 chunk B 看到"高血压是慢性病",LightRAG 第二轮调 LLM 合并时把它们连起来,即生成跨章节边。


合规边界

严格界定

本系统仅为健管师辅助查询工具,不构成医疗诊断或处方建议。

维度边界
服务对象健康管理咨询师(非执业医师)
用途业务知识查询辅助 + 新人培训陪练
不涉及疾病诊断 / 处方推荐 / 医疗器械级 AI
数据来源公开健康科普资料 + 自制业务 FAQ
数据排除不使用任何真实病历、不接入医院 HIS / EMR 系统

在线访问

部署在 HuggingFace Spaces(CPU basic 实例),首次冷启动 30-60 秒。


项目资源


最近更新:2026-05-25 · 反馈与合作:contact