Skip to content

invisible30/chinese-medicine-tongue-diagnosis

Repository files navigation

智能舌苔诊断 Agent 系统需求文档

一、项目背景

本项目旨在构建一个基于多模态信息、知识库增强的智能 Agent 系统,实现用户上传舌苔图像后,通过网络搜索、图像诊断、多轮对话问诊和知识库检索等环节,对用户的健康状态进行辅助分析与中医诊断建议。

二、核心功能模块

1. 用户图像上传与舌苔图像处理

  • 用户上传舌苔病理图像(支持多种视角,如俯视图、特写图等)
  • 使用 ResNet18 模型进行舌苔图像分类:
    • 输入:图像
    • 输出:分类结果(如齿痕舌、地图舌、裂纹舌等)及置信度
  • 结合图像和分类结果作为诊断输入

2. 网络搜索与报告生成

  • 通过搜索引擎 API(如百度搜索 API、Serper API)进行医学信息搜索
  • 根据舌象关键词生成结构化参考报告(中医术语、药材、症状、疾病名称)

3. 多轮对话执行任务

  • 设计多轮问诊任务列表(Task1、Task2、Task3...)
  • 调用智能体模型(如 GPT-4)执行多轮问诊任务
  • 综合图像、网络报告、分类结果,动态调整对话内容

4. 多轮对话收集患者信息

  • 使用专用信息收集大模型(如 DeepSeek-V3)精准抽取用户回答中的:
    • 性别、年龄
    • 主诉症状
    • 发病时长、发作频率
    • 伴随症状、生活习惯等
  • 自动结构化保存患者信息

5. 生成患者信息描述

  • 基于对话内容生成统一格式的病例摘要,例如:

    性别:男
    年龄:24岁
    主诉:间断性下腹坠痛3天
    伴随:乏力,转动时加剧,舌苔厚腻等

6. 诊断任务规划

  • 根据患者信息生成诊断任务列表(任务大致框架)
  • 每个任务对应一个参考模板
  • 支持个性化诊断策略推荐

7. RAG(检索增强生成)中医知识检索模块

  • 中医知识向量数据库构建:
    • 来源:中医古籍文本、现代中医书籍等
    • 工具:GTE文本向量 + 通用Embedding模型(如 bge-base)
  • 支持向量召回、上下文增强问答
  • 结合用户问诊内容生成个性化中医建议

三、系统架构

用户 --> 舌苔图像上传 --> 图像诊断 --> 多轮问诊 Agent --> 患者信息结构化 --> 任务规划 --> 知识库诊断建议 --> 输出诊断报告

四、技术选型

模块 技术 / 模型
图像识别 ResNet18
问答大模型 GPT-4 / DeepSeek-V3
检索增强生成(RAG) GTE + bge-base + FAISS
搜索引擎 百度搜索 API / Serper API
知识库 中医经典文本 + 向量数据库
后端服务 Python + FastAPI / Flask
前端展示 Vue3 / React + Tailwind CSS

五、数据需求

  • 舌苔图像训练数据集(标注齐全)
  • 中医医学知识文本(结构化或文本格式)
  • 对话数据模板(患者常见问答)

六、功能要求总结

  • ✅ 图像上传与舌象识别
  • ✅ 多轮对话采集病史
  • ✅ 自动提取关键信息生成病例
  • ✅ 调用搜索结果提供参考
  • ✅ 生成结构化诊断任务
  • ✅ 检索中医文献并输出个性建议

七、扩展功能(可选)

  • 用户病历记录与追踪
  • 多语言支持
  • Web App / 移动端部署

八、部署与运维建议

  • 部署方式:Docker 容器化 + GPU 支持
  • 模型接口建议采用异步调用,提升响应速度
  • 知识库与对话数据可定期更新与优化

About

中医舌诊系统 - 一个基于AI的中医舌诊分析和知识库系统

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published