AiMed 面向中文医学的人工智能大语言模型由清华大学OpenDE团队和中国医学科学院医学信息研究所联合研发。
AiMed 期望实现有效处理医学知识问答、医学论文阅读、医学文献检索等任务和在医学科研中的应用。
AiMed 整个构建流程包括:
- PT增量预训练
- SFT有监督微调
- RLHF(奖励建模、强化学习训练)
- DPO(直接偏好优化)
| 模型名 | 模型大小 | 开源参数 |
|---|---|---|
| Baichuan | 13B | baichuan-inc/Baichuan-13B-Chat |
推理所需的模型权重、配置目前公开于
| 模型名 | 模型用途 | 开源参数 |
|---|---|---|
| AiMed | 基础医学百科大模型 | https://huggingface.co/DuJinHua/AiMed |
| AiMed_Paper | 医学文献摘要生成大模型 | https://huggingface.co/DuJinHua/AiMed_PaperAbs |
下面示范多种推理方式。
推理前请安装依赖:
pip install -r requirements.txtpython test.py在代码中,模型加载指定 device_map='auto',会使用所有可用显卡。如需指定使用的设备,可以使用类似 export CUDA_VISIBLE_DEVICES=0,1(使用了0、1号显卡)的方式控制。
python cli_demo.py依靠streamlit运行以下命令,会在本地启动一个 web 服务,把控制台给出的地址放入浏览器即可访问。
streamlit run web_demo.py提供一个简洁的基于gradio的交互式web界面,启动服务后,可通过浏览器访问,输入问题,模型会返回答案。
启动服务,命令如下:
CUDA_VISIBLE_DEVICES=0 python gradio_demo.py --model_type base_model_type --base_model path_to_llama_hf_dir --lora_model path_to_lora_dir比如:
CUDA_VISIBLE_DEVICES=0 python gradio_demo.py --model_type baichuan --base_model ./AiMed-13B-Chat-V1参数说明:
--model_type {base_model_type}:预训练模型类型,如llama、bloom、chatglm等--base_model {base_model}:存放HF格式的LLaMA模型权重和配置文件的目录,也可使用HF Model Hub模型调用名称--lora_model {lora_model}:LoRA文件所在目录,也可使用HF Model Hub模型调用名称。若lora权重已经合并到预训练模型,则删除--lora_model参数--tokenizer_path {tokenizer_path}:存放对应tokenizer的目录。若不提供此参数,则其默认值与--base_model相同--template_name:模板名称,如vicuna、alpaca等。若不提供此参数,则其默认值是vicuna--only_cpu: 仅使用CPU进行推理--gpus {gpu_ids}: 指定使用的GPU设备编号,默认为0。如使用多张GPU,以逗号分隔,如0,1,2--resize_emb:是否调整embedding大小,若不调整,则使用预训练模型的embedding大小,默认不调整
AiMed: Artificial intelligent large language model for Medicine in China
授权协议为 The Apache License 2.0,目前仅支持学术研究,不支持商业用途。
@misc{du24aimed,
author = {Jinhua Du, Zexun Jiang, Xinyi Li, Tianying Tang, Xiaoying Li, Yuyang Liu, Yan Luo , Hui Liu},
title = {AiMed: Artificial Intelligence large language model for Medicine in Chinese},
year={2024},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/dujh22/AiMed}}
}
@inproceedings{du2024aimed,
title={AiMed: Artificial intelligent large language model for Medicine in China},
author={Du, Jinhua and Li, Xiaoying and Jiang, Zexun and Liu, Yuyang and Yin, Hao and Liu, Hui},
booktitle={2024 IEEE International Conference on Medical Artificial Intelligence (MedAI)},
pages={360--365},
year={2024},
organization={IEEE}
}