推进医学领域中开源大型语言模型的演进
853 提交 更新于2个月前
更新于3个月前
3个月前
881f678ac039 · 75GB
自述文件
从https://hf-mirror.com/aaditya/Llama3-OpenBioLLM-70B导入
推进医学领域中开源大型语言模型的演进
对于多语言支持,请访问https://ollama.ac.cn/taozhiyuai/openbiollm-llama-3-chinese
介绍 介绍
生物医学领域的佼佼者,基于LLAMA3打造。
介绍 OpenBioLLM-70B:一个卓越的开源生物医学大型语言模型
OpenBioLLM-70B是一个高级开源语言模型,专门为生物医学领域设计。由Saama AI实验室开发,该模型利用最先进的技术在广泛的生物医学任务中实现了最先进的性能。
🏥 生物医学专业:OpenBioLLM-70B针对医疗和生命科学领域的独特语言和知识需求进行定制。它在大量高质量的生物医学数据语料库上进行微调,使它能以专业性精确生成文本。
🎓 优秀性能:具有700亿参数的OpenBioLLM-70B在与其他类似规模的开放源代码生物医学语言模型上表现优异。它在生物医学基准测试中比GPT-4、Gemini、Meditron-70B、Med-PaLM-1和Med-PaLM-2等更大的 proprietary 和开放源代码模型表现出更好的结果。
🧠 先进训练技术:OpenBioLLM-70B建立在Meta-Llama-3-70B-Instruct和Meta-Llama-3-70B-Instruct模型强大的基础上。它采用了DPO数据集和微调配方,以及定制的多种医疗指令数据集。训练管道的关键组件包括
屏幕样本 示例
70B的输出内容质量高;
70B生成的文本更多、质量较高;
8B的输出内容较少,且输出的中文质量不稳定,过度量化导致损失率高。建议使用70B;
8B生成的文本更少,量化越多,困惑度越高。因此,推荐使用70B。
| Model | Quants | Size | Bit | Perplexity |
|------------------------------|--------|-------|----|-------------------|
| llama3-openbiollm-8b:Q4_0 | Q4_0 | 4.7GB | 4 | +0.2166 ppl |
| llama3-openbiollm-8b:Q4_K_M | Q4_K_M | 4.9GB | 4 | +0.0532 ppl |
| llama3-openbiollm-8b:Q5_K_M | Q5_K_M | 5.7GB | 5 | +0.0122 ppl |
| llama3-openbiollm-8b:Q6_K | Q6_K | 6.6GB | 6 | +0.0008 ppl |
基准医疗模型评测