推动开源大规模语言模型在医疗领域的应用
8B 70B
853 Pulls 更新于2个月前
更新于3个月前
3个月前
8706c71b9ad1 · 8.5GB
模型
架构llama
·
参数8.03B
·
量化Q8_0
8.5GB
模板
{{ if .System }}<|start_header_id|>系统<|end_header_id|> {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>用户<|end_header_id|> {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>助手<|end_header_id|> {{ .Response }}<|eot_id|>
254B
params
{"num_keep":24,"stop":["<|start_header_id|>","<|end_header_id|>","<|eot_id|>"]}
110B
说明文档
从 https://hf-mirror.com/aaditya/Llama3-OpenBioLLM-70B 导入
推动开源大规模语言模型在医疗领域的应用
为支持多语言,请访问 https://ollama.ac.cn/taozhiyuai/openbiollm-llama-3-chinese
介绍
生物医学领域的佼佼者,基于LLAMA3打造。
介绍OpenBioLLM-70B:一个业界领先的开放源代码生物医学大型语言模型
OpenBioLLM-70B是一个高级开源语言模型,专为生物医学领域设计。由Saama AI实验室开发,此模型利用最先进的技术的在各种生物医学任务上实现了一流性能。
🏥 生物医学专业:OpenBioLLM-70B针对医疗和生命科学领域独特的语言和知识需求进行优化。它在大量高质量的生物医学数据语料库上进行了微调,使其能够以特定领域的准确性和流畅性理解和生成文本。
🎓 优异性能:拥有700亿参数,OpenBioLLM-70B在同类规模的其它开源生物医学语言模型中表现卓越。它也在生物医学基准测试中比GPT-4、Gemini、Meditron-70B、Med-PaLM-1和Med-PaLM-2等大型私有和开源模型表现更佳。
🧠 先进训练技术:OpenBioLLM-70B建立在Meta-Llama-3-70B-Instruct和Meta-Llama-3-70B-Instruct模型强大的基础上。它结合了DPO数据集和微调配方以及自定义多样化的医疗指令数据集。训练流程的关键组成部分包括
示例
70B输出的内容质量高;
70B生成更多且质量更高的文本;
8B输出的内容少,且输出的中文质量不稳定,过度量化导致损失率高。建议使用70B;
8B生成较少,量化越多,困惑度越高。因此推荐使用70B。
| Model | Quants | Size | Bit | Perplexity |
|------------------------------|--------|-------|----|-------------------|
| llama3-openbiollm-8b:Q4_0 | Q4_0 | 4.7GB | 4 | +0.2166 ppl |
| llama3-openbiollm-8b:Q4_K_M | Q4_K_M | 4.9GB | 4 | +0.0532 ppl |
| llama3-openbiollm-8b:Q5_K_M | Q5_K_M | 5.7GB | 5 | +0.0122 ppl |
| llama3-openbiollm-8b:Q6_K | Q6_K | 6.6GB | 6 | +0.0008 ppl |
基准医疗模型测评