一个具有诱人角色扮演模型的小型通用模型。以Bagel到Llama 3 8B Instruct的形式引入更好的RAG功能以及支持德语多语言、更高级的通用智力和视觉支持。
8B
521 拉取 更新于 3 个月前
更新于 3 个月前
3 个月前
68e632374dd3 · 3.2GB
模型
架构llama
·
参数8.03B
·
量化Q2_K
3.2GB
模版
{{ if .System }}<|start_header_id|>system<|end_header_id|> {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|> {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|> {{ .Response }}<|eot_id|>
254B
参数
{"num_keep":24,"stop":["<|start_header_id|>","<|end_header_id|>","<|eot_id|>"]}
110B
README
从 https://hf-mirror.com/bartowski/Llama-3-8B-Ultra-Instruct-GGUF 导入
这是一次使用mergekit创建的预训练语言模型的合并。
大家好,我是Dampf,Destroyer系列的创造者!
四处张望哦,我现在在Elinas的HF账户上。正如你所见,我是个相当爱旅行的!
这次,我将向大家介绍8B-Ultra-Instruct。这是一个小型通用模型,将最强大的指令模型和诱人的角色扮演模型相结合。它将以Bagel的形式向Llama 3 8B Instruct引入更好的RAG能力,以及德语多语言、更高通用性和视觉支持。一个专注于生物学的模型将在医学领域添加知识。
至于角色扮演,它具备两个目前最热门的模型。它们以其高质量和未审查的特点而闻名。所以这个模型可能会产生有害的回复。对于您如何使用此模型我们不承担责任,并且请对所有模型说的话持极大的怀疑态度。最后,您可能会注意到我在最终合并中的权重值是保守的。因为我认为L8B Instruct是一个高度密集且已经很优秀的模型,无需更多数据。所以在这个加权值平局的情况下,我只使用了总计0.65。这是为了保留Llama Instruct的智能和知识,同时在汤中加入一点上述模型作为调味料。
非常感谢所有数据集的创建者。内容包括Undi95、Jon Durbin、Aaditya、VAGOsolutions、Teknium、Camel等人。他们应得到所有荣誉。当然,也要感谢Elinas提供的计算服务。