一个小型通用模型,具有吸引人的角色扮演模型。以Bagel的形式在Llama 3 8B Instruct中引入了更好的RAG功能,以及德语多语言、较高的通用智能和视觉支持。
8B
521 拉取 更新于3个月前
更新于3个月前
3个月前
36668df83532 · 5.7GB
模型
架构llama
·
参数8.03B
·
量化Q5_K_M
5.7GB
模版
{{ if .System }}<|start_header_id|>system<|end_header_id|> {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|> {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|> {{ .Response }}<|eot_id|>
254B
参数
{"num_keep":24,"stop":["<|start_header_id|>","<|end_header_id|>","<|eot_id|>"]}
110B
自述文件
从 https://hf-mirror.com/bartowski/Llama-3-8B-Ultra-Instruct-GGUF 导入
这是一个使用mergekit创建的预训练语言模型的合并。
大家好,我是Dampf,Destroyer系列的创作者!
环顾四周 哦,现在我在Elinas的HF账户上。如你所见,我是一个相当有旅行经验的旅行者!
这次,我要向大家介绍8B-Ultra-Instruct。这是一个小型通用模型,结合了最强大的指令模型和吸引人的角色扮演模型。它将以Bagel的形式向Llama 3 8B Instruct引入更好的RAG能力,以及德语多语言、更高的一般智力和视觉支持。一个专注于生物学的模型将在医学领域添加知识。
至于角色扮演,它具有当前最热门的两个模型。这些模型因其高质量和不受审查而闻名。因此,这个模型可能会产生有害的回应。我们不对你使用这个模型的行为负责,请用大量的盐对待模型所说的任何事情。最后,你可能注意到我在最终的合并中与权重值进行了对话。这是因为我认为L8B Instruct是一个密度很高的模型,已经很好了,不需要更多的数据。因此,在平衡合并达到1的权重值时,我只使用了总共0.65。这是为了保留Llama Instruct的智能和知识,同时在汤中增加一点上述模型的盐。
非常感谢所有数据集的创作者。这些人包括Undi95,Jon Durbin,Aaditya,VAGOsolutions,Teknium,Camel等。他们值得所有的赞誉。当然,感谢Elinas提供计算资源。