一个具有诱人角色扮演模型的通用小模型。以Bagel到Llama 3 8B Instruct的形式引入更好的RAG能力,以及德语多语言、更高通用和视觉支持。
8B
521 Pulls 更新于3个月前
更新于3个月前
3个月前
78e5c8a8aa35 · 4.0GB
模型
架构llama
·
参数8.03B
·
量化Q3_K_M
4.0GB
模板
{{ if .System }}<|start_header_id|>system<|end_header_id|> {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|> {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|> {{ .Response }}<|eot_id|>
254B
参数
{"num_keep":24,"stop":["<|start_header_id|>","<|end_header_id|>","<|eot_id|>"]}
110B
读取说明
从 https://hf-mirror.com/bartowski/Llama-3-8B-Ultra-Instruct-GGUF 导入
这是使用mergekit创建的预训练语言模型合并的结果。
大家好,这是Dampf,Destroyer系列的创造者!
环顾四周,哦,现在我正在Elinas的HF账户上。如您所见,我实在是个旅行者!
这次,我向大家介绍8B-Ultra-Instruct。这是一个小型通用模型,它将最强大的指令模型与诱人的角色扮演模型结合起来。它将为Llama 3 8B Instruct引入更出色的RAG能力,以及德语多语言、更高的通用智能和视觉支持。一个专注于生物学的模型在医学领域增加了知识。
至于角色扮演,它具有目前最新潮的两个模型。这些模型以高质量和未经过滤而闻名。所以这个模型可能会产生有害的响应。我们不对您对该模型所做之事负责,并且请用大量盐来权衡模型所说的任何事情。最后,您可能会注意到我在最终合并中的权重值很保守。这是因为我相信L8B Instruct是一个密度很高的模型,它已经非常出色,不需要更多的数据。所以,在求和合并时,我并没有达到1的权重值,而是在总量中使用了0.65。这是为了保留Llama Instruct的智慧和知识,同时在汤中添加一点上述模型作为调味品。
向所有数据集的创建者致以崇高的敬意。这些人包括Undi95、Jon Durbin、Aaditya、VAGOsolutions、Teknium、Camel等许多人。他们应得的全部赞誉。当然,感谢Elinas提供的计算服务。