Experiment26模型的Dolphin版本(7B参数)

7B

177 Pulls 更新于4个月前

说明

llama.cpp对dolphin-2.8-experiment26-7b的量化

使用llama.cpp提交fa97464进行量化。

原始模型:https://hugging-face.cn/cognitivecomputations/dolphin-2.8-experiment26-7b

从下边下载一个文件(不是整个分支)

文件名 量化类型 文件大小 描述
dolphin-2.8-experiment26-7b-Q8_0.gguf Q8_0 7.69GB 非常高的质量,通常不需要但最大可用的量化。
dolphin-2.8-experiment26-7b-Q6_K.gguf Q6_K 5.94GB 非常高的质量,几乎完美,推荐
dolphin-2.8-experiment26-7b-Q5_K_M.gguf Q5_K_M 5.13GB 高质量,非常可用。
dolphin-2.8-experiment26-7b-Q5_K_S.gguf Q5_K_S 4.99GB 高质量,非常可用。
dolphin-2.8-experiment26-7b-Q5_0.gguf Q5_0 4.99GB 高质量,旧格式,通常不推荐。
dolphin-2.8-experiment26-7b-Q4_K_M.gguf Q4_K_M 4.36GB 良好质量,类似于4.25 bpw。
dolphin-2.8-experiment26-7b-Q4_K_S.gguf Q4_K_S 4.14GB 略低质量,有少量空间节省。
海豚版本2.8试验26的7b-Q4_0.gguf Q4_0 4.10GB 品质尚可,年代较久,通常不推荐使用。
海豚版本2.8试验26的7b-Q3_K_L.gguf Q3_K_L 3.82GB 质量较低但可用,适用于内存较小的情形。
海豚版本2.8试验26的7b-Q3_K_M.gguf Q3_K_M 3.51GB 质量更低。
海豚版本2.8试验26的7b-Q3_K_S.gguf Q3_K_S 3.16GB 质量较差,不推荐使用。
海豚版本2.8试验26的7b-Q2_K.gguf Q2_K 2.71GB 质量极低,不推荐使用。

想要支持我的工作?请访问我的 Ko-fi 页面:https://ko-fi.com/bartowski