一种开源的混合专家(MoE)代码语言模型,在代码特定任务中实现了与GPT4-Turbo相当的性能。
16b 236b
722.3K 拉取 更新于 6 个月前
更新于 6 个月前
6 个月前
d1bcdd7d5871 · 251GB
模型
架构deepseek2
·
参数236B
·
量化Q8_0
251GB
参数
{ "stop": [ "System:", "User:", "Assistant:", "<|begin_of_text|>
72B
模板
{{- if .Suffix }}<|fim_begin|>{{ .Prompt }}<|fim_hole|>{{ .Suffix }}<|fim_end|> {{- else }}{{ .Promp
115B
许可
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
Readme
DeepSeek-Coder-V2 是一种开源的混合专家 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。 DeepSeek-Coder-V2 是从 DeepSeek-Coder-V2-Base 进一步预训练的,使用了来自高质量和多源语料库的 6 万亿个 tokens。