一个开源的专家混合 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相媲美的性能。
16b 236b
722.2K 下载量 更新于 6 个月前
更新于 6 个月前
6 个月前
c78d80129305 · 133GB
model
架构deepseek2
·
参数236B
·
量化Q4_0
133GB
params
{ "stop": [ "User:", "Assistant:" ] }
32B
template
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
705B
license
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
license
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2 是一个开源的专家混合 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相媲美的性能。 DeepSeek-Coder-V2 是在 DeepSeek-Coder-V2-Base 的基础上,使用来自高质量和多源语料库的 6 万亿个 token 进一步预训练的。