一个开源的专家混合(MoE)代码语言模型,在特定于代码的任务中,性能与GPT4-Turbo相当。
16b 236b
722.3K 拉取 更新于 6个月前
6个月前更新
6个月前
3dab6fe7735c · 8.5GB
模型
架构deepseek2
·
参数15.7B
·
量化Q3_K_L
8.5GB
模板
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
133B
许可证
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2 是一个开源的专家混合(MoE)代码语言模型,在特定于代码的任务中,性能与GPT4-Turbo相当。 DeepSeek-Coder-V2 是从 DeepSeek-Coder-V2-Base 进一步预训练而来,使用了 6 万亿个token,这些token来自高质量和多来源的语料库。