一种开源的专家混合模型 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。
16b 236b
722.3K 拉取次数 更新于 6 个月前
6 个月前更新
6 个月前
7e7a754912f8 · 14GB
模型
架构deepseek2
·
参数15.7B
·
量化Q6_K
14GB
模板
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
133B
许可证
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2 是一种开源的专家混合模型 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。DeepSeek-Coder-V2 通过从高质量和多来源语料库中获取的 6 万亿个 token 进一步从 DeepSeek-Coder-V2-Base 进行预训练。