CodeQwen1.5 是一个在大量代码数据上预训练的大型语言模型。

7b

133.3K 8 个月前

自述文件

CodeQwen1.5 基于 Qwen1.5。它在 3 万亿 tokens 的代码数据上进行了训练。其主要特点包括:

  • 强大的代码生成能力,并在多个基准测试中具有竞争力的性能
  • 支持长上下文理解和生成,最大上下文长度为 64K tokens
  • 支持 92 种编程语言
  • 在文本到 SQL、修复错误和其他编码用例中表现出色。

参考

博客文章

GitHub

HuggingFace