CodeQwen1.5 是一个在大量代码数据上进行预训练的大型语言模型。

7b

133.3K 8 个月前

Readme

CodeQwen1.5 基于 Qwen1.5。它在 3 万亿个代码数据的 tokens 上进行训练。其主要特点包括

  • 强大的代码生成能力以及在一系列基准测试中具有竞争力的性能
  • 支持长上下文理解和生成,最大上下文长度为 64K tokens
  • 支持 92 种编程语言
  • 在 Text-to-SQL、修复错误和其他编码用例中表现出色。

参考文献

博客文章

GitHub

HuggingFace