CodeQwen1.5 是一个基于大量代码数据预训练的大型语言模型。

7b

133K 8 个月前

自述文件

CodeQwen1.5 基于 Qwen1.5。它在 3 万亿个代码数据的 tokens 上进行训练。 其主要特点包括

  • 强大的代码生成能力和在一系列基准测试中具有竞争力的性能
  • 支持长上下文理解和生成,最大上下文长度为 64K tokens
  • 支持 92 种编码语言
  • 在 Text-to-SQL、修复错误和其他编码用例中表现出色。

参考

博客文章

GitHub

HuggingFace