DBRX 是 Databricks 创建的一个开放的、通用的大型语言模型 (LLM)。

132b

18.4K 11 个月前

自述文件

DBRX 需要 Ollama 0.1.32

DBRX 是一个基于 Transformer 的仅解码器大型语言模型 (LLM),它使用下一个token预测进行训练。 它使用细粒度的混合专家 (MoE) 架构,总共有 132B 个参数,其中 36B 个参数在任何输入上都是活动的。 它在 12T token 的文本和代码数据上进行了预训练。

它是一种特别强大的代码模型,除了作为通用 LLM 的优势外,在编程方面也超过了像 CodeLLaMA-70B 这样的专用模型。

参考

博客文章

HuggingFace