DBRX 是 Databricks 创建的开放、通用 LLM。

132b

18.4K 11 个月前

自述文件

DBRX 需要 Ollama 0.1.32

DBRX 是一个基于 transformer 的仅解码器大型语言模型 (LLM),它使用下一个 token 预测进行训练。它使用具有 132B 总参数的细粒度混合专家 (MoE) 架构,其中 36B 参数在任何输入上都是活跃的。它在 12T 个 token 的文本和代码数据上进行了预训练。

它是一种特别强大的代码模型,除了作为通用 LLM 的优势外,还在编程方面超越了像 CodeLLaMA-70B 这样的专业模型。

参考资料

博客文章

HuggingFace