Meta 的 Llama 3.2 缩小规模,推出 1B 和 3B 模型。

工具 1b 3b

10.4M 5 个月前

自述文件

Meta Llama 3.2 多语种大型语言模型 (LLM) 系列是 1B 和 3B 大小(文本输入/文本输出)的预训练和指令调整生成模型系列。Llama 3.2 指令调整的纯文本模型针对多语种对话用例进行了优化,包括代理检索和摘要任务。它们在常见的行业基准测试中优于许多可用的开源和封闭聊天模型。

大小

3B 参数(默认)

3B 模型在以下任务上的表现优于 Gemma 2 2.6B 和 Phi 3.5-mini 模型:

  • 遵循指令
  • 摘要
  • 提示重写
  • 工具使用
ollama run llama3.2

1B 参数

1B 模型与其他 1-3B 参数模型具有竞争力。它的用例包括

  • 个人信息管理
  • 多语种知识检索
  • 在边缘本地运行的重写任务
ollama run llama3.2:1b

基准

Llama 3.2 instruction-tuned benchmarks

支持的语言:官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2 接受过比这 8 种支持语言更广泛的语言集合的训练。