Granite-3.2 是来自 IBM Granite 的长上下文 AI 模型系列,经过微调以增强思考能力。

工具 2b 8b

1.69万 2 周前

自述文件

Granite-3.2 是一系列长上下文 AI 模型,经过微调以增强思考能力。它建立在 Granite-3.1 的基础上,通过混合使用宽松许可的开源数据集和内部生成的专为推理任务设计的合成数据进行训练。 这些模型允许对其思维能力进行控制,确保仅在需要时才应用。

  • 开发者: Granite 团队,IBM
  • 网站Granite 文档
  • 发布日期: 2025 年 2 月 26 日
  • 许可证: Apache 2.0

尺寸

这些模型有两种参数尺寸可供选择:2B 和 8B

ollama run granite3.2:2b
ollama run granite3.2:8b

支持的语言: 英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。但是,用户可以针对这 12 种语言以外的语言微调此 Granite 模型。

预期用途: 这些模型旨在处理通用指令遵循任务,并且可以集成到各个领域(包括商业应用程序)的 AI 助手。

功能

  • 思考
  • 摘要
  • 文本分类
  • 文本提取
  • 问答
  • 检索增强生成 (RAG)
  • 代码相关任务
  • 函数调用任务
  • 多语言对话用例
  • 长上下文任务,包括长文档/会议摘要、长文档问答等。

思考

要启用思考,请添加一条 "role": "control" 的消息,并将 "content" 设置为 "thinking"。例如

{
    "messages": [
        {"role": "control", "content": "thinking"},
        {"role": "user", "content": "How do I get to the airport if my car won't start?"}
    ]
}

参考

网站