Granite-3.2 是来自 IBM Granite 的长上下文 AI 模型系列,经过微调以具备思考能力。

工具 2b 8b

17K 2 周前

自述文件

Granite-3.2 是一个长上下文 AI 模型系列,经过微调以具备思考能力。 它建立在 Granite-3.1 之上,通过混合许可的开源数据集和专为推理任务设计的内部生成的合成数据进行训练。 这些模型允许对其思考能力进行控制,确保仅在需要时才应用。

尺寸

这些模型有两种参数尺寸,2B 和 8B

ollama run granite3.2:2b
ollama run granite3.2:8b

支持的语言:英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。 但是,用户可以针对这 12 种语言以外的语言微调此 Granite 模型。

预期用途: 这些模型旨在处理一般的指令遵循任务,并且可以集成到跨各个领域(包括业务应用程序)的 AI 助手当中。

功能

  • 思考
  • 总结
  • 文本分类
  • 文本提取
  • 问答
  • 检索增强生成 (RAG)
  • 代码相关任务
  • 函数调用任务
  • 多语言对话用例
  • 长上下文任务,包括长文档/会议摘要、长文档问答等。

思考

要启用思考,请添加一条具有 "role": "control" 的消息并将 "content" 设置为 "thinking"。 例如

{
    "messages": [
        {"role": "control", "content": "thinking"},
        {"role": "user", "content": "How do I get to the airport if my car won't start?"}
    ]
}

参考

网站