Granite-3.2 是 IBM Granite 系列的长上下文 AI 模型,经过微调以增强思维能力。

工具 20 亿 80 亿

1.7 万 2 周前

自述文件

Granite-3.2 是一系列为思维能力进行微调的长上下文 AI 模型。它基于 Granite-3.1 构建,使用许可的开源数据集和专为推理任务设计的内部生成的合成数据进行训练。这些模型可以控制其思维能力,确保仅在需要时才应用。

  • 开发者:Granite 团队,IBM
  • 网站: Granite 文档
  • 发布日期:2025 年 2 月 26 日
  • 许可证: Apache 2.0

大小

这些模型有两种参数大小:20 亿和 80 亿。

ollama run granite3.2:2b
ollama run granite3.2:8b

支持的语言: 英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。 但是,用户可以针对这 12 种语言之外的语言微调此 Granite 模型。

预期用途: 这些模型旨在处理通用指令跟随任务,并且可以集成到各种领域(包括商业应用程序)中的 AI 助手。

功能

  • 思考
  • 总结
  • 文本分类
  • 文本提取
  • 问答
  • 检索增强生成 (RAG)
  • 代码相关任务
  • 函数调用任务
  • 多语言对话用例
  • 长上下文任务,包括长文档/会议摘要、长文档问答等。

思考

要启用思考,请添加一条带有 "role": "control" 的消息并将 "content" 设置为 "thinking"。 例如

{
    "messages": [
        {"role": "control", "content": "thinking"},
        {"role": "user", "content": "How do I get to the airport if my car won't start?"}
    ]
}

参考文献

网站