Granite-3.2 是 IBM Granite 推出的长文本 AI 模型系列,经过微调以提升思考能力。

工具 2b 8b

17K 2 周前

自述文件

Granite-3.2 是 IBM Granite 推出的长文本 AI 模型系列,经过微调以提升思考能力。它构建于 Granite-3.1 之上,使用允许许可的开源数据集和内部生成的专为推理任务设计的合成数据进行训练。这些模型可以控制其思考能力,确保仅在需要时才应用。

大小

这些模型有两种参数大小可供选择:2B 和 8B

ollama run granite3.2:2b
ollama run granite3.2:8b

支持的语言:英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。但是,用户可以针对这 12 种语言之外的语言对 Granite 模型进行微调。

预期用途: 这些模型旨在处理通用指令跟随任务,并且可以集成到各种领域的 AI 助手,包括商业应用程序。

功能

  • 思考
  • 摘要
  • 文本分类
  • 文本提取
  • 问答
  • 检索增强生成 (RAG)
  • 代码相关任务
  • 函数调用任务
  • 多语言对话用例
  • 长文本任务,包括长文档/会议摘要、长文档 QA 等。

思考

要启用思考,请添加一条 "role": "control" 的消息并将 "content" 设置为 "thinking"。例如

{
    "messages": [
        {"role": "control", "content": "thinking"},
        {"role": "user", "content": "How do I get to the airport if my car won't start?"}
    ]
}

参考

网站