自述文件
Granite-3.2 是一系列针对思维能力进行微调的长上下文 AI 模型。它建立在 Granite-3.1 之上,并使用许可的开源数据集和为推理任务设计的内部生成的合成数据混合进行训练。这些模型允许控制其思维能力,确保仅在需要时才应用。
- 开发者:Granite 团队,IBM
- 网站:Granite 文档
- 发布日期:2025 年 2 月 26 日
- 许可证: Apache 2.0
大小
这些模型提供两种参数大小:2B 和 8B
ollama run granite3.2:2b
ollama run granite3.2:8b
支持的语言:英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。但是,用户可以针对这 12 种语言以外的语言对这个 Granite 模型进行微调。
预期用途:这些模型旨在处理通用指令遵循任务,并且可以集成到跨各个领域(包括商业应用程序)的 AI 助手中。
功能
- 思维
- 摘要
- 文本分类
- 文本提取
- 问答
- 检索增强生成 (RAG)
- 代码相关任务
- 函数调用任务
- 多语言对话用例
- 长上下文任务,包括长文档/会议摘要、长文档问答等。
思维
要启用思维,请添加一条 "role": "control"
的消息,并将 "content"
设置为 "thinking"
。例如
{
"messages": [
{"role": "control", "content": "thinking"},
{"role": "user", "content": "How do I get to the airport if my car won't start?"}
]
}