870万 次下载 更新于 6个月前
ollama run gpt-oss
ollama launch claude --model gpt-oss
ollama launch codex --model gpt-oss
ollama launch opencode --model gpt-oss
ollama launch openclaw --model gpt-ossOllama 与 OpenAI 合作,将 OpenAI 最新的最先进的开放权重模型带到 Ollama。 这两种模型,20B 和 120B,带来全新的本地聊天体验,专为强大的推理、代理任务和多功能的开发者用例而设计。
您可以从 下载最新版本的 Ollama 开始。
该模型可以直接在 Ollama 的新应用程序中或通过终端下载
ollama run gpt-oss:20b
ollama run gpt-oss:120b
OpenAI 利用量化来减少 gpt-oss 模型的内存占用。 这些模型经过了专家混合 (MoE) 权重的量化后训练,采用 MXFP4 格式,其中权重被量化为每个参数 4.25 位。 MoE 权重占总参数数的 90% 以上,将其量化为 MXFP4 使得较小的模型能够在内存仅为 16GB 的系统上运行,而较大的模型能够适应单个 80GB GPU。
Ollama 原生支持 MXFP4 格式,无需额外的量化或转换。 为 Ollama 的新引擎开发了新的内核以支持 MXFP4 格式。
Ollama 与 OpenAI 合作,针对参考实现进行基准测试,以确保 Ollama 的实现具有相同的质量。
gpt-oss-20b 模型专为低延迟、本地或专业用例而设计。