Mistral 的一个扩展,支持 64K 或 128K 的上下文窗口。

7b

45.2K 16个月前

自述文件

Yarn Mistral 是基于 Mistral 的一个模型,它将其上下文大小扩展到高达 128k。 它由 Nous Research 开发,通过实施 YaRN 方法进一步训练模型以支持更大的上下文窗口。

CLI (命令行界面)

64k 上下文大小

ollama run yarn-mistral

128k 上下文大小

ollama run yarn-mistral:7b-128k

API (应用程序编程接口)

示例

curl -X POST http://localhost:11434/api/generate -d '{
  "model": "yarn-mistral:7b-128k",
  "prompt":"Here is a story about llamas eating grass"
 }'

参考

Hugging Face

YaRN:大型语言模型的有效上下文窗口扩展