16 个月前更新
16 个月前
f5905a53ed4b · 101GB
模型
架构falcon
·
参数180B
·
量化Q4_0
101GB
许可证
FALCON 180B TII 许可证版本 1.0 2023 年 9 月 falconllm.tii.ae 引言 该许可证
16kB
自述文件
Falcon 是一个由技术创新研究所 (TII) 构建的高性能大型语言模型系列,该研究所是阿布扎比政府高级技术研究委员会的一部分,负责监督技术研究。
CLI (命令行界面)
ollama run falcon "Why is the sky blue?"
API (应用程序编程接口)
curl -X POST https://:11434/api/generate -d '{
"model": "falcon",
"prompt": "Why is the sky blue?"
}'
参数计数
参数数量 | 推荐内存 | ||
---|---|---|---|
70 亿 | 8GB | 查看 | ollama run falcon:7b |
400 亿 | 32GB | 查看 | ollama run falcon:40b |
1800 亿 | 192GB | 查看 | ollama run falcon:180b |
变体
chat (聊天) |
聊天模型在聊天和指令数据集上进行了微调,其中混合了几个大规模对话数据集。 |
instruct (指令) |
指令模型遵循指令,并在 baize 指令数据集上进行了微调。 |
text (文本) |
文本模型是没有任何对话微调的基础模型,最适合用于简单的文本补全。 |
Falcon 180B
截至 2023 年 9 月,具有 1800 亿个参数的模型 Falcon 180B 是性能最佳的公开 LLM。 它介于 OpenAI 的 GPT 3.5 和 GPT 4 之间。要运行 Falcon 180B,建议使用至少具有 192GB 总内存的强大系统。
注意:Falcon 180B 的发布许可证与其较小的兄弟模型不同,该许可证限制了在某些条件下的商业用途。 有关更多信息,请参见模型详细信息和许可证。