NVIDIA 提供的一款商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。

工具 4b

70K 5 个月前

自述文件

Nemotron-Mini-4B-Instruct 是一个用于生成角色扮演、检索增强生成和函数调用响应的模型。 它是一种通过蒸馏、剪枝和量化优化的小型语言模型 (SLM),以提高速度和实现设备端部署。

此指令模型针对英语的角色扮演、RAG QA 和函数调用进行了优化。 它支持 4,096 个令牌的上下文长度。 此模型已准备好用于商业用途。

参考资料

博客

HuggingFace