全新顶尖 70B 模型。 Llama 3.3 70B 性能与 Llama 3.1 405B 模型相近。

工具 70b

1.5M 3 个月前

自述文件

Meta 的全新顶尖 70B 模型,其性能与 Llama 3.1 405B 模型相近。

Meta Llama 3.3 多语言大型语言模型 (LLM) 是一种 70B 的预训练和指令调整的生成模型(文本输入/文本输出)。 Llama 3.3 指令调整的纯文本模型针对多语言对话用例进行了优化,并在常见的行业基准测试中优于许多可用的开源和封闭式聊天模型。

llama 3.3 benchmark

支持的语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。

新功能

此版本引入了新功能,包括更长的上下文窗口、多语言输入和输出以及开发人员与第三方工具的可能集成。 除了通常适用于所有生成式 AI 用例的最佳实践之外,使用这些新功能进行构建还需要进行特定的考虑。

工具使用: 就像在标准软件开发中一样,开发人员有责任将 LLM 与他们选择的工具和服务集成。 他们应该为其用例定义明确的策略,并评估他们使用的第三方服务的完整性,以了解使用此功能时的安全限制。 有关安全部署第三方保护措施的最佳实践,请参阅《负责任的使用指南》。

多语言性: Llama 3.3 除了英语外,还支持 7 种语言:法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。 Llama 可能会输出性能未达到安全性和有用性阈值的语言文本。 我们强烈建议开发人员不要使用此模型在不受支持的语言中进行对话,而不在与其政策一致的情况下实施微调和系统控制,并在《负责任的使用指南》中分享最佳实践。

预期用途

预期用例 Llama 3.3 适用于多种语言的商业和研究用途。 指令调整的纯文本模型适用于类似助手的聊天,而预训练模型可以适应各种自然语言生成任务。 Llama 3.3 模型还支持利用其模型的输出来改进其他模型的能力,包括合成数据生成和蒸馏。 Llama 3.3 社区许可证允许这些用例。

范围外 以任何违反适用法律或法规的方式使用(包括贸易合规法律)。 以《可接受使用政策》和《Llama 3.3 社区许可证》禁止的任何其他方式使用。 以本模型卡中明确引用的支持语言以外的语言使用**。

注意: Llama 3.3 已经接受了比 8 种支持的语言更广泛的语言集合的训练。 开发人员可以对 Llama 3.3 模型进行微调,以支持 8 种支持的语言以外的语言,前提是他们遵守 Llama 3.3 社区许可证和《可接受使用政策》,并且在这种情况下,他们有责任确保以安全和负责任的方式使用 Llama 3.3 的任何其他语言。