全新的最先进的70B模型。 Llama 3.3 70B 提供了与 Llama 3.1 405B 模型相似的性能。

工具 70b

1.5M 3个月前

自述文件

Meta 全新的最先进的 70B 模型,其性能与 Llama 3.1 405B 模型相当。

Meta Llama 3.3 多语种大型语言模型 (LLM) 是一个经过预训练和指令调整的生成模型,大小为 70B(文本输入/文本输出)。 Llama 3.3 指令调整的纯文本模型针对多语种对话用例进行了优化,并且在常见的行业基准测试中优于许多可用的开源和封闭式聊天模型。

llama 3.3 benchmark

支持的语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。

新功能

此版本引入了新功能,包括更长的上下文窗口、多语言输入和输出,以及开发人员与第三方工具的可能集成。 除了通常适用于所有生成式人工智能用例的最佳实践之外,构建这些新功能还需要特定的考虑因素。

工具使用: 就像在标准软件开发中一样,开发人员负责将 LLM 与他们选择的工具和服务集成。 他们应该为他们的用例定义明确的策略,并评估他们使用的第三方服务的完整性,以便在使用此功能时了解安全限制。 请参阅《负责任使用指南》,了解安全部署第三方保护措施的最佳实践。

多语种性: 除了英语之外,Llama 3.3 还支持 7 种语言:法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。 Llama 可能能够输出文本,但输出的语言可能未达到安全性和实用性的性能阈值。 我们强烈建议开发人员不要使用此模型在不支持的语言中进行对话,而不在符合其政策和《负责任使用指南》中分享的最佳实践的情况下实施微调和系统控制。

预期用途

预期用例 Llama 3.3 适用于多种语言的商业和研究用途。 指令调整的纯文本模型适用于类似助理的聊天,而预训练模型可以适应各种自然语言生成任务。 Llama 3.3 模型还支持利用其模型的输出来改进其他模型的能力,包括合成数据生成和提炼。 Llama 3.3 社区许可证允许这些用例。

超出范围 以任何违反适用法律或法规(包括贸易合规法律)的方式使用。 以可接受使用政策和 Llama 3.3 社区许可证禁止的任何其他方式使用。 以本模型卡中未明确引用的支持语言以外的语言使用**。

注意: Llama 3.3 接受过比 8 种支持语言更广泛的语言集合的训练。 开发人员可以针对 8 种支持语言以外的语言微调 Llama 3.3 模型,前提是他们遵守 Llama 3.3 社区许可证和可接受使用政策,并且在这种情况下,他们有责任确保以安全和负责任的方式使用 Llama 3.3 在其他语言中的任何用途。