QwQ 是 Qwen 系列的推理模型。
868.3K 下载次数 8 标签 更新于 6 天前
最新的 70B 模型。 Llama 3.3 70B 提供与 Llama 3.1 405B 模型相似的性能。
1.5M 下载次数 14 标签 更新于 3 个月前
Meta 的 Llama 3.2 推出了 1B 和 3B 小型模型。
10.4M 下载次数 63 标签 更新于 5 个月前
Llama 3.1 是 Meta 最新的先进模型,提供 8B、70B 和 405B 参数大小。
26.7M 下载次数 93 标签 更新于 3 个月前
Mistral AI 发布的 7B 模型,更新至 0.3 版本。
10.2M 下载次数 84 标签 更新于 7 个月前
Qwen2.5 模型基于阿里巴巴最新的大规模数据集进行预训练,包含多达 18 万亿个 tokens。该模型支持最多 128K 个 tokens,并具有多语言支持。
5.2M 下载次数 133 标签 更新于 5 个月前
最新的 Code-Specific Qwen 模型系列,在代码生成、代码推理和代码修复方面有显著改进。
4.5M 下载次数 196 标签 更新于 4 个月前
Qwen2 是阿里巴巴集团推出的新系列大型语言模型
4.1M 下载次数 97 标签 更新于 6 个月前
一个最先进的 12B 模型,具有 128k 的上下文长度,由 Mistral AI 与 NVIDIA 合作构建。
1.3M 下载次数 17 标签 更新于 7 个月前
Mistral AI 推出的具有开放权重的专家混合(MoE)模型,参数大小为 8x7b 和 8x22b。
582.7K 下载次数 70 标签 更新于 2 个月前
SmolLM2 是一个紧凑型语言模型系列,提供三种尺寸:1.35 亿、3.6 亿和 17 亿参数。
371.5K 下载次数 49 标签 更新于 4 个月前
Mistral Small 3 在 70B 以下的“小型”大型语言模型类别中树立了新的基准。
298.5K Pulls 21 Tags Updated 5 weeks ago
Command R 是一个大型语言模型,针对对话交互和长上下文任务进行了优化。
283K Pulls 32 Tags Updated 6 months ago
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本
264.7K Pulls 65 Tags Updated 2 months ago
Mistral Large 2 是 Mistral 新的旗舰模型,在代码生成、数学和推理方面能力显著增强,拥有 128k 上下文窗口并支持数十种语言。
125.1K Pulls 32 Tags Updated 3 months ago
Command R+ 是一个功能强大、可扩展的大型语言模型,专为在实际企业用例中表现出色而构建。
119.7K Pulls 21 Tags Updated 6 months ago
IBM Granite 2B 和 8B 模型是仅限文本的密集 LLM,在超过 12 万亿个 token 的数据上进行训练,在 IBM 的初始测试中,与之前的模型相比,性能和速度都得到了显着提高。
81.8K Pulls 33 Tags Updated 7 weeks ago
Athene-V2 是一个 72B 参数模型,擅长代码补全、数学和日志提取任务。
76.9K 下载量 17 标签 更新于 3 个月前
NVIDIA 提供的商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。
69.9K 下载量 17 标签 更新于 5 个月前
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的 LLM,旨在提高 LLM 生成的对用户查询的回复的有用性。
66.9K 下载量 17 标签 更新于 4 个月前
IBM Granite 2B 和 8B 模型旨在支持基于工具的用例,并支持检索增强生成 (RAG),从而简化代码生成、翻译和错误修复。
57.9K 下载量 33 标签 更新于 3 个月前
Groq 提供的一系列模型,代表了开源 AI 在工具使用/函数调用能力方面的重大进步。
56.2K 下载量 33 标签 更新于 7 个月前
Cohere For AI 的语言模型,经过训练,可在 23 种不同的语言中表现良好。
46.6K 下载量 33 标签 更新于 4 个月前
IBM Granite 1B 和 3B 模型是 IBM 推出的首批混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
44.4K 下载量 33 标签 更新于 3 个月前
IBM Granite 1B 和 3B 模型是 IBM 推出的长上下文混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
35.5K 下载量 33 标签 更新于 7 周前
Phi-4-mini 在多语言支持、推理和数学方面带来了显着增强,现在,期待已久的函数调用功能终于得到支持。
32.1K 下载量 5 标签 更新于 11 天前
Cohere R 系列中最小的模型,可提供顶级的速度、效率和质量,以在商用 GPU 和边缘设备上构建强大的 AI 应用程序。
24.5K 下载量 5 标签 更新于 7 周前
一款紧凑而高效的视觉语言模型,专为视觉文档理解而设计,能够自动从表格、图表、信息图表、绘图、示意图等中提取内容。
19.3K 下载量 5 标签 更新于 12 天前
一个基于 Llama 3 的开放权重函数调用模型,与 GPT-4o 的函数调用能力相媲美。
19K 下载量 17 标签 更新于 7 个月前
Granite-3.2 是 IBM Granite 的长上下文 AI 模型系列,经过微调以实现思维能力。
16.9K 下载量 9 标签 更新于 2 周前
轻量级 Command R7B 模型的全新最先进版本,在中东和北非的企业中擅长高级阿拉伯语能力。
3,373 下载量 5 标签 更新于 11 天前