GLM-5.1 是我们面向智能体工程的下一代旗舰模型,其编码能力较前代有显著增强。它在 SWE-Bench Pro 上达到了业界领先水平,并以巨大优势领先于 GLM-5。
23.6K 次拉取 1 个标签 更新于 4 天前
Gemma 4 系列模型旨在各个尺寸下均提供前沿水平的性能。它们非常适合处理推理、智能体工作流、代码编写和多模态理解任务。
2.4M 次拉取 17 个标签 更新于 6 天前
一款来自 NVIDIA 的开源 30B MoE 模型,具有 3B 激活参数,可提供强大的推理和智能体能力。
88K 次拉取 3 个标签 更新于 3 周前
MiniMax 的 M2 系列模型,适用于编码、智能体工作流和专业生产力场景。
64.9K 次拉取 1 个标签 更新于 3 周前
Qwen 3.5 是一个开源多模态模型系列,提供卓越的实用性和性能。
5.8M 次拉取 58 个标签 更新于 1 周前
LFM2 是一个专为端侧部署而设计的混合模型系列。LFM2-24B-A2B 是该系列中最大的模型,它在保持高效推理的同时,将架构扩展到了 240 亿参数。
1.1M 次拉取 6 个标签 更新于 1 个月前
Qwen3-Coder-Next 是阿里巴巴 Qwen 团队训练的一个专注于编码的语言模型,针对代理编码工作流程和本地开发进行了优化。
1M 次拉取 4 个标签 更新于 2 个月前
作为 30B 级别中最强大的模型,GLM-4.7-Flash 提供了一种新的轻量级部署选项,在性能和效率之间取得平衡。
1.1M 次拉取 4 个标签 更新于 2 个月前
LFM2.5 是一种新型混合模型系列,专为设备端部署而设计。
1.1M 次拉取 5 个标签 更新于 2 个月前
基于 Gemma 3 构建的新型开放翻译模型系列,帮助人们跨 55 种语言进行交流。
1.1M 次拉取 13 个标签 更新于 2 个月前
Ministral 3 系列专为边缘部署而设计,可在各种硬件上运行。
918.7K 次拉取 16 个标签 更新于 4 个月前
24B模型,擅长使用工具探索代码库,编辑多个文件和驱动软件工程代理。
767.9K 次拉取 6 个标签 更新于 3 个月前
NVIDIA Nemotron 3 Super 是一款 120B 开源 MoE 模型,仅需激活 12B 参数,即可为复杂的多智能体应用提供极致的计算效率和准确性。
221.9K 次拉取 7 个标签 更新于 1 个月前
GLM-OCR 是一个基于 GLM-V 编码器-解码器架构构建的,用于复杂文档理解的多模态 OCR 模型。
245.1K 次拉取 3 个标签 更新于 2 个月前
Qwen3-Next 系列的第一个版本,在参数效率和推理速度方面都具有强大的性能。
513.7K 次拉取 10 个标签 更新于 4 个月前
来自 Z.ai 的强大推理和代理模型,总参数 744B(活跃 40B),专为复杂系统工程和长时效任务而构建。
180.7K 次拉取 1 个标签 更新于 1 个月前
Kimi K2.5 是一个开源的、原生多模态代理模型,它无缝集成视觉和语言理解,以及先进的代理能力、即时和思考模式,以及对话和代理范式。
235.8K 次拉取 1 个标签 更新于 2 个月前
Rnj-1 是 Essential AI 训练的一个 8B 参数开放权重密集模型系列,针对代码和 STEM 进行了优化,其能力与 SOTA 开放权重模型相当。
440.5K 次拉取 6 个标签 更新于 4 个月前
Nemotron-3-Nano 是高效、开放且智能的智能体模型新标准,现已更新为 4B 参数模型。
383.1K 次拉取 9 个标签 更新于 3 周前
Olmo 是一系列开放语言模型,旨在推动语言模型科学的发展。这些模型在 Dolma 3 数据集上进行预训练,并在 Dolci 数据集上进行后训练。
397.9K 次拉取 15 个标签 更新于 3 个月前