Deepseek-R1-Distilled-Qwen-1.5B 的微调版本,在流行的数学评估中,仅使用 1.5B 参数就能超越 OpenAI 的 o1-preview 的性能。

1.5b

66.3K 4 周前

5 个标签
0031bcf7459f • 3.6GB • 4 周前
0031bcf7459f • 3.6GB • 4 周前
0031bcf7459f • 3.6GB • 4 周前
305c4a53269d • 1.1GB • 4 周前
37b8148c7f55 • 1.9GB • 4 周前