🎩 Magicoder 是一个 7B 参数模型系列,使用 OSS-Instruct 训练了 7.5 万个合成指令数据。OSS-Instruct 是一种利用开源代码片段来启发 LLM 的新方法。

7b

32.2K 15 个月前

自述文件

🎩

Magicoder 是一个由 OSS-Instruct 驱动的模型系列,OSS-Instruct 是一种利用开源代码片段来启发 LLM 的新方法,用于生成低偏差和高质量的代码指令数据。

OSS-Instruct 通过使用大量的开源参考来增强 LLM 合成指令数据,从而缓解了 LLM 合成指令数据固有的偏差,从而产生更多样化、更真实和可控的数据。

参考

GitHub

HuggingFace