🎩 Magicoder 是一个拥有 70 亿参数的模型系列,它使用 OSS-Instruct 训练了 7.5 万条合成指令数据。OSS-Instruct 是一种新颖的方法,通过开源代码片段来启发 LLM。

7b

32.2K 15 个月前

自述文件

🎩

Magicoder 是一个模型家族,由 OSS-Instruct 提供支持。OSS-Instruct 是一种新颖的方法,通过开源代码片段来启发 LLM,从而生成低偏差和高质量的代码指令数据。

OSS-Instruct 通过使用大量的开源参考资料来增强 LLM 合成指令数据,从而减轻了 LLM 合成指令数据固有的偏差,以生成更多样化、更真实和更可控的数据。

参考文献

GitHub

HuggingFace