基于StarCoder2 7B的优秀编码性能,Dolphin模型家族的无审查版本。

7B

227 拉取 更新于4个月前

4个月前

7c430080facc · 4.6GB

Readme

DolphinCoder StarCoder2 7b 🐬

latitude.sh 赞助。

加入我们的Discord! https://discord.gg/cognitivecomputations

此模型基于StarCoder2-7b并遵循bigcode-openrail-m许可证。

这只海豚真的擅长编程,我使用了大量编程数据进行训练。

此模型未经审查。我已经过滤了数据集以去除对齐和偏差,这使得模型更加合规。建议在将模型作为服务公开之前实现自己的对齐层。它将对任何请求高度合规,甚至不道德的请求。请阅读我的关于未经审查模型的博客文章。 https://erichartford.com/uncensored-models
您应对使用此模型创建的任何内容负责。负责任地享受。

训练

使用qLoRA和Axolotl在8x L40S上训练3个时期花费了2天。

提示格式
此模型使用ChatML提示格式。

<|im_start|>system
You are DolphinCoder, a helpful AI programming assistant.<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

示例

<|im_start|>system
You are DolphinCoder, a master at software engineering and coding in any programming language.
<|im_start|>user
Please write me a program in golang that parses all the lines in a file, and reverses them character-wise, and saves it to a new file.
<|im_start|>assistant

量化模型

感恩

  • 这个模型的创建得益于 latitude.sh 的慷慨赞助。
  • 欢迎微软回归开源AI!感谢你们提供的Orca-Math数据集!
  • 对于训练和发布StarCoder2的权重表示衷心的感谢 BigCode
  • 对于数据集作者的深深感谢:@ise-uiuc, @teknium, @m-a-p
  • 对@winglian和Axolotl贡献者制作最佳训练框架表示深深的感谢!
  • Built with Axolotl
  • 感谢开源AI社区中的所有人,他们在过程中教导了我,并帮助了我。

示例输出

如果您想经济上支持我的工作

周边产品