Breeze-7B-32k-Instruct是由基础模型Breeze-7B-32k-Base衍生而来,使得到的模型适用于常见任务。〈f16, Q4, Q4_K_M〉

7B

158 Pulls 2个月前更新

2个月前

1a2e1735c224 · 15GB

README

MediaTek 研究院 Breeze-7B-32k-Instruct-v1_0 模型卡片

来源:链接

MediaTek 研究院 Breeze-7B(以下简称 Breeze-7B)是基于 Mistral-7B 进行的扩展,主要用于繁体中文的使用。

Breeze-7B-Base 是 Breeze-7B 系列的基础模型。
如果您的数据量足够大,适合进行大量的微调,则适合使用。

Breeze-7B-Instruct 从基础模型 Breeze-7B-Base 衍生而来,使得生成的模型适合直接用于常见任务。

Breeze-7B-32k-Base 从基础模型扩展,加入了更多数据、模型变更,并关闭了窗口滑动。
大致上,相当于44k繁体汉字。

Breeze-7B-32k-Instruct 从基础模型 Breeze-7B-32k-Base 衍生而来,使得生成的模型适合直接用于常见任务。

从实用性的角度来看



















Needle-in-a-haystack Performance

76.9 54.82 44.26
79.73 69.68 61.55
80.61 21.79 15.29

41.37 61.34 34 5.8 7.4
42.67 62.73 39.58 6.0 7.4

@article{MediaTek-Research2024breeze7b,
      title={Breeze-7B Technical Report}, 
      author={Chan-Jan Hsu and Chang-Le Liu and Feng-Ting Liao and Po-Chun Hsu and Yi-Chang Chen and Da-Shan Shiu},
      year={2024},
      eprint={2403.02712},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}