Breeze-7B-32k-Instruct是由基础模型Breeze-7B-32k-Base衍生而来,使得到的模型适用于常见任务。〈f16, Q4, Q4_K_M〉
7B
158 Pulls 2个月前更新
2个月前更新
2个月前
1a2e1735c224 · 15GB
README
MediaTek 研究院 Breeze-7B-32k-Instruct-v1_0 模型卡片
来源:链接
MediaTek 研究院 Breeze-7B(以下简称 Breeze-7B)是基于 Mistral-7B 进行的扩展,主要用于繁体中文的使用。
Breeze-7B-Base 是 Breeze-7B 系列的基础模型。
如果您的数据量足够大,适合进行大量的微调,则适合使用。
Breeze-7B-Instruct 从基础模型 Breeze-7B-Base 衍生而来,使得生成的模型适合直接用于常见任务。
Breeze-7B-32k-Base 从基础模型扩展,加入了更多数据、模型变更,并关闭了窗口滑动。
大致上,相当于44k繁体汉字。
Breeze-7B-32k-Instruct 从基础模型 Breeze-7B-32k-Base 衍生而来,使得生成的模型适合直接用于常见任务。
从实用性的角度来看
76.9 | 54.82 | 44.26 | |
79.73 | 69.68 | 61.55 | |
80.61 | 21.79 | 15.29 |
41.37 | 61.34 | 34 | 5.8 | 7.4 | |
42.67 | 62.73 | 39.58 | 6.0 | 7.4 |
@article{MediaTek-Research2024breeze7b,
title={Breeze-7B Technical Report},
author={Chan-Jan Hsu and Chang-Le Liu and Feng-Ting Liao and Po-Chun Hsu and Yi-Chang Chen and Da-Shan Shiu},
year={2024},
eprint={2403.02712},
archivePrefix={arXiv},
primaryClass={cs.CL}
}