MistralLite 是一个基于 Mistral 微调的模型,具有增强的的长上下文处理能力。

7b

30.1K 16 个月前

自述文件

Mistrallite 是一个基于 Mistral 微调的模型,具有增强的的长上下文处理能力 (高达 32K tokens)。该模型在一些长上下文检索和问答任务上表现明显更好。

参考

Hugging Face