MistralLite 是一个基于 Mistral 进行微调的模型,增强了处理长上下文的能力。

7b

30.1K 16 个月前

自述文件

Mistrallite 是一个基于 Mistral 进行微调的模型,增强了处理长上下文(最多 32K tokens)的能力。 该模型在几个长上下文检索和回答任务中表现更好。

参考

Hugging Face