MistralLite 是基于 Mistral 进行微调的模型,具有增强的处理长上下文能力。

7b

30.1千 16 个月前

自述文件

Mistrallite 是基于 Mistral 进行微调的模型,具有增强的处理长上下文(最多 32K 个 tokens)能力。该模型在几个长上下文检索和问答任务中表现明显更好。

参考

Hugging Face