granite3.2-vision:2b-q4_K_M

注意：此模型需要 Ollama 0.5.13。

一个紧凑而高效的视觉-语言模型，专门为视觉文档理解而设计，能够从表格、图表、信息图、绘图、图示等中自动提取内容。该模型在一个精心策划的指令遵循数据集上训练，该数据集包含各种公共数据集和定制的合成数据集，以支持广泛的文档理解和通用图像任务。它通过对带有图像和文本模式的 Granite 大型语言模型进行微调来训练。

参考文献

Hugging Face

一个紧凑而高效的视觉-语言模型，专门为视觉文档理解而设计，能够从表格、图表、信息图、绘图、图示等中自动提取内容。

自述文件

参考文献