granite3.2-vision - Ollama 框架

granite3.2-vision

一个紧凑而高效的视觉语言模型，专门为视觉文档理解而设计，能够自动从表格、图表、信息图、绘图、示意图等中提取内容。

vision（视觉） tools（工具） 2b

19.3K 下载量更新于 12 天前

更新于 12 天前

12 天前

3be41a661804 · 2.4GB

{ "num_ctx": 16384, "temperature": 0 }

一个好奇的用户和一个人工智能助手之间的对话。助手会给出有帮助的，

{{- /* Tools */ -}} {{- if .Tools -}} <|start_of_role|>available_tools<|end_of_role|> {{- range $in

Apache License Version 2.0, January 2004

自述文件

注意：此模型需要 Ollama 0.5.13。

一个紧凑而高效的视觉语言模型，专门为视觉文档理解而设计，能够自动从表格、图表、信息图、绘图、示意图等中提取内容。该模型在精心策划的指令跟随数据集上进行训练，该数据集包含各种公共数据集和针对支持各种文档理解和一般图像任务而定制的合成数据集。它是通过使用图像和文本模态微调 Granite 大型语言模型来训练的。

参考