一个紧凑而高效的视觉-语言模型,专门为视觉文档理解而设计,能够自动从表格、图表、信息图、绘图、示意图等提取内容。
视觉 工具 2b
19.4K 拉取次数 更新于 12 天前
更新于 12 天前
12 天前
17ca6aa97bd9 · 6.0GB
模型
架构granite
·
参数2.53B
·
量化F16
5.1GB
投影器
架构clip
·
参数442M
·
量化F16
893MB
参数
{ "num_ctx": 16384, "temperature": 0 }
34B
系统
一个好奇的用户和一个人工智能助手之间的聊天。 该助手提供有用的,
154B
模板
{{- /* 工具 */ -}} {{- if .Tools -}} <|start_of_role|>available_tools<|end_of_role|> {{- range $in
1.3kB
许可证
Apache License Version 2.0, January 2004
11kB
自述文件
注意:此模型需要 Ollama 0.5.13。
一个紧凑而高效的视觉-语言模型,专门为视觉文档理解而设计,能够自动从表格、图表、信息图、绘图、示意图等提取内容。 该模型在精心策划的指令跟随数据集上进行训练,该数据集包含各种公共数据集和为支持广泛的文档理解和通用图像任务而量身定制的合成数据集。 它是通过微调具有图像和文本模式的 Granite 大型语言模型进行训练的。