一种强大的自然语言到SQL生成的大规模语言模型。

7B

1,043 拉取 更新于 5 个月前

5个月前

f0eea48100a6 · 3.9GB

README


许可证: cc-by-sa-4.0

更新说明

模型权重于2024年2月7日UTC 早上7点更新。新的模型权重导致模型性能有了大幅提升——尤其是对于连接操作。

如果您在此之前已下载了模型,请重新下载权重以获得最佳性能。

SQLCoder-7B-2 模型卡片

一种强大的自然语言到SQL生成的大规模语言模型。

image/png

模型详细信息

模型描述

这是在Hub上推送的🤗 transformers模型的项目卡片。此项目卡片已自动生成。

  • 开发者: Defog, Inc
  • 模型类型: [文本到SQL]
  • 许可证: [CC-by-SA-4.0]
  • 微调自模型: [CodeLlama-7B]

模型来源 [可选]

用途

此模型旨在供非技术用户使用,以了解他们SQL数据库中的数据。这是一个分析工具,而不是数据库管理员工具。

此模型未经过训练以拒绝对数据库有写访问权限的用户提出的恶意请求,并且仅应由具有只读访问权限的用户使用。

如何开始使用模型

使用此代码 here 开始使用该模型。

提示

请使用以下提示以获取最佳结果。请记住,为了最佳结果,请使用 do_sample=Falsenum_beams=4

### Task
Generate a SQL query to answer [QUESTION]{user_question}[/QUESTION]

### Database Schema
The query will run on a database with the following schema:
{table_metadata_string_DDL_statements}

### Answer
Given the database schema, here is the SQL query that [QUESTION]{user_question}[/QUESTION]
[SQL]

评估

此模型在SQL-Eval(Defog开发的一个基于PostgreSQL的评估框架,用于测试和调整模型功能)上进行了评估。

您可以在这里了解更多关于SQLEval背后的方法。

结果

我们将生成的每个问题分类为6个类别之一。表显示了每个类别中每个模型正确回答问题的百分比。

日期 按group_by分组 按order_by排序 比例 连接 where条件
sqlcoder-70b 96 91.4 97.1 85.7 97.1 91.4
sqlcoder-7b-2 96 91.4 94.3 91.4 94.3 77.1
sqlcoder-34b 80 94.3 85.7 77.1 85.7 80
gpt-4 72 94.3 97.1 80 91.4 80
gpt-4-turbo 76 91.4 91.4 62.8 88.6 77.1
natural-sql-7b 56 88.6 85.7 60 88.6 80
sqlcoder-7b 64 82.9 74.3 54.3 74.3 74.3
gpt-3.5 72 77.1 82.8 34.3 65.7 71.4
claude-2 52 71.4 74.3 57.1 65.7 62.9

模型卡片联系方式

在X上通过 @defogdata 或电子邮件 founders@defog.ai 联系我们。