Files
DB-GPT/README.zh.md
2023-07-21 15:00:44 +08:00

8.2 KiB
Raw Blame History

DB-GPT: 用私有化LLM技术定义数据库下一代交互方式

DB-GPT 是什么?

随着大模型的发布迭代大模型变得越来越智能在使用大模型的过程当中遇到极大的数据安全与隐私挑战。在利用大模型能力的过程中我们的私密数据跟环境需要掌握自己的手里完全可控避免任何的数据隐私泄露以及安全风险。基于此我们发起了DB-GPT项目为所有以数据库为基础的场景构建一套完整的私有大模型解决方案。 此方案因为支持本地部署,所以不仅仅可以应用于独立私有环境,而且还可以根据业务模块独立部署隔离,让大模型的能力绝对私有、安全、可控。我们的愿景是让围绕数据库构建大模型应用更简单,更方便。

DB-GPT 是一个开源的以数据库为基础的GPT实验项目使用本地化的GPT大模型与您的数据和环境进行交互无数据泄露风险100% 私密

目录

DB-GPT视频介绍

效果演示

示例通过 RTX 4090 GPU 演示

https://github.com/csunny/DB-GPT/assets/13723926/55f31781-1d49-4757-b96e-7ef6d3dbcf80

根据自然语言对话生成分析图表

根据自然语言对话生成SQL

与数据库元数据信息进行对话, 生成准确SQL语句

与数据对话, 直接查看执行结果

知识库管理

根据知识库对话, 比如pdf、csv、txt、words等等.

特性一览

目前我们已经发布了多种关键的特性,这里一一列举展示一下当前发布的能力。

  • SQL 语言能力

    • SQL生成
    • SQL诊断
  • 私域问答与数据处理

    • 知识库管理(目前支持 txt, pdf, md, html, doc, ppt, and url)
    • 数据库知识问答
    • 数据处理
  • 插件模型

    • 支持自定义插件执行任务原生支持Auto-GPT插件。如:
      • SQL自动执行获取查询结果
      • 自动爬取学习知识
  • 知识库统一向量存储/索引

    • 非结构化数据支持包括PDF、MarkDown、CSV、WebURL
  • 多模型支持

    • 支持多种大语言模型, 当前已支持Vicuna(7b,13b), ChatGLM-6b(int4, int8), guanaco(7b,13b,33b), Gorilla(7b,13b), 🔥 llama-2(7b, 13b, 70b)
    • TODO: baichuan(7b, 13b)

Star History Chart

架构方案

DB-GPT基于 FastChat 构建大模型运行环境,并提供 vicuna 作为基础的大语言模型。此外我们通过LangChain提供私域知识库问答能力。同时我们支持插件模式, 在设计上原生支持Auto-GPT插件。我们的愿景是让围绕数据库和LLM构建应用程序更加简便和便捷。

整个DB-GPT的架构如下图所示

核心能力主要有以下几个部分。

  1. 知识库能力:支持私域知识库问答能力
  2. 大模型管理能力基于FastChat提供一个大模型的运营环境。
  3. 统一的数据向量化存储与索引:提供一种统一的方式来存储和索引各种数据类型。
  4. 连接模块:用于连接不同的模块和数据源,实现数据的流转和交互。
  5. Agent与插件提供Agent和插件机制使得用户可以自定义并增强系统的行为。
  6. Prompt自动生成与优化自动化生成高质量的Prompt并进行优化提高系统的响应效率。
  7. 多端产品界面支持多种不同的客户端产品例如Web、移动应用和桌面应用等。

子模块

Image

🌐 AutoDL镜像

安装

快速开始

多语言切换

在.env 配置文件当中修改LANGUAGE参数来切换使用不同的语言默认是英文(中文zh, 英文en, 其他语言待补充)

平台部署

  • autodl autodl镜像,从头搭建可参考镜像说明,或通过docker pull获取共享镜像,按照文档中的说明操作即可,若有问题,欢迎评论。

使用说明

多模型使用

使用指南

如果在使用知识库时遇到与nltk相关的错误您需要安装nltk工具包。更多详情请参见nltk文档 Run the Python interpreter and type the commands:

>>> import nltk
>>> nltk.download()

感谢

项目取得的成果,需要感谢技术社区,尤其以下项目。

贡献

  • 提交代码前请先执行 black .

这是一个用于数据库的复杂且创新的工具, 我们的项目也在紧急的开发当中, 会陆续发布一些新的feature。如在使用当中有任何具体问题, 优先在项目下提issue, 如有需要, 请联系如下微信,我会尽力提供帮助,同时也非常欢迎大家参与到项目建设中。

Licence

The MIT License (MIT)

路线图

联系我们