From 4fb29b8071eaf7b1760d1b83aa426d55a54cc8f3 Mon Sep 17 00:00:00 2001 From: csunny Date: Mon, 15 May 2023 15:56:34 +0800 Subject: [PATCH] fix readme --- README.md | 22 +++++++++++----------- 1 file changed, 11 insertions(+), 11 deletions(-) diff --git a/README.md b/README.md index 6269092e2..ba2125c75 100644 --- a/README.md +++ b/README.md @@ -4,14 +4,14 @@ [English Edition](README.en.md) ## 背景 -随着大模型的发布迭代,大模型变得越来越智能,我们在使用大模型的过程当中,遇到极大的数据安全与隐私挑战。在利用大模型能力的过程中我们的私密数据跟环境需要掌握自己的手里,完全可控,避免任何的数据隐私泄露以及安全风险。基于此,我们发起了DB-GPT项目,为所有以数据库为基础的场景,构建一套完整的私有大模型解决方案。 此方案因为支持本地部署,所以我们不仅仅可以应用于独立私有环境,而且还可以根据业务模块独立部署隔离,让大模型的能力绝对私有、安全、可控。 +随着大模型的发布迭代,大模型变得越来越智能,在使用大模型的过程当中,遇到极大的数据安全与隐私挑战。在利用大模型能力的过程中我们的私密数据跟环境需要掌握自己的手里,完全可控,避免任何的数据隐私泄露以及安全风险。基于此,我们发起了DB-GPT项目,为所有以数据库为基础的场景,构建一套完整的私有大模型解决方案。 此方案因为支持本地部署,所以不仅仅可以应用于独立私有环境,而且还可以根据业务模块独立部署隔离,让大模型的能力绝对私有、安全、可控。 ## 愿景 -DB-GPT 是一个开源的以数据为基础的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,无数据泄露风险,100% 私密,100% 安全。 +DB-GPT 是一个开源的以数据库为基础的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,无数据泄露风险,100% 私密,100% 安全。 ## 特性一览 -目前我们已经发布了多种关键的特性,这里我们一一列举展示一下我们当前发布的能力。 +目前我们已经发布了多种关键的特性,这里一一列举展示一下当前发布的能力。 - SQL 语言能力 - SQL生成 - SQL诊断 @@ -69,7 +69,7 @@ DB-GPT 是一个开源的以数据为基础的GPT实验项目,使用本地化 - TODO ## 架构方案 -DB-GPT基于[FastChat](https://github.com/lm-sys/FastChat) 构建大模型运行环境,并提供 vicuna 作为基础的大语言模型。此外,我们通过 langchain提供私域知识库问答能力。同时我们支持插件模式, 在设计上原生支持Auto-GPT插件。 +DB-GPT基于[FastChat](https://github.com/lm-sys/FastChat) 构建大模型运行环境,并提供 vicuna 作为基础的大语言模型。此外,我们通过langchain提供私域知识库问答能力。同时我们支持插件模式, 在设计上原生支持Auto-GPT插件。 整个DB-GPT的架构,如下图所示 @@ -89,22 +89,22 @@ DB-GPT基于[FastChat](https://github.com/lm-sys/FastChat) 构建大模型运行 下面对每个模块也做一些简要的介绍: ### 知识库能力 -知识库作为当前用户需求最大的场景,我们原生支持知识库的构建与处理。同时在我们的项目当中,也提供了多种知识库的管理策略。 如: 1. 默认内置知识库 2. 自定义新增知识库 3. 通过插件能力自抓取构建知识库等多种使用场景。 用户只需要整理好知识文档,即可用我们现有的能力构建大模型所需要的知识库能力。 +知识库作为当前用户需求最大的场景,我们原生支持知识库的构建与处理。同时在本项目当中,也提供了多种知识库的管理策略。 如: 1. 默认内置知识库 2. 自定义新增知识库 3. 通过插件能力自抓取构建知识库等多种使用场景。 用户只需要整理好知识文档,即可用我们现有的能力构建大模型所需要的知识库能力。 ### 大模型管理能力 -在底层大模型接入中,我们设计了开放的接口,支持对接多种大模型。同时对于接入模型的效果,我们有非常严格的把控与评审机制。对大模型能力上与ChatGPT对比,在准确率上需要满足85%以上的能力对齐。我们用更高的标准筛选模型,是期望在用户使用过程中,可以省去前面繁琐的测试评估环节。 +在底层大模型接入中,设计了开放的接口,支持对接多种大模型。同时对于接入模型的效果,我们有非常严格的把控与评审机制。对大模型能力上与ChatGPT对比,在准确率上需要满足85%以上的能力对齐。我们用更高的标准筛选模型,是期望在用户使用过程中,可以省去前面繁琐的测试评估环节。 ### 统一的数据向量化存储与索引 -为了方便对知识向量化之后的管理,我们内置了多种向量存储引擎,从基于内存的Chroma到分布式的Milvus, 用户可以根据自己的场景需求,选择不同的存储引擎,整个知识向量存储是AI能力增强的基石,向量作为人与大语言模型交互的中间语言,在我们的架构中的作用非常重要。 +为了方便对知识向量化之后的管理,我们内置了多种向量存储引擎,从基于内存的Chroma到分布式的Milvus, 可以根据自己的场景需求,选择不同的存储引擎,整个知识向量存储是AI能力增强的基石,向量作为人与大语言模型交互的中间语言,在本项目中的作用非常重要。 ### 连接模块 -为了能够更方便的与用户的私有环境进行交互,我们设计了连接模块,连接模块可以支持连接到数据库、Excel、知识库等等多种环境当中,实现信息与数据交互。 +为了能够更方便的与用户的私有环境进行交互,项目设计了连接模块,连接模块可以支持连接到数据库、Excel、知识库等等多种环境当中,实现信息与数据交互。 ### Agent与插件 -Agent与插件能力是大模型能否自动化的核心,在我们的项目中,我们原生支持插件模式,大模型可以自动化完成目标。 同时为了充分发挥社区的优势,我们在插件原生支持Auto-GPT插件生态,即Auto-GPT的插件可以直接在我们的项目中运行。 +Agent与插件能力是大模型能否自动化的核心,在本的项目中,原生支持插件模式,大模型可以自动化完成目标。 同时为了充分发挥社区的优势,本项目中所用的插件原生支持Auto-GPT插件生态,即Auto-GPT的插件可以直接在我们的项目中运行。 ### Prompt自动生成与优化 -Prompt是与大模型交互过程中非常重要的部分,一定程度上Prompt决定了大模型生成答案的质量与准确性,在我们的项目中,我们会根据用户输入与使用场景,自动优化对应的Prompt,让用户使用大语言模型变得更简单、更高效。 +Prompt是与大模型交互过程中非常重要的部分,一定程度上Prompt决定了大模型生成答案的质量与准确性,在本的项目中,我们会根据用户输入与使用场景,自动优化对应的Prompt,让用户使用大语言模型变得更简单、更高效。 ### 多端产品界面 TODO: 在终端展示上,我们将提供多端产品界面。包括PC、手机、命令行、slack等多种模式。 @@ -194,7 +194,7 @@ This project follows the git-contributor [spec](https://github.com/xudafeng/git- -这是一个用于数据库的复杂且创新的工具,如有任何具体问题,请联系如下微信,我会尽力提供帮助,同时也欢迎参与到项目建设中。 +这是一个用于数据库的复杂且创新的工具, 我们的项目也在紧急的开发当中, 会陆续发布很多新的feature。如在使用当中有任何具体问题,请联系如下微信,我会尽力提供帮助,同时也非常欢迎大家参与到项目建设中。