DB-GPT/pilot/configs/model_config.py

#!/usr/bin/env python3
# -*- coding:utf-8 -*-

import torch
import os
import nltk


ROOT_PATH = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
MODEL_PATH = os.path.join(ROOT_PATH, "models")
PILOT_PATH = os.path.join(ROOT_PATH, "pilot")
VECTORE_PATH = os.path.join(PILOT_PATH, "vector_store")
LOGDIR = os.path.join(ROOT_PATH, "logs")
DATASETS_DIR = os.path.join(PILOT_PATH, "datasets")
DATA_DIR = os.path.join(PILOT_PATH, "data")

nltk.data.path = [os.path.join(PILOT_PATH, "nltk_data")] + nltk.data.path

DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
LLM_MODEL_CONFIG = {
    "flan-t5-base": os.path.join(MODEL_PATH, "flan-t5-base"),
    "vicuna-13b": os.path.join(MODEL_PATH, "vicuna-13b"),
    "sentence-transforms": os.path.join(MODEL_PATH, "all-MiniLM-L6-v2")
}


VECTOR_SEARCH_TOP_K = 3
LLM_MODEL = "vicuna-13b"
LIMIT_MODEL_CONCURRENCY = 5
MAX_POSITION_EMBEDDINGS = 4096
VICUNA_MODEL_SERVER = "http://121.41.167.183:8000"

# Load model config
ISLOAD_8BIT = True
ISDEBUG = False


DB_SETTINGS = {
    "user": "root",
    "password": "aa123456",
    "host": "127.0.0.1",
    "port": 3306
}

VS_ROOT_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "vs_store")
KNOWLEDGE_UPLOAD_ROOT_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "knowledge")
MODEL_NAME_PATH = "model/all-MiniLM-L6-v2"