feat(model):llm manage

2025-08-06 19:04:24 +00:00 · 2023-09-18 19:29:37 +08:00 · 2023-09-18 19:29:37 +08:00 · 1356759f48
commit 1356759f48
parent ad5bfdc61d
3 changed files with 150 additions and 0 deletions
--- a/pilot/server/dbgpt_server.py
+++ b/pilot/server/dbgpt_server.py
@ -23,6 +23,7 @@ from fastapi.openapi.docs import get_swagger_ui_html
 from fastapi.exceptions import RequestValidationError
 from fastapi.middleware.cors import CORSMiddleware
 from pilot.server.knowledge.api import router as knowledge_router
 from pilot.server.llm_manage.api import router as llm_manage_api
 from pilot.openapi.api_v1.api_v1 import router as api_v1
@ -71,6 +72,7 @@ app.add_middleware(
 app.include_router(api_v1, prefix="/api")
 app.include_router(knowledge_router, prefix="/api")
 app.include_router(api_editor_route_v1, prefix="/api")
 app.include_router(llm_manage_api, prefix="/api")
 # app.include_router(api_v1)
 app.include_router(knowledge_router)
--- a/pilot/server/llm_manage/api.py
+++ b/pilot/server/llm_manage/api.py
@ -0,0 +1,120 @@
 from fastapi import APIRouter
 from pilot.componet import ComponetType
 from pilot.configs.config import Config
 from pilot.model.base import ModelInstance, WorkerApplyType
 from pilot.model.cluster import WorkerStartupRequest
 from pilot.openapi.api_view_model import Result
 from pilot.server.llm_manage.request.request import ModelResponse
 CFG = Config()
 router = APIRouter()
@router.post("/controller/list")
 async def controller_list(request: ModelInstance):
    print(f"/controller/list params:")
    try:
        CFG.LLM_MODEL = request.model_name
        return Result.succ("success")
    except Exception as e:
        return Result.faild(code="E000X", msg=f"space list error {e}")
@router.get("/v1/worker/model/list")
 async def model_list():
    print(f"/worker/model/list")
    try:
        from pilot.model.cluster.controller.controller import BaseModelController
        controller = CFG.SYSTEM_APP.get_componet(
            ComponetType.MODEL_CONTROLLER, BaseModelController
        )
        responses = []
        managers = await controller.get_all_instances(
            model_name="WorkerManager@service", healthy_only=True
        )
        manager_map = dict(map(lambda manager: (manager.host, manager), managers))
        models = await controller.get_all_instances()
        for model in models:
            worker_name, worker_type = model.model_name.split("@")
            if worker_type == "llm" or worker_type == "text2vec":
                response = ModelResponse(
                    model_name=worker_name,
                    model_type=worker_type,
                    host=model.host,
                    port=model.port,
                    healthy=model.healthy,
                    check_healthy=model.check_healthy,
                    last_heartbeat=model.last_heartbeat,
                    prompt_template=model.prompt_template,
                )
                response.manager_host = model.host if manager_map[model.host] else None
                response.manager_port = (
                    manager_map[model.host].port if manager_map[model.host] else None
                )
                responses.append(response)
        return Result.succ(responses)
    except Exception as e:
        return Result.faild(code="E000X", msg=f"space list error {e}")
@router.post("/v1/worker/model/stop")
 async def model_start(request: WorkerStartupRequest):
    print(f"/v1/worker/model/stop:")
    try:
        from pilot.model.cluster.controller.controller import BaseModelController
        controller = CFG.SYSTEM_APP.get_componet(
            ComponetType.MODEL_CONTROLLER, BaseModelController
        )
        instances = await controller.get_all_instances(model_name="WorkerManager@service", healthy_only=True)
        worker_instance = None
        for instance in instances:
            if (
                instance.host == request.host
                and instance.port == request.port
            ):
                from pilot.model.cluster import ModelRegistryClient
                from pilot.model.cluster import RemoteWorkerManager
                registry = ModelRegistryClient(f"http://{request.host}:{request.port}")
                worker_manager = RemoteWorkerManager(registry)
                return Result.succ(await worker_manager.model_shutdown(request))
        if not worker_instance:
            return Result.faild(code="E000X", msg=f"can not find worker manager")
    except Exception as e:
        return Result.faild(code="E000X", msg=f"model stop failed {e}")
@router.post("/v1/worker/model/start")
 async def model_start(request: WorkerStartupRequest):
    print(f"/v1/worker/model/start:")
    try:
        from pilot.model.cluster.controller.controller import BaseModelController
        controller = CFG.SYSTEM_APP.get_componet(
            ComponetType.MODEL_CONTROLLER, BaseModelController
        )
        instances = await controller.get_all_instances(model_name="WorkerManager@service", healthy_only=True)
        worker_instance = None
        for instance in instances:
            if (
                instance.host == request.host
                and instance.port == request.port
            ):
                from pilot.model.cluster import ModelRegistryClient
                from pilot.model.cluster import RemoteWorkerManager
                registry = ModelRegistryClient(f"http://{request.host}:{request.port}")
                worker_manager = RemoteWorkerManager(registry)
                return Result.succ(await worker_manager.model_startup(request))
        if not worker_instance:
            return Result.faild(code="E000X", msg=f"can not find worker manager")
    except Exception as e:
        return Result.faild(code="E000X", msg=f"model start failed {e}")
--- a/pilot/server/llm_manage/request/request.py
+++ b/pilot/server/llm_manage/request/request.py
@ -0,0 +1,28 @@
 from dataclasses import dataclass
@dataclass
 class ModelResponse:
    """ModelRequest"""
    """model_name: model_name"""
    model_name: str = None
    """model_type: model_type"""
    model_type: str = None
    """host: host"""
    host: str = None
    """port: port"""
    port: int = None
    """manager_host: manager_host"""
    manager_host: str = None
    """manager_port: manager_port"""
    manager_port: int = None
    """healthy: healthy"""
    healthy: bool = True
    """check_healthy: check_healthy"""
    check_healthy: bool = True
    prompt_template: str = None
    last_heartbeat: str = None
    stream_api: str = None
    nostream_api: str = None