DB-GPT/dbgpt/agent/core/base_agent.py

"""Base agent class for conversable agents."""

import asyncio
import json
import logging
from typing import Any, Dict, List, Optional, Tuple, Type, Union, cast

from dbgpt._private.pydantic import Field
from dbgpt.core import LLMClient, ModelMessageRoleType
from dbgpt.util.error_types import LLMChatError
from dbgpt.util.utils import colored

from ..actions.action import Action, ActionOutput
from ..memory.base import GptsMessage
from ..memory.gpts_memory import GptsMemory
from ..resource.resource_api import AgentResource, ResourceClient
from ..resource.resource_loader import ResourceLoader
from .agent import Agent, AgentContext, AgentMessage, AgentReviewInfo
from .llm.llm import LLMConfig, LLMStrategyType
from .llm.llm_client import AIWrapper
from .role import Role

logger = logging.getLogger(__name__)


class ConversableAgent(Role, Agent):
    """ConversableAgent is a agent that can communicate with other agents."""

    agent_context: Optional[AgentContext] = Field(None, description="Agent context")
    actions: List[Action] = Field(default_factory=list)
    resources: List[AgentResource] = Field(default_factory=list)
    llm_config: Optional[LLMConfig] = None
    memory: GptsMemory = Field(default_factory=GptsMemory)
    resource_loader: Optional[ResourceLoader] = None
    max_retry_count: int = 3
    consecutive_auto_reply_counter: int = 0
    llm_client: Optional[AIWrapper] = None
    oai_system_message: List[Dict] = Field(default_factory=list)

    class Config:
        """Pydantic configuration."""

        arbitrary_types_allowed = True

    def __init__(self, **kwargs):
        """Create a new agent."""
        Role.__init__(self, **kwargs)
        Agent.__init__(self)

    def init_system_message(self) -> None:
        """Initialize the system message."""
        content = self.prompt_template()
        # TODO: Don't modify the original data, need to be optimized
        self.oai_system_message = [
            {"content": content, "role": ModelMessageRoleType.SYSTEM}
        ]

    def check_available(self) -> None:
        """Check if the agent is available.

        Raises:
            ValueError: If the agent is not available.
        """
        self.identity_check()
        # check run context
        if self.agent_context is None:
            raise ValueError(
                f"{self.name}[{self.profile}] Missing context in which agent is "
                f"running!"
            )

        # resource check
        for resource in self.resources:
            if (
                self.resource_loader is None
                or self.resource_loader.get_resource_api(
                    resource.type, check_instance=False
                )
                is None
            ):
                raise ValueError(
                    f"Resource {resource.type}:{resource.value} missing resource loader"
                    f" implementation,unable to read resources!"
                )

        # action check
        if self.actions and len(self.actions) > 0:
            have_resource_types = [item.type for item in self.resources]
            for action in self.actions:
                if (
                    action.resource_need
                    and action.resource_need not in have_resource_types
                ):
                    raise ValueError(
                        f"{self.name}[{self.profile}] Missing resources required for "
                        "runtime！"
                    )
        else:
            if not self.is_human and not self.is_team:
                raise ValueError(
                    f"This agent {self.name}[{self.profile}] is missing action modules."
                )
        # llm check
        if not self.is_human and (
            self.llm_config is None or self.llm_config.llm_client is None
        ):
            raise ValueError(
                f"{self.name}[{self.profile}] Model configuration is missing or model "
                "service is unavailable！"
            )

    @property
    def not_null_agent_context(self) -> AgentContext:
        """Get the agent context.

        Returns:
            AgentContext: The agent context.

        Raises:
            ValueError: If the agent context is not initialized.
        """
        if not self.agent_context:
            raise ValueError("Agent context is not initialized！")
        return self.agent_context

    @property
    def not_null_resource_loader(self) -> ResourceLoader:
        """Get the resource loader."""
        if not self.resource_loader:
            raise ValueError("Resource loader is not initialized！")
        return self.resource_loader

    @property
    def not_null_llm_config(self) -> LLMConfig:
        """Get the LLM config."""
        if not self.llm_config:
            raise ValueError("LLM config is not initialized！")
        return self.llm_config

    @property
    def not_null_llm_client(self) -> LLMClient:
        """Get the LLM client."""
        llm_client = self.not_null_llm_config.llm_client
        if not llm_client:
            raise ValueError("LLM client is not initialized！")
        return llm_client

    async def preload_resource(self) -> None:
        """Preload resources before agent initialization."""
        pass

    async def build(self) -> "ConversableAgent":
        """Build the agent."""
        # Check if agent is available
        self.check_available()
        _language = self.not_null_agent_context.language
        if _language:
            self.language = _language

        # Preload resources
        await self.preload_resource()
        # Initialize resource loader
        for action in self.actions:
            action.init_resource_loader(self.resource_loader)

        # Initialize system messages
        self.init_system_message()

        # Initialize LLM Server
        if not self.is_human:
            if not self.llm_config or not self.llm_config.llm_client:
                raise ValueError("LLM client is not initialized！")
            self.llm_client = AIWrapper(llm_client=self.llm_config.llm_client)
        return self

    def bind(self, target: Any) -> "ConversableAgent":
        """Bind the resources to the agent."""
        if isinstance(target, LLMConfig):
            self.llm_config = target
        elif isinstance(target, GptsMemory):
            self.memory = target
        elif isinstance(target, AgentContext):
            self.agent_context = target
        elif isinstance(target, ResourceLoader):
            self.resource_loader = target
        elif isinstance(target, list) and target and len(target) > 0:
            if _is_list_of_type(target, Action):
                self.actions.extend(target)
            elif _is_list_of_type(target, AgentResource):
                self.resources = target
        return self

    async def send(
        self,
        message: AgentMessage,
        recipient: Agent,
        reviewer: Optional[Agent] = None,
        request_reply: Optional[bool] = True,
        is_recovery: Optional[bool] = False,
    ) -> None:
        """Send a message to recipient agent."""
        await recipient.receive(
            message=message,
            sender=self,
            reviewer=reviewer,
            request_reply=request_reply,
            is_recovery=is_recovery,
        )

    async def receive(
        self,
        message: AgentMessage,
        sender: Agent,
        reviewer: Optional[Agent] = None,
        request_reply: Optional[bool] = None,
        silent: Optional[bool] = False,
        is_recovery: Optional[bool] = False,
    ) -> None:
        """Receive a message from another agent."""
        await self._a_process_received_message(message, sender)
        if request_reply is False or request_reply is None:
            return

        if not self.is_human:
            reply = await self.generate_reply(
                received_message=message, sender=sender, reviewer=reviewer
            )
            if reply is not None:
                await self.send(reply, sender)

    def prepare_act_param(self) -> Dict[str, Any]:
        """Prepare the parameters for the act method."""
        return {}

    async def generate_reply(
        self,
        received_message: AgentMessage,
        sender: Agent,
        reviewer: Optional[Agent] = None,
        rely_messages: Optional[List[AgentMessage]] = None,
        **kwargs,
    ) -> AgentMessage:
        """Generate a reply based on the received messages."""
        logger.info(
            f"generate agent reply!sender={sender}, rely_messages_len={rely_messages}"
        )
        try:
            reply_message: AgentMessage = self._init_reply_message(
                received_message=received_message
            )
            await self._system_message_assembly(
                received_message.content, reply_message.context
            )

            fail_reason = None
            current_retry_counter = 0
            is_success = True
            while current_retry_counter < self.max_retry_count:
                if current_retry_counter > 0:
                    retry_message = self._init_reply_message(
                        received_message=received_message
                    )
                    retry_message.content = fail_reason
                    retry_message.current_goal = received_message.current_goal
                    # The current message is a self-optimized message that needs to be
                    # recorded.
                    # It is temporarily set to be initiated by the originating end to
                    # facilitate the organization of historical memory context.
                    await sender.send(
                        retry_message, self, reviewer, request_reply=False
                    )

                # 1.Think about how to do things
                llm_reply, model_name = await self.thinking(
                    self._load_thinking_messages(
                        received_message, sender, rely_messages
                    )
                )
                reply_message.model_name = model_name
                reply_message.content = llm_reply

                # 2.Review whether what is being done is legal
                approve, comments = await self.review(llm_reply, self)
                reply_message.review_info = AgentReviewInfo(
                    approve=approve,
                    comments=comments,
                )

                # 3.Act based on the results of your thinking
                act_extent_param = self.prepare_act_param()
                act_out: Optional[ActionOutput] = await self.act(
                    message=llm_reply,
                    sender=sender,
                    reviewer=reviewer,
                    **act_extent_param,
                )
                if act_out:
                    reply_message.action_report = act_out.dict()

                # 4.Reply information verification
                check_pass, reason = await self.verify(reply_message, sender, reviewer)
                is_success = check_pass
                # 5.Optimize wrong answers myself
                if not check_pass:
                    current_retry_counter += 1
                    # Send error messages and issue new problem-solving instructions
                    if current_retry_counter < self.max_retry_count:
                        await self.send(
                            reply_message, sender, reviewer, request_reply=False
                        )
                    fail_reason = reason
                else:
                    break
            reply_message.success = is_success
            return reply_message

        except Exception as e:
            logger.exception("Generate reply exception!")
            err_message = AgentMessage(content=str(e))
            err_message.success = False
            return err_message

    async def thinking(
        self, messages: List[AgentMessage], prompt: Optional[str] = None
    ) -> Tuple[Optional[str], Optional[str]]:
        """Think and reason about the current task goal.

        Args:
            messages(List[AgentMessage]): the messages to be reasoned
            prompt(str): the prompt to be reasoned
        """
        last_model = None
        last_err = None
        retry_count = 0
        llm_messages = [message.to_llm_message() for message in messages]
        # LLM inference automatically retries 3 times to reduce interruption
        # probability caused by speed limit and network stability
        while retry_count < 3:
            llm_model = await self._a_select_llm_model(last_model)
            try:
                if prompt:
                    llm_messages = _new_system_message(prompt) + llm_messages
                else:
                    llm_messages = self.oai_system_message + llm_messages

                if not self.llm_client:
                    raise ValueError("LLM client is not initialized!")
                response = await self.llm_client.create(
                    context=llm_messages[-1].pop("context", None),
                    messages=llm_messages,
                    llm_model=llm_model,
                    max_new_tokens=self.not_null_agent_context.max_new_tokens,
                    temperature=self.not_null_agent_context.temperature,
                )
                return response, llm_model
            except LLMChatError as e:
                logger.error(f"model:{llm_model} generate Failed!{str(e)}")
                retry_count += 1
                last_model = llm_model
                last_err = str(e)
                await asyncio.sleep(10)

        if last_err:
            raise ValueError(last_err)
        else:
            raise ValueError("LLM model inference failed!")

    async def review(self, message: Optional[str], censored: Agent) -> Tuple[bool, Any]:
        """Review the message based on the censored message."""
        return True, None

    async def act(
        self,
        message: Optional[str],
        sender: Optional[Agent] = None,
        reviewer: Optional[Agent] = None,
        **kwargs,
    ) -> Optional[ActionOutput]:
        """Perform actions."""
        last_out: Optional[ActionOutput] = None
        for action in self.actions:
            # Select the resources required by acton
            need_resource = None
            if self.resources and len(self.resources) > 0:
                for item in self.resources:
                    if item.type == action.resource_need:
                        need_resource = item
                        break

            if not message:
                raise ValueError("The message content is empty!")

            last_out = await action.run(
                ai_message=message,
                resource=need_resource,
                rely_action_out=last_out,
                **kwargs,
            )
        return last_out

    async def correctness_check(
        self, message: AgentMessage
    ) -> Tuple[bool, Optional[str]]:
        """Verify the correctness of the results."""
        return True, None

    async def verify(
        self,
        message: AgentMessage,
        sender: Agent,
        reviewer: Optional[Agent] = None,
        **kwargs,
    ) -> Tuple[bool, Optional[str]]:
        """Verify the current execution results."""
        # Check approval results
        if message.review_info and not message.review_info.approve:
            return False, message.review_info.comments

        # Check action run results
        action_output: Optional[ActionOutput] = ActionOutput.from_dict(
            message.action_report
        )
        if action_output:
            if not action_output.is_exe_success:
                return False, action_output.content
            elif not action_output.content or len(action_output.content.strip()) < 1:
                return (
                    False,
                    "The current execution result is empty. Please rethink the "
                    "question and background and generate a new answer.. ",
                )

        # agent output correctness check
        return await self.correctness_check(message)

    async def initiate_chat(
        self,
        recipient: Agent,
        reviewer: Optional[Agent] = None,
        message: Optional[str] = None,
    ):
        """Initiate a chat with another agent.

        Args:
            recipient (Agent): The recipient agent.
            reviewer (Agent): The reviewer agent.
            message (str): The message to send.
        """
        await self.send(
            AgentMessage(content=message, current_goal=message),
            recipient,
            reviewer,
            request_reply=True,
        )

    #######################################################################
    # Private Function Begin
    #######################################################################

    def _init_actions(self, actions: List[Type[Action]]):
        self.actions = []
        for idx, action in enumerate(actions):
            if issubclass(action, Action):
                self.actions.append(action())

    async def _a_append_message(
        self, message: AgentMessage, role, sender: Agent
    ) -> bool:
        new_sender = cast(ConversableAgent, sender)
        self.consecutive_auto_reply_counter = (
            new_sender.consecutive_auto_reply_counter + 1
        )
        message_dict = message.to_dict()
        oai_message = {
            k: message_dict[k]
            for k in (
                "content",
                "function_call",
                "name",
                "context",
                "action_report",
                "review_info",
                "current_goal",
                "model_name",
            )
            if k in message_dict
        }

        gpts_message: GptsMessage = GptsMessage(
            conv_id=self.not_null_agent_context.conv_id,
            sender=sender.get_profile(),
            receiver=self.profile,
            role=role,
            rounds=self.consecutive_auto_reply_counter,
            current_goal=oai_message.get("current_goal", None),
            content=oai_message.get("content", None),
            context=json.dumps(oai_message["context"], ensure_ascii=False)
            if "context" in oai_message
            else None,
            review_info=json.dumps(oai_message["review_info"], ensure_ascii=False)
            if "review_info" in oai_message
            else None,
            action_report=json.dumps(oai_message["action_report"], ensure_ascii=False)
            if "action_report" in oai_message
            else None,
            model_name=oai_message.get("model_name", None),
        )

        self.memory.message_memory.append(gpts_message)
        return True

    def _print_received_message(self, message: AgentMessage, sender: Agent):
        # print the message received
        print("\n", "-" * 80, flush=True, sep="")
        _print_name = self.name if self.name else self.profile
        print(
            colored(
                sender.get_name() if sender.get_name() else sender.get_profile(),
                "yellow",
            ),
            "(to",
            f"{_print_name})-[{message.model_name or ''}]:\n",
            flush=True,
        )

        content = json.dumps(message.content, ensure_ascii=False)
        if content is not None:
            print(content, flush=True)

        review_info = message.review_info
        if review_info:
            name = sender.get_name() if sender.get_name() else sender.get_profile()
            pass_msg = "Pass" if review_info.approve else "Reject"
            review_msg = f"{pass_msg}({review_info.comments})"
            approve_print = f">>>>>>>>{name} Review info: \n{review_msg}"
            print(colored(approve_print, "green"), flush=True)

        action_report = message.action_report
        if action_report:
            name = sender.get_name() if sender.get_name() else sender.get_profile()
            action_msg = (
                "execution succeeded"
                if action_report["is_exe_success"]
                else "execution failed"
            )
            action_report_msg = f"{action_msg},\n{action_report['content']}"
            action_print = f">>>>>>>>{name} Action report: \n{action_report_msg}"
            print(colored(action_print, "blue"), flush=True)

        print("\n", "-" * 80, flush=True, sep="")

    async def _a_process_received_message(self, message: AgentMessage, sender: Agent):
        valid = await self._a_append_message(message, None, sender)
        if not valid:
            raise ValueError(
                "Received message can't be converted into a valid ChatCompletion"
                " message. Either content or function_call must be provided."
            )

        self._print_received_message(message, sender)

    async def _system_message_assembly(
        self, question: Optional[str], context: Optional[Union[str, Dict]] = None
    ):
        # system message
        self.init_system_message()
        if len(self.oai_system_message) > 0:
            resource_prompt_list = []
            for item in self.resources:
                resource_client = self.not_null_resource_loader.get_resource_api(
                    item.type, ResourceClient
                )
                if not resource_client:
                    raise ValueError(
                        f"Resource {item.type}:{item.value} missing resource loader"
                        f" implementation,unable to read resources!"
                    )
                resource_prompt_list.append(
                    await resource_client.get_resource_prompt(item, question)
                )
            if context is None or not isinstance(context, dict):
                context = {}

            resource_prompt = ""
            if len(resource_prompt_list) > 0:
                resource_prompt = "RESOURCES:" + "\n".join(resource_prompt_list)

            out_schema: Optional[str] = ""
            if self.actions and len(self.actions) > 0:
                out_schema = self.actions[0].ai_out_schema
            for message in self.oai_system_message:
                new_content = message["content"].format(
                    resource_prompt=resource_prompt,
                    out_schema=out_schema,
                    **context,
                )
                message["content"] = new_content

    def _excluded_models(
        self,
        all_models: List[str],
        order_llms: Optional[List[str]] = None,
        excluded_models: Optional[List[str]] = None,
    ):
        if not order_llms:
            order_llms = []
        if not excluded_models:
            excluded_models = []
        can_uses = []
        if order_llms and len(order_llms) > 0:
            for llm_name in order_llms:
                if llm_name in all_models and (
                    not excluded_models or llm_name not in excluded_models
                ):
                    can_uses.append(llm_name)
        else:
            for llm_name in all_models:
                if not excluded_models or llm_name not in excluded_models:
                    can_uses.append(llm_name)

        return can_uses

    async def _a_select_llm_model(
        self, excluded_models: Optional[List[str]] = None
    ) -> str:
        logger.info(f"_a_select_llm_model:{excluded_models}")
        try:
            all_models = await self.not_null_llm_client.models()
            all_model_names = [item.model for item in all_models]
            # TODO Currently only two strategies, priority and default, are implemented.
            if self.not_null_llm_config.llm_strategy == LLMStrategyType.Priority:
                priority: List[str] = []
                strategy_context = self.not_null_llm_config.strategy_context
                if strategy_context is not None:
                    priority = json.loads(strategy_context)  # type: ignore
                can_uses = self._excluded_models(
                    all_model_names, priority, excluded_models
                )
            else:
                can_uses = self._excluded_models(all_model_names, None, excluded_models)
            if can_uses and len(can_uses) > 0:
                return can_uses[0]
            else:
                raise ValueError("No model service available!")
        except Exception as e:
            logger.error(f"{self.profile} get next llm failed!{str(e)}")
            raise ValueError(f"Failed to allocate model service,{str(e)}!")

    def _init_reply_message(self, received_message: AgentMessage) -> AgentMessage:
        """Create a new message from the received message.

        Initialize a new message from the received message

        Args:
            received_message(AgentMessage): The received message

        Returns:
            AgentMessage: A new message
        """
        return AgentMessage(
            content=received_message.content,
            current_goal=received_message.current_goal,
        )

    def _convert_to_ai_message(
        self, gpts_messages: List[GptsMessage]
    ) -> List[AgentMessage]:
        oai_messages: List[AgentMessage] = []
        # Based on the current agent, all messages received are user, and all messages
        # sent are assistant.
        for item in gpts_messages:
            if item.role:
                role = item.role
            else:
                if item.receiver == self.profile:
                    role = ModelMessageRoleType.HUMAN
                elif item.sender == self.profile:
                    role = ModelMessageRoleType.AI
                else:
                    continue

            # Message conversion, priority is given to converting execution results,
            # and only model output results will be used if not.
            content = item.content
            if item.action_report:
                action_out = ActionOutput.from_dict(json.loads(item.action_report))
                if (
                    action_out is not None
                    and action_out.is_exe_success
                    and action_out.content is not None
                ):
                    content = action_out.content
            oai_messages.append(
                AgentMessage(
                    content=content,
                    role=role,
                    context=json.loads(item.context)
                    if item.context is not None
                    else None,
                )
            )
        return oai_messages

    def _load_thinking_messages(
        self,
        received_message: AgentMessage,
        sender: Agent,
        rely_messages: Optional[List[AgentMessage]] = None,
    ) -> List[AgentMessage]:
        current_goal = received_message.current_goal

        # Convert and tailor the information in collective memory into contextual
        # memory available to the current Agent
        current_goal_messages = self._convert_to_ai_message(
            self.memory.message_memory.get_between_agents(
                self.not_null_agent_context.conv_id,
                self.profile,
                sender.get_profile(),
                current_goal,
            )
        )

        # When there is no target and context, the current received message is used as
        # the target problem
        if current_goal_messages is None or len(current_goal_messages) <= 0:
            received_message.role = ModelMessageRoleType.HUMAN
            current_goal_messages = [received_message]

        # relay messages
        cut_messages = []
        if rely_messages:
            # When directly relying on historical messages, use the execution result
            # content as a dependency
            for rely_message in rely_messages:
                action_report: Optional[ActionOutput] = ActionOutput.from_dict(
                    rely_message.action_report
                )
                if action_report:
                    # TODO: Modify in-place, need to be optimized
                    rely_message.content = action_report.content

            cut_messages.extend(rely_messages)

        # TODO: allocate historical information based on token budget
        if len(current_goal_messages) < 5:
            cut_messages.extend(current_goal_messages)
        else:
            # For the time being, the smallest size of historical message records will
            # be used by default.
            # Use the first two rounds of messages to understand the initial goals
            cut_messages.extend(current_goal_messages[:2])
            # Use information from the last three rounds of communication to ensure
            # that current thinking knows what happened and what to do in the last
            # communication
            cut_messages.extend(current_goal_messages[-3:])
        return cut_messages


def _new_system_message(content):
    """Return the system message."""
    return [{"content": content, "role": ModelMessageRoleType.SYSTEM}]


def _is_list_of_type(lst: List[Any], type_cls: type) -> bool:
    return all(isinstance(item, type_cls) for item in lst)