From 0b3ac35edee8c3c7c1e301d81c3f2f72d02f79d7 Mon Sep 17 00:00:00 2001
From: Cooper <42096311+FOkvj@users.noreply.github.com>
Date: Thu, 24 Apr 2025 11:17:20 +0800
Subject: [PATCH] fix(model): fix remote reranker api & fix long_term memory
 (#2648)

Co-authored-by: dong <dongzhancai@iie2.com>
---
 examples/agents/react_agent_example.py        | 35 +++++++++++++++++--
 .../src/dbgpt/agent/core/memory/long_term.py  |  8 +++--
 .../src/dbgpt/model/cluster/apiserver/api.py  |  6 +++-
 .../src/dbgpt/model/cluster/base.py           |  1 +
 4 files changed, 43 insertions(+), 7 deletions(-)

diff --git a/examples/agents/react_agent_example.py b/examples/agents/react_agent_example.py
index 3062ce238..6be14c5e9 100644
--- a/examples/agents/react_agent_example.py
+++ b/examples/agents/react_agent_example.py
@@ -2,13 +2,26 @@ import asyncio
 import logging
 import os
 import sys
+from concurrent.futures import ThreadPoolExecutor
+from datetime import datetime
 
 from typing_extensions import Annotated, Doc
 
-from dbgpt.agent import AgentContext, AgentMemory, LLMConfig, UserProxyAgent
+from dbgpt.agent import (
+    AgentContext,
+    AgentMemory,
+    HybridMemory,
+    LLMConfig,
+    LongTermMemory,
+    SensoryMemory,
+    ShortTermMemory,
+    UserProxyAgent,
+)
 from dbgpt.agent.expand.actions.react_action import ReActAction, Terminate
 from dbgpt.agent.expand.react_agent import ReActAgent
 from dbgpt.agent.resource import ToolPack, tool
+from dbgpt.rag.embedding import OpenAPIEmbeddings
+from dbgpt_ext.storage.vector_store.chroma_store import ChromaStore, ChromaVectorConfig
 
 logging.basicConfig(
     stream=sys.stdout,
@@ -57,7 +70,23 @@ async def main():
         provider=os.getenv("LLM_PROVIDER", "proxy/siliconflow"),
         name=os.getenv("LLM_MODEL_NAME", "Qwen/Qwen2.5-Coder-32B-Instruct"),
     )
-    agent_memory = AgentMemory()
+    short_memory = ShortTermMemory(buffer_size=1)
+    sensor_memory = SensoryMemory()
+    embedding_fn = OpenAPIEmbeddings(
+        api_url="https://api.siliconflow.cn/v1/embeddings",
+        api_key=os.getenv("SILICONFLOW_API_KEY"),
+        model_name="BAAI/bge-large-zh-v1.5",
+    )
+    vector_store = ChromaStore(
+        ChromaVectorConfig(persist_path="pilot/data"),
+        name="react_mem",
+        embedding_fn=embedding_fn,
+    )
+    long_memory = LongTermMemory(ThreadPoolExecutor(), vector_store)
+
+    agent_memory = AgentMemory(
+        memory=HybridMemory(datetime.now(), sensor_memory, short_memory, long_memory)
+    )
     agent_memory.gpts_memory.init(conv_id="test456")
 
     # It is important to set the temperature to a low value to get a better result
@@ -81,7 +110,7 @@ async def main():
     await user_proxy.initiate_chat(
         recipient=tool_engineer,
         reviewer=user_proxy,
-        message="Calculate the product of 10 and 99",
+        message="Calculate the product of 10 and 99, and then add 1 to the result, and finally divide the result by 2.",
     )
     await user_proxy.initiate_chat(
         recipient=tool_engineer,
diff --git a/packages/dbgpt-core/src/dbgpt/agent/core/memory/long_term.py b/packages/dbgpt-core/src/dbgpt/agent/core/memory/long_term.py
index 54147aea3..20e886ea8 100644
--- a/packages/dbgpt-core/src/dbgpt/agent/core/memory/long_term.py
+++ b/packages/dbgpt-core/src/dbgpt/agent/core/memory/long_term.py
@@ -144,14 +144,16 @@ class LongTermRetriever(TimeWeightedEmbeddingRetriever):
         rescored_docs = []
         for doc in filtered_docs:
             if _METADATA_LAST_ACCESSED_AT in doc.metadata:
-                last_accessed_time = doc.metadata[_METADATA_LAST_ACCESSED_AT]
+                last_accessed_time = datetime.fromtimestamp(
+                    float(doc.metadata[_METADATA_LAST_ACCESSED_AT])
+                )
                 hours_passed = self._get_hours_passed(current_time, last_accessed_time)
                 time_score = (1.0 - self.decay_rate) ** hours_passed
 
                 # Add importance score if available
                 importance_score = 0
                 if _METADAT_IMPORTANCE in doc.metadata:
-                    importance_score = doc.metadata[_METADAT_IMPORTANCE]
+                    importance_score = float(doc.metadata[_METADAT_IMPORTANCE])
 
                 # Combine scores
                 combined_score = doc.score + time_score + importance_score
@@ -242,7 +244,7 @@ class LongTermMemory(Memory, Generic[T]):
         memory_idx = len(self.memory_retriever.memory_stream)
         metadata = self._metadata
         metadata[_METADAT_IMPORTANCE] = importance
-        metadata[_METADATA_LAST_ACCESSED_AT] = last_accessed_time
+        metadata[_METADATA_LAST_ACCESSED_AT] = last_accessed_time.timestamp()
         if self.session_id:
             metadata[_METADATA_SESSION_ID] = self.session_id
 
diff --git a/packages/dbgpt-core/src/dbgpt/model/cluster/apiserver/api.py b/packages/dbgpt-core/src/dbgpt/model/cluster/apiserver/api.py
index 735fd84c2..cc0a6aed1 100644
--- a/packages/dbgpt-core/src/dbgpt/model/cluster/apiserver/api.py
+++ b/packages/dbgpt-core/src/dbgpt/model/cluster/apiserver/api.py
@@ -607,6 +607,7 @@ class APIServer(BaseComponent):
             "input": texts,
             "model": model,
             "query": query,
+            "worker_type": WorkerType.RERANKER.value,
         }
         scores = await worker_manager.embeddings(params)
         return scores[0]
@@ -780,13 +781,16 @@ async def create_relevance(
     request: RelevanceRequest, api_server: APIServer = Depends(get_api_server)
 ):
     """Generate relevance scores for a query and a list of documents."""
-    await api_server.get_model_instances_or_raise(request.model, worker_type="text2vec")
+    await api_server.get_model_instances_or_raise(
+        request.model, worker_type=WorkerType.RERANKER.value
+    )
 
     with root_tracer.start_span(
         "dbgpt.model.apiserver.generate_relevance",
         metadata={
             "model": request.model,
             "query": request.query,
+            "worker_type": WorkerType.RERANKER.value,
         },
     ):
         scores = await api_server.relevance_generate(
diff --git a/packages/dbgpt-core/src/dbgpt/model/cluster/base.py b/packages/dbgpt-core/src/dbgpt/model/cluster/base.py
index 0d074fab8..43755143c 100644
--- a/packages/dbgpt-core/src/dbgpt/model/cluster/base.py
+++ b/packages/dbgpt-core/src/dbgpt/model/cluster/base.py
@@ -39,6 +39,7 @@ class PromptRequest(BaseModel):
 class EmbeddingsRequest(BaseModel):
     model: str
     input: List[str]
+    worker_type: str = WorkerType.TEXT2VEC.value
     span_id: Optional[str] = None
     query: Optional[str] = None
     """For rerank model, query is required"""