From bd277b532784559eb9849932de29d75ebb2b8317 Mon Sep 17 00:00:00 2001
From: golergka <golergka@Gmail.com>
Date: Thu, 4 May 2023 08:45:48 +0300
Subject: [PATCH] feat: prune summary buffer (#4004)

If the library user has to decrease the `max_token_limit`, he would
probably want to prune the summary buffer even though he haven't added
any new messages.

Personally, I need it because I want to serialise memory buffer object
and save to database, and when I load it, I may have re-configured my
code to have a shorter memory to save on tokens.
---
 langchain/memory/summary_buffer.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/langchain/memory/summary_buffer.py b/langchain/memory/summary_buffer.py
index ac0d9287345..5e4c5b93ec6 100644
--- a/langchain/memory/summary_buffer.py
+++ b/langchain/memory/summary_buffer.py
@@ -57,7 +57,10 @@ class ConversationSummaryBufferMemory(BaseChatMemory, SummarizerMixin):
     def save_context(self, inputs: Dict[str, Any], outputs: Dict[str, str]) -> None:
         """Save context from this conversation to buffer."""
         super().save_context(inputs, outputs)
-        # Prune buffer if it exceeds max token limit
+        self.prune()
+
+    def prune(self) -> None:
+        """Prune buffer if it exceeds max token limit"""
         buffer = self.chat_memory.messages
         curr_buffer_length = self.llm.get_num_tokens_from_messages(buffer)
         if curr_buffer_length > self.max_token_limit: