feat(openai): support automatic server-side compaction (#35212)

2026-06-09 10:17:00 +00:00 · 2026-02-17 10:48:52 -05:00
parent 32c6ab3033
commit 8f1bc0d3ae
8 changed files with 113 additions and 7 deletions
--- a/libs/partners/openai/tests/cassettes/test_compaction.yaml.gz
+++ b/libs/partners/openai/tests/cassettes/test_compaction.yaml.gz
--- a/libs/partners/openai/tests/cassettes/test_compaction_streaming.yaml.gz
+++ b/libs/partners/openai/tests/cassettes/test_compaction_streaming.yaml.gz
--- a/libs/partners/openai/tests/integration_tests/chat_models/test_responses_api.py
+++ b/libs/partners/openai/tests/integration_tests/chat_models/test_responses_api.py
@@ -1107,3 +1107,96 @@ def test_custom_tool(output_version: Literal["responses/v1", "v1"]) -> None:
        full = chunk if full is None else full + chunk
    assert isinstance(full, AIMessageChunk)
    assert len(full.tool_calls) == 1
+
+
+@pytest.mark.default_cassette("test_compaction.yaml.gz")
+@pytest.mark.vcr
+@pytest.mark.parametrize("output_version", ["responses/v1", "v1"])
+def test_compaction(output_version: Literal["responses/v1", "v1"]) -> None:
+    """Test the compation beta feature."""
+    llm = ChatOpenAI(
+        model="gpt-5.2",
+        context_management=[{"type": "compaction", "compact_threshold": 10_000}],
+        output_version=output_version,
+    )
+
+    input_message = {
+        "role": "user",
+        "content": f"Generate a one-sentence summary of this:\n\n{'a' * 50000}",
+    }
+    messages: list = [input_message]
+
+    first_response = llm.invoke(messages)
+    messages.append(first_response)
+
+    second_message = {
+        "role": "user",
+        "content": f"Generate a one-sentence summary of this:\n\n{'b' * 50000}",
+    }
+    messages.append(second_message)
+
+    second_response = llm.invoke(messages)
+    messages.append(second_response)
+
+    content_blocks = second_response.content_blocks
+    compaction_block = next(
+        (block for block in content_blocks if block["type"] == "non_standard"),
+        None,
+    )
+    assert compaction_block
+    assert compaction_block["value"].get("type") == "compaction"
+
+    third_message = {
+        "role": "user",
+        "content": "What are we talking about?",
+    }
+    messages.append(third_message)
+    third_response = llm.invoke(messages)
+    assert third_response.text
+
+
+@pytest.mark.default_cassette("test_compaction_streaming.yaml.gz")
+@pytest.mark.vcr
+@pytest.mark.parametrize("output_version", ["responses/v1", "v1"])
+def test_compaction_streaming(output_version: Literal["responses/v1", "v1"]) -> None:
+    """Test the compation beta feature."""
+    llm = ChatOpenAI(
+        model="gpt-5.2",
+        context_management=[{"type": "compaction", "compact_threshold": 10_000}],
+        output_version=output_version,
+        streaming=True,
+    )
+
+    input_message = {
+        "role": "user",
+        "content": f"Generate a one-sentence summary of this:\n\n{'a' * 50000}",
+    }
+    messages: list = [input_message]
+
+    first_response = llm.invoke(messages)
+    messages.append(first_response)
+
+    second_message = {
+        "role": "user",
+        "content": f"Generate a one-sentence summary of this:\n\n{'b' * 50000}",
+    }
+    messages.append(second_message)
+
+    second_response = llm.invoke(messages)
+    messages.append(second_response)
+
+    content_blocks = second_response.content_blocks
+    compaction_block = next(
+        (block for block in content_blocks if block["type"] == "non_standard"),
+        None,
+    )
+    assert compaction_block
+    assert compaction_block["value"].get("type") == "compaction"
+
+    third_message = {
+        "role": "user",
+        "content": "What are we talking about?",
+    }
+    messages.append(third_message)
+    third_response = llm.invoke(messages)
+    assert third_response.text