core[patch]: add token counting callback handler (#30481)

Stripped-down version of [OpenAICallbackHandler](https://github.com/langchain-ai/langchain/blob/master/libs/community/langchain_community/callbacks/openai_info.py) that just tracks `AIMessage.usage_metadata`. ```python from langchain_core.callbacks import get_usage_metadata_callback from langgraph.prebuilt import create_react_agent def get_weather(location: str) -> str: """Get the weather at a location.""" return "It's sunny." tools = [get_weather] agent = create_react_agent("openai:gpt-4o-mini", tools) with get_usage_metadata_callback() as cb: result = await agent.ainvoke({"messages": "What's the weather in Boston?"}) print(cb.usage_metadata) ```
2025-08-17 08:29:28 +00:00 · 2025-03-25 18:16:39 -04:00 · 2025-03-25 18:16:39 -04:00 · 4b9e2e51f3
commit 4b9e2e51f3
parent 1d2b1d8e5e
4 changed files with 201 additions and 0 deletions
--- a/libs/core/langchain_core/callbacks/init.py
+++ b/libs/core/langchain_core/callbacks/init.py
@ -43,6 +43,10 @@ from langchain_core.callbacks.manager import (
 )
 from langchain_core.callbacks.stdout import StdOutCallbackHandler
 from langchain_core.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
 from langchain_core.callbacks.usage import (
    UsageMetadataCallbackHandler,
    get_usage_metadata_callback,
 )
 __all__ = [
    "dispatch_custom_event",
@ -77,4 +81,6 @@ __all__ = [
    "StdOutCallbackHandler",
    "StreamingStdOutCallbackHandler",
    "FileCallbackHandler",
    "UsageMetadataCallbackHandler",
    "get_usage_metadata_callback",
 ]
--- a/libs/core/langchain_core/callbacks/usage.py
+++ b/libs/core/langchain_core/callbacks/usage.py
@ -0,0 +1,108 @@
 """Callback Handler that tracks AIMessage.usage_metadata."""
 import threading
 from collections.abc import Generator
 from contextlib import contextmanager
 from contextvars import ContextVar
 from typing import Any, Optional
 from langchain_core.callbacks import BaseCallbackHandler
 from langchain_core.messages import AIMessage
 from langchain_core.messages.ai import UsageMetadata, add_usage
 from langchain_core.outputs import ChatGeneration, LLMResult
 class UsageMetadataCallbackHandler(BaseCallbackHandler):
    """Callback Handler that tracks AIMessage.usage_metadata.
    Example:
        .. code-block:: python
            from langchain.chat_models import init_chat_model
            from langchain_core.callbacks import UsageMetadataCallbackHandler
            llm = init_chat_model(model="openai:gpt-4o-mini")
            callback = UsageMetadataCallbackHandler()
            results = llm.batch(["Hello", "Goodbye"], config={"callbacks": [callback]})
            print(callback.usage_metadata)
        .. code-block:: none
            {'output_token_details': {'audio': 0, 'reasoning': 0}, 'input_tokens': 17, 'output_tokens': 31, 'total_tokens': 48, 'input_token_details': {'cache_read': 0, 'audio': 0}}
    .. versionadded:: 0.3.49
    """  # noqa: E501
    def __init__(self) -> None:
        super().__init__()
        self._lock = threading.Lock()
        self.usage_metadata: Optional[UsageMetadata] = None
    def __repr__(self) -> str:
        return str(self.usage_metadata)
    def on_llm_end(self, response: LLMResult, **kwargs: Any) -> None:
        """Collect token usage."""
        # Check for usage_metadata (langchain-core >= 0.2.2)
        try:
            generation = response.generations[0][0]
        except IndexError:
            generation = None
        if isinstance(generation, ChatGeneration):
            try:
                message = generation.message
                if isinstance(message, AIMessage):
                    usage_metadata = message.usage_metadata
                else:
                    usage_metadata = None
            except AttributeError:
                usage_metadata = None
        else:
            usage_metadata = None
        # update shared state behind lock
        with self._lock:
            self.usage_metadata = add_usage(self.usage_metadata, usage_metadata)
@contextmanager
 def get_usage_metadata_callback(
    name: str = "usage_metadata_callback",
 ) -> Generator[UsageMetadataCallbackHandler, None, None]:
    """Get context manager for tracking usage metadata across chat model calls using
    ``AIMessage.usage_metadata``.
    Args:
        name (str): The name of the context variable. Defaults to
            ``"usage_metadata_callback"``.
    Example:
        .. code-block:: python
            from langchain.chat_models import init_chat_model
            from langchain_core.callbacks import get_usage_metadata_callback
            llm = init_chat_model(model="openai:gpt-4o-mini")
            with get_usage_metadata_callback() as cb:
                llm.invoke("Hello")
                llm.invoke("Goodbye")
                print(cb.usage_metadata)
        .. code-block:: none
            {'output_token_details': {'audio': 0, 'reasoning': 0}, 'input_tokens': 17, 'output_tokens': 31, 'total_tokens': 48, 'input_token_details': {'cache_read': 0, 'audio': 0}}
    .. versionadded:: 0.3.49
    """  # noqa: E501
    from langchain_core.tracers.context import register_configure_hook
    usage_metadata_callback_var: ContextVar[Optional[UsageMetadataCallbackHandler]] = (
        ContextVar(name, default=None)
    )
    register_configure_hook(usage_metadata_callback_var, True)
    cb = UsageMetadataCallbackHandler()
    usage_metadata_callback_var.set(cb)
    yield cb
    usage_metadata_callback_var.set(None)
--- a/libs/core/tests/unit_tests/callbacks/test_imports.py
+++ b/libs/core/tests/unit_tests/callbacks/test_imports.py
@ -33,6 +33,8 @@ EXPECTED_ALL = [
    "FileCallbackHandler",
    "adispatch_custom_event",
    "dispatch_custom_event",
    "UsageMetadataCallbackHandler",
    "get_usage_metadata_callback",
 ]
--- a/libs/core/tests/unit_tests/callbacks/test_usage_callback.py
+++ b/libs/core/tests/unit_tests/callbacks/test_usage_callback.py
@ -0,0 +1,85 @@
 from itertools import cycle
 from langchain_core.callbacks import (
    UsageMetadataCallbackHandler,
    get_usage_metadata_callback,
 )
 from langchain_core.language_models import GenericFakeChatModel
 from langchain_core.messages import AIMessage
 from langchain_core.messages.ai import (
    InputTokenDetails,
    OutputTokenDetails,
    UsageMetadata,
    add_usage,
 )
 usage1 = UsageMetadata(
    input_tokens=1,
    output_tokens=2,
    total_tokens=3,
 )
 usage2 = UsageMetadata(
    input_tokens=4,
    output_tokens=5,
    total_tokens=9,
 )
 usage3 = UsageMetadata(
    input_tokens=10,
    output_tokens=20,
    total_tokens=30,
    input_token_details=InputTokenDetails(audio=5),
    output_token_details=OutputTokenDetails(reasoning=10),
 )
 usage4 = UsageMetadata(
    input_tokens=5,
    output_tokens=10,
    total_tokens=15,
    input_token_details=InputTokenDetails(audio=3),
    output_token_details=OutputTokenDetails(reasoning=5),
 )
 messages = [
    AIMessage("Response 1", usage_metadata=usage1),
    AIMessage("Response 2", usage_metadata=usage2),
    AIMessage("Response 3", usage_metadata=usage3),
    AIMessage("Response 4", usage_metadata=usage4),
 ]
 def test_usage_callback() -> None:
    llm = GenericFakeChatModel(messages=cycle(messages))
    # Test context manager
    with get_usage_metadata_callback() as cb:
        _ = llm.invoke("Message 1")
        _ = llm.invoke("Message 2")
        total_1_2 = add_usage(usage1, usage2)
        assert cb.usage_metadata == total_1_2
        _ = llm.invoke("Message 3")
        _ = llm.invoke("Message 4")
        total_3_4 = add_usage(usage3, usage4)
        assert cb.usage_metadata == add_usage(total_1_2, total_3_4)
    # Test via config
    callback = UsageMetadataCallbackHandler()
    _ = llm.batch(["Message 1", "Message 2"], config={"callbacks": [callback]})
    assert callback.usage_metadata == total_1_2
 async def test_usage_callback_async() -> None:
    llm = GenericFakeChatModel(messages=cycle(messages))
    # Test context manager
    with get_usage_metadata_callback() as cb:
        _ = await llm.ainvoke("Message 1")
        _ = await llm.ainvoke("Message 2")
        total_1_2 = add_usage(usage1, usage2)
        assert cb.usage_metadata == total_1_2
        _ = await llm.ainvoke("Message 3")
        _ = await llm.ainvoke("Message 4")
        total_3_4 = add_usage(usage3, usage4)
        assert cb.usage_metadata == add_usage(total_1_2, total_3_4)
    # Test via config
    callback = UsageMetadataCallbackHandler()
    _ = await llm.abatch(["Message 1", "Message 2"], config={"callbacks": [callback]})
    assert callback.usage_metadata == total_1_2