[experimental][llms][OllamaFunctions] tool calling related fixes (#22339)

Fixes issues with tool calling to handle tool objects correctly. Added support to handle ToolMessage correctly. Added additional checks for error conditions. --------- Co-authored-by: ccurme <chester.curme@gmail.com>
2025-09-27 14:26:48 +00:00 · 2024-06-12 15:34:43 -05:00
parent d04e899b56
commit 276be6cdd4
2 changed files with 115 additions and 21 deletions
--- a/libs/experimental/langchain_experimental/llms/ollama_functions.py
+++ b/libs/experimental/langchain_experimental/llms/ollama_functions.py
@@ -13,6 +13,7 @@ from typing import (
    TypedDict,
    TypeVar,
    Union,
    cast,
    overload,
 )
@@ -22,7 +23,14 @@ from langchain_core.callbacks import (
    CallbackManagerForLLMRun,
 )
 from langchain_core.language_models import LanguageModelInput
-from langchain_core.messages import AIMessage, BaseMessage, ToolCall
+from langchain_core.messages import (
    AIMessage,
    BaseMessage,
    HumanMessage,
    SystemMessage,
    ToolCall,
    ToolMessage,
 )
 from langchain_core.output_parsers.base import OutputParserLike
 from langchain_core.output_parsers.json import JsonOutputParser
 from langchain_core.output_parsers.pydantic import PydanticOutputParser
@@ -74,18 +82,32 @@ def _is_pydantic_class(obj: Any) -> bool:
    )
 def _is_pydantic_object(obj: Any) -> bool:
    return isinstance(obj, BaseModel)
 def convert_to_ollama_tool(tool: Any) -> Dict:
    """Convert a tool to an Ollama tool."""
    description = None
    if _is_pydantic_class(tool):
        schema = tool.construct().schema()
-        definition = {"name": schema["title"], "properties": schema["properties"]}
+        name = schema["title"]
-        if "required" in schema:
+    elif _is_pydantic_object(tool):
-            definition["required"] = schema["required"]
+        schema = tool.get_input_schema().schema()
        name = tool.get_name()
        description = tool.description
    elif isinstance(tool, dict) and "name" in tool and "parameters" in tool:
        return tool.copy()
    else:
        raise ValueError(
            f"""Cannot convert {tool} to an Ollama tool. 
            {tool} needs to be a Pydantic class, model, or a dict."""
        )
    definition = {"name": name, "parameters": schema}
    if description:
        definition["description"] = description
    return definition
    raise ValueError(
        f"Cannot convert {tool} to an Ollama tool. {tool} needs to be a Pydantic model."
    )
 class _AllReturnType(TypedDict):
@@ -280,6 +302,59 @@ class OllamaFunctions(ChatOllama):
        else:
            return llm | parser_chain
    def _convert_messages_to_ollama_messages(
        self, messages: List[BaseMessage]
    ) -> List[Dict[str, Union[str, List[str]]]]:
        ollama_messages: List = []
        for message in messages:
            role = ""
            if isinstance(message, HumanMessage):
                role = "user"
            elif isinstance(message, AIMessage) or isinstance(message, ToolMessage):
                role = "assistant"
            elif isinstance(message, SystemMessage):
                role = "system"
            else:
                raise ValueError("Received unsupported message type for Ollama.")
            content = ""
            images = []
            if isinstance(message.content, str):
                content = message.content
            else:
                for content_part in cast(List[Dict], message.content):
                    if content_part.get("type") == "text":
                        content += f"\n{content_part['text']}"
                    elif content_part.get("type") == "image_url":
                        if isinstance(content_part.get("image_url"), str):
                            image_url_components = content_part["image_url"].split(",")
                            # Support data:image/jpeg;base64,<image> format
                            # and base64 strings
                            if len(image_url_components) > 1:
                                images.append(image_url_components[1])
                            else:
                                images.append(image_url_components[0])
                        else:
                            raise ValueError(
                                "Only string image_url content parts are supported."
                            )
                    else:
                        raise ValueError(
                            "Unsupported message content type. "
                            "Must either have type 'text' or type 'image_url' "
                            "with a string 'image_url' field."
                        )
            ollama_messages.append(
                {
                    "role": role,
                    "content": content,
                    "images": images,
                }
            )
        return ollama_messages
    def _generate(
        self,
        messages: List[BaseMessage],
@@ -300,9 +375,8 @@ class OllamaFunctions(ChatOllama):
                    "matching function in `functions`."
                )
            del kwargs["function_call"]
        if _is_pydantic_class(functions[0]):
        functions = [convert_to_ollama_tool(fn) for fn in functions]
-        functions.insert(0, DEFAULT_RESPONSE_FUNCTION)
+        functions.append(DEFAULT_RESPONSE_FUNCTION)
        system_message_prompt_template = SystemMessagePromptTemplate.from_template(
            self.tool_system_prompt_template
        )
@@ -323,16 +397,16 @@ class OllamaFunctions(ChatOllama):
                Please try again. 
                Response: {chat_generation_content}"""
            )
-        called_tool_name = parsed_chat_result["tool"]
+        called_tool_name = (
            parsed_chat_result["tool"] if "tool" in parsed_chat_result else None
        )
        called_tool = next(
            (fn for fn in functions if fn["name"] == called_tool_name), None
        )
-        if called_tool is None:
+        if (
-            raise ValueError(
+            called_tool is None
-                f"Failed to parse a function call from {self.model} output: "
+            or called_tool["name"] == DEFAULT_RESPONSE_FUNCTION["name"]
-                f"{chat_generation_content}"
+        ):
            )
        if called_tool["name"] == DEFAULT_RESPONSE_FUNCTION["name"]:
            if (
                "tool_input" in parsed_chat_result
                and "response" in parsed_chat_result["tool_input"]
@@ -355,7 +429,11 @@ class OllamaFunctions(ChatOllama):
                ]
            )
-        called_tool_arguments = parsed_chat_result["tool_input"]
+        called_tool_arguments = (
            parsed_chat_result["tool_input"]
            if "tool_input" in parsed_chat_result
            else {}
        )
        response_message_with_functions = AIMessage(
            content="",
--- a/libs/experimental/tests/integration_tests/llms/test_ollama_functions.py
+++ b/libs/experimental/tests/integration_tests/llms/test_ollama_functions.py
@@ -2,6 +2,8 @@
 import unittest
 from langchain_community.tools import DuckDuckGoSearchResults
 from langchain_community.tools.pubmed.tool import PubmedQueryRun
 from langchain_core.messages import AIMessage
 from langchain_core.pydantic_v1 import BaseModel, Field
@@ -22,7 +24,7 @@ class TestOllamaFunctions(unittest.TestCase):
    """
    def test_default_ollama_functions(self) -> None:
-        base_model = OllamaFunctions(model="llama3", format="json")
+        base_model = OllamaFunctions(model="phi3", format="json")
        # bind functions
        model = base_model.bind_tools(
@@ -60,8 +62,22 @@ class TestOllamaFunctions(unittest.TestCase):
        assert tool_call
        self.assertEqual("get_current_weather", tool_call.get("name"))
    def test_ollama_functions_tools(self) -> None:
        base_model = OllamaFunctions(model="phi3", format="json")
        model = base_model.bind_tools(
            tools=[PubmedQueryRun(), DuckDuckGoSearchResults(max_results=2)]
        )
        res = model.invoke("What causes lung cancer?")
        self.assertIsInstance(res, AIMessage)
        res = AIMessage(**res.__dict__)
        tool_calls = res.tool_calls
        assert tool_calls
        tool_call = tool_calls[0]
        assert tool_call
        self.assertEqual("pub_med", tool_call.get("name"))
    def test_default_ollama_functions_default_response(self) -> None:
-        base_model = OllamaFunctions(model="llama3", format="json")
+        base_model = OllamaFunctions(model="phi3", format="json")
        # bind functions
        model = base_model.bind_tools(