cr

MongoDB agent fixes (#14362 )
2026-02-04 16:20:16 +00:00 · 2023-12-06 14:42:29 -08:00 · 2023-12-06 14:37:21 -08:00 · 2023-12-06 14:31:10 -08:00 · 2023-12-03 16:11:54 -08:00 · 2023-11-29 22:28:08 -05:00
21 changed files with 2028 additions and 813 deletions
--- a/.github/workflows/_compile_integration_test.yml
+++ b/.github/workflows/_compile_integration_test.yml
@@ -36,6 +36,13 @@ jobs:
          working-directory: ${{ inputs.working-directory }}
          cache-key: compile-integration

+      - name: MongoDB in GitHub Actions
+        uses: supercharge/mongodb-github-action@1.10.0
+        with:
+          mongodb-version: 7.0
+          mongodb-replica-set: test
+          mongodb-port: 27017
+
      - name: Install integration dependencies
        shell: bash
        run: poetry install --with=test_integration
--- a/docs/docs/integrations/toolkits/mongo_database.ipynb
+++ b/docs/docs/integrations/toolkits/mongo_database.ipynb
@@ -0,0 +1,204 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# MongoDB Database\n",
+    "\n",
+    "This notebook showcases an experimental agent designed to interact with and query a `MongoDB` database using PyMongo. \n",
+    "The agent is similar to [SQL Database](https://python.langchain.com/docs/integrations/toolkits/sql_database).\n",
+    "\n",
+    "As this agent is in development, currently it only supports one database per instance `MongoDatabase` class using URI. Additionally, all answers may not be correct, and it is not guaranteed that the agent won't perform destructive commands on your database (or in general) given certain questions."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Initialization"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from langchain.agents.agent_types import AgentType\n",
+    "from langchain.llms.openai import OpenAI\n",
+    "from langchain_experimental.agents.agent_toolkits import (\n",
+    "    MongoDatabaseToolkit,\n",
+    "    create_mongo_agent,\n",
+    ")\n",
+    "from langchain_experimental.utilities import MongoDatabase\n",
+    "\n",
+    "db = MongoDatabase.from_uri(\"mongodb://localhost:27017/my_db\")\n",
+    "db._client[\"my_db\"][\"my_collection\"].insert_many(\n",
+    "    [\n",
+    "        {\"text\": \"Hello, world!\", \"language\": \"en\"},\n",
+    "        {\"text\": \"Bonjour, monde!\", \"language\": \"fr\"},\n",
+    "        {\"text\": \"Hola, mundo!\", \"language\": \"es\"},\n",
+    "        {\"text\": \"Hallo, Welt!\", \"language\": \"de\"},\n",
+    "        {\"text\": \"Ciao, mondo!\", \"language\": \"it\"},\n",
+    "        {\"text\": \"Olá, mundo!\", \"language\": \"pt\"},\n",
+    "        {\"text\": \"Привет, мир!\", \"language\": \"ru\"},\n",
+    "        {\"text\": \"你好，世界！\", \"language\": \"zh\"},\n",
+    "        {\"text\": \"こんにちは世界！\", \"language\": \"ja\"},\n",
+    "        {\"text\": \"안녕, 세상아!\", \"language\": \"ko\"},\n",
+    "    ]\n",
+    ")\n",
+    "# insert more documents if you would like\n",
+    "toolkit = MongoDatabaseToolkit(db=db, llm=OpenAI(temperature=0))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Using `ZERO_SHOT_REACT_DESCRIPTION`\n",
+    "\n",
+    "This shows how to initialize the agent using the `ZERO_SHOT_REACT_DESCRIPTION` agent type."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "agent_executor = create_mongo_agent(\n",
+    "    llm=OpenAI(temperature=0),\n",
+    "    toolkit=toolkit,\n",
+    "    verbose=True,\n",
+    "    agent_type=AgentType.ZERO_SHOT_REACT_DESCRIPTION,\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Using OpenAI Functions\n",
+    "\n",
+    "This shows how to initialize the agent using the `OPENAI_FUNCTIONS` agent type. Note that this is an alternative to the above."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# agent_executor = create_mongo_agent(\n",
+    "#     llm=ChatOpenAI(temperature=0, model=\"gpt-3.5-turbo-0613\"),\n",
+    "#     toolkit=toolkit,\n",
+    "#     verbose=True,\n",
+    "#     agent_type=AgentType.OPENAI_FUNCTIONS\n",
+    "# )"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Example: querying documents"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "\n",
+      "\n",
+      "\u001b[1m> Entering new AgentExecutor chain...\u001b[0m\n",
+      "\u001b[32;1m\u001b[1;3mAction: mongo_db_list\n",
+      "Action Input: \u001b[0m\n",
+      "Observation: \u001b[36;1m\u001b[1;3mmy_collection\u001b[0m\n",
+      "Thought:\u001b[32;1m\u001b[1;3m I should check the schema of my_collection\n",
+      "Action: mongo_db_schema\n",
+      "Action Input: my_collection\u001b[0m\n",
+      "Observation: \u001b[33;1m\u001b[1;3mCollection Name: my_collection\n",
+      "\n",
+      "3 sample documents from my_collection:\n",
+      "{'_id': ObjectId('65650d24fd0c16012a7ed210'),\n",
+      " 'language': 'en',\n",
+      " 'text': 'Hello, world!'}\n",
+      "{'_id': ObjectId('65650d24fd0c16012a7ed211'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\n",
+      "{'_id': ObjectId('65650d24fd0c16012a7ed212'),\n",
+      " 'language': 'es',\n",
+      " 'text': 'Hola, mundo!'}\n",
+      "\u001b[0m\n",
+      "Thought:\u001b[32;1m\u001b[1;3m I should query the documents with language field equal to 'fr'\n",
+      "Action: mongo_db_query\n",
+      "Action Input: db.my_collection.find({'language': 'fr'}).limit(10)\u001b[0m\n",
+      "Observation: \u001b[38;5;200m\u001b[1;3mResult:\n",
+      "{'_id': ObjectId('65650d24fd0c16012a7ed211'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\n",
+      "{'_id': ObjectId('65650d2bfd0c16012a7ed21c'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\n",
+      "{'_id': ObjectId('65650f9af8d68bbbc66c0c2e'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\n",
+      "{'_id': ObjectId('656510ddf351300b9c26690c'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\n",
+      "{'_id': ObjectId('65651b16b16e9f51a2df5856'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\n",
+      "{'_id': ObjectId('65651b4e1b66b2ae39ced4a6'),\n",
+      " 'language': 'fr',\n",
+      " 'text': 'Bonjour, monde!'}\u001b[0m\n",
+      "Thought:\u001b[32;1m\u001b[1;3m I now know the final answer\n",
+      "Final Answer: Bonjour, monde!\u001b[0m\n",
+      "\n",
+      "\u001b[1m> Finished chain.\u001b[0m\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "'Bonjour, monde!'"
+      ]
+     },
+     "execution_count": 3,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "agent_executor.run(\"Find hello world in french\")"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": ".venv",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.5"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
--- a/libs/experimental/langchain_experimental/agents/agent_toolkits/init.py
+++ b/libs/experimental/langchain_experimental/agents/agent_toolkits/init.py
@@ -1,4 +1,8 @@
 from langchain_experimental.agents.agent_toolkits.csv.base import create_csv_agent
+from langchain_experimental.agents.agent_toolkits.mongo.base import (
+    MongoDatabaseToolkit,
+    create_mongo_agent,
+)
 from langchain_experimental.agents.agent_toolkits.pandas.base import (
    create_pandas_dataframe_agent,
 )
@@ -16,4 +20,6 @@ __all__ = [
    "create_spark_dataframe_agent",
    "create_python_agent",
    "create_csv_agent",
+    "create_mongo_agent",
+    "MongoDatabaseToolkit",
 ]
--- a/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/init.py
+++ b/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/init.py
@@ -0,0 +1 @@
+"""MongoDB agent."""
--- a/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/base.py
+++ b/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/base.py
@@ -0,0 +1,98 @@
+"""MongoDB agent."""
+from typing import Any, Dict, List, Optional, Sequence
+
+from langchain.agents.agent import AgentExecutor, BaseSingleActionAgent
+from langchain.agents.agent_types import AgentType
+from langchain.agents.mrkl.base import ZeroShotAgent
+from langchain.agents.mrkl.prompt import FORMAT_INSTRUCTIONS
+from langchain.agents.openai_functions_agent.base import OpenAIFunctionsAgent
+from langchain.callbacks.base import BaseCallbackManager
+from langchain.chains.llm import LLMChain
+from langchain.tools import BaseTool
+from langchain_core.language_models import BaseLanguageModel
+from langchain_core.messages import AIMessage, SystemMessage
+from langchain_core.prompts.chat import (
+    ChatPromptTemplate,
+    HumanMessagePromptTemplate,
+    MessagesPlaceholder,
+)
+
+from langchain_experimental.agents.agent_toolkits.mongo.prompt import (
+    MONGO_FUNCTIONS_SUFFIX,
+    MONGO_PREFIX,
+    MONGO_SUFFIX,
+)
+from langchain_experimental.agents.agent_toolkits.mongo.toolkit import (
+    MongoDatabaseToolkit,
+)
+
+
+def create_mongo_agent(
+    llm: BaseLanguageModel,
+    toolkit: MongoDatabaseToolkit,
+    agent_type: AgentType = AgentType.ZERO_SHOT_REACT_DESCRIPTION,
+    callback_manager: Optional[BaseCallbackManager] = None,
+    prefix: str = MONGO_PREFIX,
+    suffix: Optional[str] = None,
+    format_instructions: str = FORMAT_INSTRUCTIONS,
+    input_variables: Optional[List[str]] = None,
+    top_k: int = 10,
+    max_iterations: Optional[int] = 15,
+    max_execution_time: Optional[float] = None,
+    early_stopping_method: str = "force",
+    verbose: bool = False,
+    agent_executor_kwargs: Optional[Dict[str, Any]] = None,
+    extra_tools: Sequence[BaseTool] = (),
+    **kwargs: Any,
+) -> AgentExecutor:
+    """Construct a MongoDB agent from an LLM and tools."""
+    tools = toolkit.get_tools() + list(extra_tools)
+    prefix = prefix.format(top_k=top_k)
+    agent: BaseSingleActionAgent
+
+    if agent_type == AgentType.ZERO_SHOT_REACT_DESCRIPTION:
+        prompt = ZeroShotAgent.create_prompt(
+            tools,
+            prefix=prefix,
+            suffix=suffix or MONGO_SUFFIX,
+            format_instructions=format_instructions,
+            input_variables=input_variables,
+        )
+        llm_chain = LLMChain(
+            llm=llm,
+            prompt=prompt,
+            callback_manager=callback_manager,
+        )
+        tool_names = [tool.name for tool in tools]
+        agent = ZeroShotAgent(llm_chain=llm_chain, allowed_tools=tool_names, **kwargs)
+
+    elif agent_type == AgentType.OPENAI_FUNCTIONS:
+        messages = [
+            SystemMessage(content=prefix),
+            HumanMessagePromptTemplate.from_template("{input}"),
+            AIMessage(content=suffix or MONGO_FUNCTIONS_SUFFIX),
+            MessagesPlaceholder(variable_name="agent_scratchpad"),
+        ]
+        input_variables = ["input", "agent_scratchpad"]
+        _prompt = ChatPromptTemplate(input_variables=input_variables, messages=messages)
+
+        agent = OpenAIFunctionsAgent(
+            llm=llm,
+            prompt=_prompt,
+            tools=tools,
+            callback_manager=callback_manager,
+            **kwargs,
+        )
+    else:
+        raise ValueError(f"Agent type {agent_type} not supported at the moment.")
+
+    return AgentExecutor.from_agent_and_tools(
+        agent=agent,
+        tools=tools,
+        callback_manager=callback_manager,
+        verbose=verbose,
+        max_iterations=max_iterations,
+        max_execution_time=max_execution_time,
+        early_stopping_method=early_stopping_method,
+        **(agent_executor_kwargs or {}),
+    )
--- a/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/prompt.py
+++ b/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/prompt.py
@@ -0,0 +1,22 @@
+# flake8: noqa
+
+MONGO_PREFIX = """You are an agent designed to interact with a MongoDB database.
+Given an input question, create a syntactically correct MongoDB PyMongo query, then look at the results of the query and return the answer.
+Unless the user specifies a specific number of examples they wish to obtain, always limit your query to at most {top_k} results.
+You can order the results by a relevant field to return the most interesting examples in the database.
+You have access to tools for interacting with the database.
+Only use the below tools. Only use the information returned by the below tools to construct your final answer.
+You MUST double check your query before executing it. If you get an error while executing a query, rewrite the query and try again.
+
+DO NOT make any DML commands (insert, update, delete, etc.) to the database.
+
+If the question does not seem related to the database, just return "I don't know" as the answer.
+"""
+
+MONGO_SUFFIX = """Begin!
+
+Question: {input}
+Thought: I should look at the collections in the database to see what I can query using PyMongo.  Then I should query the fields of the documents of the most relevant collections, but before that check the query using query checker.
+{agent_scratchpad}"""
+
+MONGO_FUNCTIONS_SUFFIX = """I should look at the collections in the database to see what I can query using PyMongo.  Then I should query the fields of the documents of the most relevant collections, but before that check the query using query checker."""
--- a/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/toolkit.py
+++ b/libs/experimental/langchain_experimental/agents/agent_toolkits/mongo/toolkit.py
@@ -0,0 +1,64 @@
+"""Toolkit for interacting with a Mongo database."""
+from typing import List
+
+from langchain.agents.agent_toolkits.base import BaseToolkit
+from langchain.tools import BaseTool
+from langchain_core.language_models import BaseLanguageModel
+from langchain_core.pydantic_v1 import Field
+
+from langchain_experimental.tools.mongo_database.tool import (
+    InfoMongoDBTool,
+    ListMongoDBTool,
+    QueryMongoDBCheckerTool,
+    QueryMongoDBTool,
+)
+from langchain_experimental.utilities.mongo_database import MongoDatabase
+
+
+class MongoDatabaseToolkit(BaseToolkit):
+    llm: BaseLanguageModel = Field(exclude=True)
+    db: MongoDatabase = Field(exclude=True)
+
+    class Config:
+        """Configuration for this pydantic object."""
+
+        arbitrary_types_allowed = True
+
+    def get_tools(self) -> List[BaseTool]:
+        """Get the tools in the toolkit."""
+        list_mongo_database_tool = ListMongoDBTool(db=self.db)
+        info_mongo_database_tool_description = (
+            "Input to this tool is a comma-separated list of collections, output is "
+            "the name, indexes and sample documents for those collections. "
+            "Be sure that the collections actually exist by calling "
+            f"{list_mongo_database_tool.name} first! "
+            "Example Input: collection1, collection2, collection3"
+        )
+        info_mongo_database_tool = InfoMongoDBTool(
+            db=self.db, description=info_mongo_database_tool_description
+        )
+        query_mongo_database_tool_description = (
+            "Input to this tool is a detailed and correct MongoDB query, "
+            "output is a result from the database. If the query is not "
+            "correct, an error message will be returned. If an error is returned, "
+            "rewrite the query, check the query, and try again. If you encounter an "
+            "issue with Unknown field 'xxxx' in 'field list', use "
+            f"{info_mongo_database_tool.name} to query the correct document fields."
+        )
+        query_mongo_database_tool = QueryMongoDBTool(
+            db=self.db, description=query_mongo_database_tool_description
+        )
+        query_mongo_checker_tool_description = (
+            "Use this tool to double check if your query is correct before executing "
+            "it. Always use this tool before executing a query with "
+            f"{query_mongo_database_tool.name}."
+        )
+        query_mongo_checker_tool = QueryMongoDBCheckerTool(
+            db=self.db, llm=self.llm, description=query_mongo_checker_tool_description
+        )
+        return [
+            list_mongo_database_tool,
+            info_mongo_database_tool,
+            query_mongo_database_tool,
+            query_mongo_checker_tool,
+        ]
--- a/libs/experimental/langchain_experimental/tools/init.py
+++ b/libs/experimental/langchain_experimental/tools/init.py
@@ -1,3 +1,16 @@
+from langchain_experimental.tools.mongo_database.tool import (
+    InfoMongoDBTool,
+    ListMongoDBTool,
+    QueryMongoDBCheckerTool,
+    QueryMongoDBTool,
+)
 from langchain_experimental.tools.python.tool import PythonAstREPLTool, PythonREPLTool

-__all__ = ["PythonREPLTool", "PythonAstREPLTool"]
+__all__ = [
+    "PythonREPLTool",
+    "PythonAstREPLTool",
+    "InfoMongoDBTool",
+    "ListMongoDBTool",
+    "QueryMongoDBCheckerTool",
+    "QueryMongoDBTool",
+]
--- a/libs/experimental/langchain_experimental/tools/mongo_database/init.py
+++ b/libs/experimental/langchain_experimental/tools/mongo_database/init.py
@@ -0,0 +1 @@
+"""Tools for interacting with a MongoDB database."""
--- a/libs/experimental/langchain_experimental/tools/mongo_database/prompt.py
+++ b/libs/experimental/langchain_experimental/tools/mongo_database/prompt.py
@@ -0,0 +1,18 @@
+# flake8: noqa
+QUERY_CHECKER = """
+{query}
+Double check the MongoDB query above for common mistakes, including:
+- Not using PyMongo syntax and instead using MongoDB shell syntax
+- No quotes around keys in find() or find_one() filters
+- Improper use of $nin operator with null values
+- Using $merge instead of $concat for combining arrays
+- Incorrect use of $not or $ne for exclusive ranges
+- Data type mismatch in query conditions
+- Improperly referencing field names in queries
+- Using incorrect syntax for aggregation functions
+- Casting to the incorrect BSON data type
+- Using the improper fields for $lookup in aggregations
+
+If there are any of the above mistakes, rewrite the query. If there are no mistakes, just reproduce the original query.
+
+MongoDB Query: """
--- a/libs/experimental/langchain_experimental/tools/mongo_database/tool.py
+++ b/libs/experimental/langchain_experimental/tools/mongo_database/tool.py
@@ -0,0 +1,131 @@
+# flake8: noqa
+"""Tools for interacting with a MongoDB database."""
+from typing import Any, Dict, Optional
+
+from langchain.pydantic_v1 import BaseModel, Extra, Field, root_validator
+
+from langchain.schema.language_model import BaseLanguageModel
+from langchain.callbacks.manager import (
+    AsyncCallbackManagerForToolRun,
+    CallbackManagerForToolRun,
+)
+from langchain.chains.llm import LLMChain
+from langchain.prompts import PromptTemplate
+from langchain_experimental.utilities.mongo_database import MongoDatabase
+from langchain.tools.base import BaseTool
+from langchain_experimental.tools.mongo_database.prompt import QUERY_CHECKER
+
+
+class BaseMongoDBTool(BaseModel):
+    """Base tool for interacting with a MongoDB database."""
+
+    db: MongoDatabase = Field(exclude=True)
+
+    class Config(BaseTool.Config):
+        pass
+
+
+class QueryMongoDBTool(BaseMongoDBTool, BaseTool):
+    """Tool for querying a MongoDB database."""
+
+    name: str = "mongo_db_query"
+    description: str = """
+    Input to this tool is a detailed and correct MongoDB query, output is a result from the database.
+    If the query is not correct, an error message will be returned.
+    If an error is returned, rewrite the query, check the query, and try again.
+    """
+
+    def _run(
+        self,
+        query: str,
+        run_manager: Optional[CallbackManagerForToolRun] = None,
+    ) -> str:
+        """Execute the query, return the results or an error message."""
+        return self.db.run_no_throw(query)
+
+
+class InfoMongoDBTool(BaseMongoDBTool, BaseTool):
+    """Tool for getting metadata about a MongoDB database."""
+
+    name: str = "mongo_db_schema"
+    description: str = """
+    Input to this tool is a comma-separated list of collections, output is the name, indexes, and sample documents for those collections.    
+
+    Example Input: "collection1, collection2, collection3"
+    """
+
+    def _run(
+        self,
+        collection_names: str,
+        run_manager: Optional[CallbackManagerForToolRun] = None,
+    ) -> str:
+        """Get information about specified collections."""
+        return self.db.get_collection_info_no_throw(collection_names.split(", "))
+
+
+class ListMongoDBTool(BaseMongoDBTool, BaseTool):
+    """Tool for listing collections in a MongoDB database."""
+
+    name: str = "mongo_db_list"
+    description: str = """
+    Input is an empty string, output is a comma separated list of collections in the database.
+    """
+
+    def _run(
+        self,
+        tool_input: str = "",
+        run_manager: Optional[CallbackManagerForToolRun] = None,
+    ) -> str:
+        """Get a list of collections in the database."""
+        return ", ".join(self.db.get_usable_collection_names)
+
+
+class QueryMongoDBCheckerTool(BaseMongoDBTool, BaseTool):
+    """Use an LLM to check if a query is correct"""
+
+    template: str = QUERY_CHECKER
+    llm: BaseLanguageModel
+    llm_chain: LLMChain = Field(init=False)
+    name: str = "mongo_db_query_checker"
+    description: str = """
+    Use this tool to double check a MongoDB query for common mistakes.
+    """
+
+    @root_validator(pre=True)
+    def _init_llm_chain(cls, values: Dict[str, Any]) -> Dict[str, Any]:
+        """Initialize the LLM chain."""
+        if "llm_chain" not in values:
+            values["llm_chain"] = LLMChain(
+                llm=values.get("llm"),
+                prompt=PromptTemplate(
+                    template=QUERY_CHECKER, input_variables=["query"]
+                ),
+            )
+
+        if values["llm_chain"].prompt.input_variables != ["query"]:
+            raise ValueError(
+                "LLM chain for QueryCheckerTool must have input variables ['query']"
+            )
+
+        return values
+
+    def _run(
+        self,
+        query: str,
+        run_manager: Optional[CallbackManagerForToolRun] = None,
+    ) -> str:
+        """Use the LLM to check the query."""
+        return self.llm_chain.predict(
+            query=query,
+            callbacks=run_manager.get_child() if run_manager else None,
+        )
+
+    async def _arun(
+        self,
+        query: str,
+        run_manager: Optional[AsyncCallbackManagerForToolRun] = None,
+    ) -> str:
+        return await self.llm_chain.apredict(
+            query=query,
+            callbacks=run_manager.get_child() if run_manager else None,
+        )
--- a/libs/experimental/langchain_experimental/utilities/init.py
+++ b/libs/experimental/langchain_experimental/utilities/init.py
@@ -1,3 +1,4 @@
+from langchain_experimental.utilities.mongo_database import MongoDatabase
 from langchain_experimental.utilities.python import PythonREPL

-__all__ = ["PythonREPL"]
+__all__ = ["PythonREPL", "MongoDatabase"]
--- a/libs/experimental/langchain_experimental/utilities/mongo_database.py
+++ b/libs/experimental/langchain_experimental/utilities/mongo_database.py
@@ -0,0 +1,194 @@
+"""MongoEngine wrapper around a database."""
+from __future__ import annotations
+
+import re
+from ast import literal_eval
+from pprint import pformat
+from typing import Any, Iterable, List, Optional
+
+from pymongo import MongoClient
+from pymongo.errors import PyMongoError
+
+
+def _format_index(index: dict) -> str:
+    """Format an index for display."""
+    index_keys = index["key"]
+    index_keys_formatted = ", ".join(f"{k[0]}: {k[1]}" for k in index_keys)
+    unique = ""
+    if index_keys[0][0] == "_id" and not index["unique"]:
+        unique = ""
+    else:
+        unique = f' Unique: {index["unique"]},'
+    return f'Name: {index["name"]},{unique}' f' Keys: {{ {index_keys_formatted} }}'
+
+
+class MongoDatabase:
+    """MongoEngine wrapper around a database."""
+
+    def __init__(
+        self,
+        client: MongoClient,
+        ignore_collections: Optional[List[str]] = None,
+        include_collections: Optional[List[str]] = None,
+        sample_documents_in_collection_info: int = 3,
+        indexes_in_collection_info: bool = False,
+    ):
+        # Connect to MongoDB using mongoengine
+        self._client = client
+
+        if not isinstance(sample_documents_in_collection_info, int):
+            raise TypeError("sample_documents_in_collection_info must be an integer")
+
+        db = self._client.get_default_database()
+        self._all_collections = set(db.list_collection_names())
+
+        self._include_collections = (
+            set(include_collections) if include_collections else set()
+        )
+        if self._include_collections:
+            missing_collections = self._include_collections - self._all_collections
+            if missing_collections:
+                raise ValueError(
+                    f"collections {missing_collections} not found in database"
+                )
+        self._ignore_collections = (
+            set(ignore_collections) if ignore_collections else set()
+        )
+        if self._ignore_collections:
+            missing_collections = self._ignore_collections - self._all_collections
+            if missing_collections:
+                raise ValueError(
+                    f"collections {missing_collections} not found in database"
+                )
+
+        if not isinstance(sample_documents_in_collection_info, int):
+            raise TypeError("sample_documents_in_collection_info must be an integer")
+        self._sample_documents_in_collection_info = sample_documents_in_collection_info
+
+        self._indexes_in_collection_info = indexes_in_collection_info
+
+    @classmethod
+    def from_uri(cls, database_uri: str, **kwargs: Any) -> MongoDatabase:
+        """Construct a MongoEngine engine from URI."""
+        return cls(MongoClient(host=database_uri, **kwargs), **kwargs)
+
+    @property
+    def get_usable_collection_names(self) -> Iterable[str]:
+        """Get names of collections available."""
+
+        if self._include_collections:
+            return sorted(self._include_collections)
+        return sorted(self._all_collections - self._ignore_collections)
+
+    @property
+    def collection_info(self) -> str:
+        """Information about all collections in the database."""
+        return self.get_collection_info()
+
+    def get_collection_info(self, collection_names: Optional[List[str]] = None) -> str:
+        """Get information about specified collections."""
+        all_collection_names = self.get_usable_collection_names
+        if collection_names is not None:
+            missing_collections = set(collection_names).difference(all_collection_names)
+            if missing_collections:
+                raise ValueError(
+                    f"collection_names {missing_collections} not found in database"
+                )
+            all_collection_names = collection_names
+
+        collections = []
+        for collection_name in all_collection_names:
+            # Add document information
+            document_info = f"Collection Name: {collection_name}\n"
+
+            # Add indexes information
+            if self._indexes_in_collection_info:
+                document_info += f"\n{self._get_collection_indexes(collection_name)}\n"
+
+            # Sample rows or documents info (if required)
+            if self._sample_documents_in_collection_info:
+                document_info += f"\n{self._get_sample_documents(collection_name)}\n"
+
+            collections.append(document_info)
+
+        collections.sort()
+        final_str = "\n\n".join(collections)
+        return final_str
+
+    def get_collection_info_no_throw(
+        self, collection_names: Optional[List[str]] = None
+    ) -> str:
+        """Get information about specified collections.
+
+        If the collection does not exist, an error message is returned."""
+        try:
+            return self.get_collection_info(collection_names)
+        except ValueError as e:
+            return f"Error: {e}"
+
+    def _get_collection_indexes(self, collection_name: str) -> str:
+        """Get indexes of a collection."""
+        db = self._client.get_default_database()
+        indexes = db[collection_name].index_information()
+        indexes_cleaned = [
+            {"name": k, "key": v["key"], "unique": "unique" in v and v["unique"]}
+            for k, v in indexes.items()
+        ]
+        indexes_formatted = "\n".join(map(_format_index, indexes_cleaned))
+        return f"Collection Indexes:\n{indexes_formatted}"
+
+    def _get_sample_documents(self, collection_name: str) -> str:
+        db = self._client.get_default_database()
+        documents = (
+            db[collection_name].find().limit(self._sample_documents_in_collection_info)
+        )
+        documents_formatted = "\n".join(map(pformat, documents))
+        return (
+            f"{self._sample_documents_in_collection_info} sample documents from "
+            f"{collection_name}:\n{documents_formatted}"
+        )
+
+    def _execute(self, command: str) -> dict[str, Any]:
+        """Execute a command and return the result."""
+        db = self._client.get_default_database()
+        result = {}
+        try:
+            command_dict = literal_eval(command)
+            if isinstance(command_dict, dict):
+                result = db.command(command_dict)
+        except ValueError:
+            pass
+
+        # checks if command is a find query
+        if not result and re.match(r"^db\.\w+\.find\w*\(\{.*\}\)", command):
+            cursor = eval(command)  # dangerous, might need to find a better solution
+            result_list = []
+            for doc in cursor:
+                result_list.append(doc)
+            result = {"cursor": result_list}
+
+        return result
+
+    def run(self, command: str) -> str:
+        """Run a command and return a string representing the results."""
+        result = self._execute(command)
+        result_formatted = ""
+        if "cursor" in result:
+            if "firstBatch" in result["cursor"]:
+                result_formatted = "\n".join(
+                    map(pformat, list(result["cursor"]["firstBatch"]))
+                )
+            else:
+                result_formatted = "\n".join(map(pformat, result["cursor"]))
+        else:
+            result_formatted = pformat(result)
+        return f"Result:\n{result_formatted}"
+
+    def run_no_throw(self, command: str) -> str:
+        """Run a command and return a string representing the results.
+
+        If the statement throws an error, the error message is returned."""
+        try:
+            return self.run(command)
+        except PyMongoError as e:
+            return f"Error: {e}"
--- a/libs/experimental/poetry.lock
+++ b/libs/experimental/poetry.lock
@@ -787,6 +787,25 @@ files = [
    {file = "defusedxml-0.7.1.tar.gz", hash = "sha256:1bb3032db185915b62d7c6209c5a8792be6a32ab2fedacc84e01b52c51aa3e69"},
 ]

+[[package]]
+name = "dnspython"
+version = "2.4.2"
+description = "DNS toolkit"
+optional = true
+python-versions = ">=3.8,<4.0"
+files = [
+    {file = "dnspython-2.4.2-py3-none-any.whl", hash = "sha256:57c6fbaaeaaf39c891292012060beb141791735dbb4004798328fc2c467402d8"},
+    {file = "dnspython-2.4.2.tar.gz", hash = "sha256:8dcfae8c7460a2f84b4072e26f1c9f4101ca20c071649cb7c34e8b6a93d58984"},
+]
+
+[package.extras]
+dnssec = ["cryptography (>=2.6,<42.0)"]
+doh = ["h2 (>=4.1.0)", "httpcore (>=0.17.3)", "httpx (>=0.24.1)"]
+doq = ["aioquic (>=0.9.20)"]
+idna = ["idna (>=2.1,<4.0)"]
+trio = ["trio (>=0.14,<0.23)"]
+wmi = ["wmi (>=1.5.1,<2.0.0)"]
+
 [[package]]
 name = "exceptiongroup"
 version = "1.1.3"
@@ -2816,6 +2835,108 @@ files = [
 [package.extras]
 plugins = ["importlib-metadata"]

+[[package]]
+name = "pymongo"
+version = "4.6.1"
+description = "Python driver for MongoDB <http://www.mongodb.org>"
+optional = true
+python-versions = ">=3.7"
+files = [
+    {file = "pymongo-4.6.1-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:4344c30025210b9fa80ec257b0e0aab5aa1d5cca91daa70d82ab97b482cc038e"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux1_i686.whl", hash = "sha256:1c5654bb8bb2bdb10e7a0bc3c193dd8b49a960b9eebc4381ff5a2043f4c3c441"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux2014_aarch64.whl", hash = "sha256:eaf2f65190c506def2581219572b9c70b8250615dc918b3b7c218361a51ec42e"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux2014_i686.whl", hash = "sha256:262356ea5fcb13d35fb2ab6009d3927bafb9504ef02339338634fffd8a9f1ae4"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux2014_ppc64le.whl", hash = "sha256:2dd2f6960ee3c9360bed7fb3c678be0ca2d00f877068556785ec2eb6b73d2414"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux2014_s390x.whl", hash = "sha256:ff925f1cca42e933376d09ddc254598f8c5fcd36efc5cac0118bb36c36217c41"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux2014_x86_64.whl", hash = "sha256:3cadf7f4c8e94d8a77874b54a63c80af01f4d48c4b669c8b6867f86a07ba994f"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:55dac73316e7e8c2616ba2e6f62b750918e9e0ae0b2053699d66ca27a7790105"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:154b361dcb358ad377d5d40df41ee35f1cc14c8691b50511547c12404f89b5cb"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:2940aa20e9cc328e8ddeacea8b9a6f5ddafe0b087fedad928912e787c65b4909"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:010bc9aa90fd06e5cc52c8fac2c2fd4ef1b5f990d9638548dde178005770a5e8"},
+    {file = "pymongo-4.6.1-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:e470fa4bace5f50076c32f4b3cc182b31303b4fefb9b87f990144515d572820b"},
+    {file = "pymongo-4.6.1-cp310-cp310-win32.whl", hash = "sha256:da08ea09eefa6b960c2dd9a68ec47949235485c623621eb1d6c02b46765322ac"},
+    {file = "pymongo-4.6.1-cp310-cp310-win_amd64.whl", hash = "sha256:13d613c866f9f07d51180f9a7da54ef491d130f169e999c27e7633abe8619ec9"},
+    {file = "pymongo-4.6.1-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:6a0ae7a48a6ef82ceb98a366948874834b86c84e288dbd55600c1abfc3ac1d88"},
+    {file = "pymongo-4.6.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5bd94c503271e79917b27c6e77f7c5474da6930b3fb9e70a12e68c2dff386b9a"},
+    {file = "pymongo-4.6.1-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:2d4ccac3053b84a09251da8f5350bb684cbbf8c8c01eda6b5418417d0a8ab198"},
+    {file = "pymongo-4.6.1-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:349093675a2d3759e4fb42b596afffa2b2518c890492563d7905fac503b20daa"},
+    {file = "pymongo-4.6.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:88beb444fb438385e53dc9110852910ec2a22f0eab7dd489e827038fdc19ed8d"},
+    {file = "pymongo-4.6.1-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:d8e62d06e90f60ea2a3d463ae51401475568b995bafaffd81767d208d84d7bb1"},
+    {file = "pymongo-4.6.1-cp311-cp311-win32.whl", hash = "sha256:5556e306713e2522e460287615d26c0af0fe5ed9d4f431dad35c6624c5d277e9"},
+    {file = "pymongo-4.6.1-cp311-cp311-win_amd64.whl", hash = "sha256:b10d8cda9fc2fcdcfa4a000aa10413a2bf8b575852cd07cb8a595ed09689ca98"},
+    {file = "pymongo-4.6.1-cp312-cp312-macosx_10_9_universal2.whl", hash = "sha256:b435b13bb8e36be11b75f7384a34eefe487fe87a6267172964628e2b14ecf0a7"},
+    {file = "pymongo-4.6.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:e438417ce1dc5b758742e12661d800482200b042d03512a8f31f6aaa9137ad40"},
+    {file = "pymongo-4.6.1-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:8b47ebd89e69fbf33d1c2df79759d7162fc80c7652dacfec136dae1c9b3afac7"},
+    {file = "pymongo-4.6.1-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:bbed8cccebe1169d45cedf00461b2842652d476d2897fd1c42cf41b635d88746"},
+    {file = "pymongo-4.6.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:c30a9e06041fbd7a7590693ec5e407aa8737ad91912a1e70176aff92e5c99d20"},
+    {file = "pymongo-4.6.1-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:b8729dbf25eb32ad0dc0b9bd5e6a0d0b7e5c2dc8ec06ad171088e1896b522a74"},
+    {file = "pymongo-4.6.1-cp312-cp312-win32.whl", hash = "sha256:3177f783ae7e08aaf7b2802e0df4e4b13903520e8380915e6337cdc7a6ff01d8"},
+    {file = "pymongo-4.6.1-cp312-cp312-win_amd64.whl", hash = "sha256:00c199e1c593e2c8b033136d7a08f0c376452bac8a896c923fcd6f419e07bdd2"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux1_i686.whl", hash = "sha256:13552ca505366df74e3e2f0a4f27c363928f3dff0eef9f281eb81af7f29bc3c5"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux1_x86_64.whl", hash = "sha256:77e0df59b1a4994ad30c6d746992ae887f9756a43fc25dec2db515d94cf0222d"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux2014_aarch64.whl", hash = "sha256:3a7f02a58a0c2912734105e05dedbee4f7507e6f1bd132ebad520be0b11d46fd"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux2014_i686.whl", hash = "sha256:026a24a36394dc8930cbcb1d19d5eb35205ef3c838a7e619e04bd170713972e7"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux2014_ppc64le.whl", hash = "sha256:3b287e814a01deddb59b88549c1e0c87cefacd798d4afc0c8bd6042d1c3d48aa"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux2014_s390x.whl", hash = "sha256:9a710c184ba845afb05a6f876edac8f27783ba70e52d5eaf939f121fc13b2f59"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux2014_x86_64.whl", hash = "sha256:30b2c9caf3e55c2e323565d1f3b7e7881ab87db16997dc0cbca7c52885ed2347"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ff62ba8ff70f01ab4fe0ae36b2cb0b5d1f42e73dfc81ddf0758cd9f77331ad25"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:547dc5d7f834b1deefda51aedb11a7af9c51c45e689e44e14aa85d44147c7657"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:1de3c6faf948f3edd4e738abdb4b76572b4f4fdfc1fed4dad02427e70c5a6219"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a2831e05ce0a4df10c4ac5399ef50b9a621f90894c2a4d2945dc5658765514ed"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:144a31391a39a390efce0c5ebcaf4bf112114af4384c90163f402cec5ede476b"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:33bb16a07d3cc4e0aea37b242097cd5f7a156312012455c2fa8ca396953b11c4"},
+    {file = "pymongo-4.6.1-cp37-cp37m-manylinux_2_5_x86_64.manylinux1_x86_64.whl", hash = "sha256:b7b1a83ce514700276a46af3d9e481ec381f05b64939effc9065afe18456a6b9"},
+    {file = "pymongo-4.6.1-cp37-cp37m-win32.whl", hash = "sha256:3071ec998cc3d7b4944377e5f1217c2c44b811fae16f9a495c7a1ce9b42fb038"},
+    {file = "pymongo-4.6.1-cp37-cp37m-win_amd64.whl", hash = "sha256:2346450a075625c4d6166b40a013b605a38b6b6168ce2232b192a37fb200d588"},
+    {file = "pymongo-4.6.1-cp38-cp38-macosx_11_0_universal2.whl", hash = "sha256:061598cbc6abe2f382ab64c9caa83faa2f4c51256f732cdd890bcc6e63bfb67e"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux1_i686.whl", hash = "sha256:d483793a384c550c2d12cb794ede294d303b42beff75f3b3081f57196660edaf"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux1_x86_64.whl", hash = "sha256:f9756f1d25454ba6a3c2f1ef8b7ddec23e5cdeae3dc3c3377243ae37a383db00"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux2014_aarch64.whl", hash = "sha256:1ed23b0e2dac6f84f44c8494fbceefe6eb5c35db5c1099f56ab78fc0d94ab3af"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux2014_i686.whl", hash = "sha256:3d18a9b9b858ee140c15c5bfcb3e66e47e2a70a03272c2e72adda2482f76a6ad"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux2014_ppc64le.whl", hash = "sha256:c258dbacfff1224f13576147df16ce3c02024a0d792fd0323ac01bed5d3c545d"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux2014_s390x.whl", hash = "sha256:f7acc03a4f1154ba2643edeb13658d08598fe6e490c3dd96a241b94f09801626"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux2014_x86_64.whl", hash = "sha256:76013fef1c9cd1cd00d55efde516c154aa169f2bf059b197c263a255ba8a9ddf"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:3f0e6a6c807fa887a0c51cc24fe7ea51bb9e496fe88f00d7930063372c3664c3"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:dd1fa413f8b9ba30140de198e4f408ffbba6396864c7554e0867aa7363eb58b2"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:8d219b4508f71d762368caec1fc180960569766049bbc4d38174f05e8ef2fe5b"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:27b81ecf18031998ad7db53b960d1347f8f29e8b7cb5ea7b4394726468e4295e"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:56816e43c92c2fa8c11dc2a686f0ca248bea7902f4a067fa6cbc77853b0f041e"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:ef801027629c5b511cf2ba13b9be29bfee36ae834b2d95d9877818479cdc99ea"},
+    {file = "pymongo-4.6.1-cp38-cp38-manylinux_2_5_x86_64.manylinux1_x86_64.whl", hash = "sha256:d4c2be9760b112b1caf649b4977b81b69893d75aa86caf4f0f398447be871f3c"},
+    {file = "pymongo-4.6.1-cp38-cp38-win32.whl", hash = "sha256:39d77d8bbb392fa443831e6d4ae534237b1f4eee6aa186f0cdb4e334ba89536e"},
+    {file = "pymongo-4.6.1-cp38-cp38-win_amd64.whl", hash = "sha256:4497d49d785482cc1a44a0ddf8830b036a468c088e72a05217f5b60a9e025012"},
+    {file = "pymongo-4.6.1-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:69247f7a2835fc0984bbf0892e6022e9a36aec70e187fcfe6cae6a373eb8c4de"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux1_i686.whl", hash = "sha256:7bb0e9049e81def6829d09558ad12d16d0454c26cabe6efc3658e544460688d9"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux1_x86_64.whl", hash = "sha256:6a1810c2cbde714decf40f811d1edc0dae45506eb37298fd9d4247b8801509fe"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux2014_aarch64.whl", hash = "sha256:e2aced6fb2f5261b47d267cb40060b73b6527e64afe54f6497844c9affed5fd0"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux2014_i686.whl", hash = "sha256:d0355cff58a4ed6d5e5f6b9c3693f52de0784aa0c17119394e2a8e376ce489d4"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux2014_ppc64le.whl", hash = "sha256:3c74f4725485f0a7a3862cfd374cc1b740cebe4c133e0c1425984bcdcce0f4bb"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux2014_s390x.whl", hash = "sha256:9c79d597fb3a7c93d7c26924db7497eba06d58f88f58e586aa69b2ad89fee0f8"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux2014_x86_64.whl", hash = "sha256:8ec75f35f62571a43e31e7bd11749d974c1b5cd5ea4a8388725d579263c0fdf6"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a5e641f931c5cd95b376fd3c59db52770e17bec2bf86ef16cc83b3906c054845"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:9aafd036f6f2e5ad109aec92f8dbfcbe76cff16bad683eb6dd18013739c0b3ae"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:1f2b856518bfcfa316c8dae3d7b412aecacf2e8ba30b149f5eb3b63128d703b9"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:5ec31adc2e988fd7db3ab509954791bbc5a452a03c85e45b804b4bfc31fa221d"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:9167e735379ec43d8eafa3fd675bfbb12e2c0464f98960586e9447d2cf2c7a83"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:1461199b07903fc1424709efafe379205bf5f738144b1a50a08b0396357b5abf"},
+    {file = "pymongo-4.6.1-cp39-cp39-manylinux_2_5_x86_64.manylinux1_x86_64.whl", hash = "sha256:3094c7d2f820eecabadae76bfec02669567bbdd1730eabce10a5764778564f7b"},
+    {file = "pymongo-4.6.1-cp39-cp39-win32.whl", hash = "sha256:c91ea3915425bd4111cb1b74511cdc56d1d16a683a48bf2a5a96b6a6c0f297f7"},
+    {file = "pymongo-4.6.1-cp39-cp39-win_amd64.whl", hash = "sha256:ef102a67ede70e1721fe27f75073b5314911dbb9bc27cde0a1c402a11531e7bd"},
+    {file = "pymongo-4.6.1.tar.gz", hash = "sha256:31dab1f3e1d0cdd57e8df01b645f52d43cc1b653ed3afd535d2891f4fc4f9712"},
+]
+
+[package.dependencies]
+dnspython = ">=1.16.0,<3.0.0"
+
+[package.extras]
+aws = ["pymongo-auth-aws (<2.0.0)"]
+encryption = ["certifi", "pymongo[aws]", "pymongocrypt (>=1.6.0,<2.0.0)"]
+gssapi = ["pykerberos", "winkerberos (>=0.5.0)"]
+ocsp = ["certifi", "cryptography (>=2.5)", "pyopenssl (>=17.2.0)", "requests (<3.0.0)", "service-identity (>=18.1.0)"]
+snappy = ["python-snappy"]
+test = ["pytest (>=7)"]
+zstd = ["zstandard"]
+
 [[package]]
 name = "pytest"
 version = "7.4.3"
@@ -4926,9 +5047,9 @@ docs = ["furo", "jaraco.packaging (>=9.3)", "jaraco.tidelift (>=1.4)", "rst.link
 testing = ["big-O", "jaraco.functools", "jaraco.itertools", "more-itertools", "pytest (>=6)", "pytest-black (>=0.3.7)", "pytest-checkdocs (>=2.4)", "pytest-cov", "pytest-enabler (>=2.2)", "pytest-ignore-flaky", "pytest-mypy (>=0.9.1)", "pytest-ruff"]

 [extras]
-extended-testing = ["faker", "presidio-analyzer", "presidio-anonymizer", "sentence-transformers", "vowpal-wabbit-next"]
+extended-testing = ["faker", "presidio-analyzer", "presidio-anonymizer", "pymongo", "sentence-transformers", "vowpal-wabbit-next"]

 [metadata]
 lock-version = "2.0"
 python-versions = ">=3.8.1,<4.0"
-content-hash = "82bebfc5475be48f180bcb5013850eb88f451ffdc1f126a12112e10ed56f6529"
+content-hash = "a299bf636b758f1242cfbd5d944c9d82e3d73fcb2a37faa910cc8617f7b1a98c"
--- a/libs/experimental/pyproject.toml
+++ b/libs/experimental/pyproject.toml
@@ -17,6 +17,7 @@ presidio-analyzer = {version = "^2.2.33", optional = true}
 faker = {version = "^19.3.1", optional = true}
 vowpal-wabbit-next = {version = "0.6.0", optional = true}
 sentence-transformers = {version = "^2", optional = true}
+pymongo = {version = "^4.6.1", optional = true}

 [tool.poetry.group.lint.dependencies]
 ruff = "^0.1.5"
@@ -54,6 +55,7 @@ extended_testing = [
 "faker",
 "vowpal-wabbit-next",
 "sentence-transformers",
+ "pymongo",
 ]

 [tool.ruff]
--- a/libs/experimental/tests/integration_tests/agents/test_mongo.py
+++ b/libs/experimental/tests/integration_tests/agents/test_mongo.py
@@ -0,0 +1,20 @@
+from langchain_experimental.agents.agent_toolkits import (
+    MongoDatabaseToolkit,
+    create_mongo_agent,
+)
+from langchain_experimental.utilities import MongoDatabase
+from tests.unit_tests.fake_llm import FakeLLM
+
+
+def test_create_mongo_agent() -> None:
+    db = MongoDatabase.from_uri("mongodb://localhost:27017/test_db")
+    queries = {"foo": "Final Answer: baz"}
+    llm = FakeLLM(queries=queries, sequential_responses=True)
+    toolkit = MongoDatabaseToolkit(db=db, llm=llm)
+
+    agent_executor = create_mongo_agent(
+        llm=llm,
+        toolkit=toolkit,
+    )
+
+    assert agent_executor.run("hello") == "baz"
--- a/libs/experimental/tests/integration_tests/utilities/test_mongo_database.py
+++ b/libs/experimental/tests/integration_tests/utilities/test_mongo_database.py
@@ -0,0 +1,80 @@
+"""Test MongoDB database wrapper."""
+
+import re
+
+from pymongo import MongoClient
+
+from langchain_experimental.utilities.mongo_database import MongoDatabase
+
+uri = "mongodb://localhost:27017/test_db"
+
+
+def test_collection_info() -> None:
+    """Test that collection info is constructed properly."""
+    db = MongoDatabase.from_uri(uri)
+    collection = db._client["test_db"]["test_collection"]
+
+    if "test" not in collection.find_one({"test": "test"}):  # type: ignore
+        collection.insert_many(
+            [
+                {"test": "test"},
+                {"test2": "test"},
+                {"test3": "test"},
+                {"test4": "test"},
+            ]
+        )
+    output = db.collection_info
+    expected_output = """
+    Collection Name: test_collection
+
+    3 sample documents from test_collection:
+    {'_id': , 'test': 'test'}
+    {'_id': , 'test2': 'test'}
+    {'_id': , 'test3': 'test'}
+    """
+    output = re.sub(r"ObjectId\('.+'\)", "", output)
+
+    assert sorted(" ".join(output.split())) == sorted(" ".join(expected_output.split()))
+
+
+def test_collection_info_w_sample_documents() -> None:
+    """Test that collection info is constructed properly."""
+    db = MongoDatabase(
+        MongoClient(uri),
+        sample_documents_in_collection_info=2,
+    )
+    collection = db._client["test_db"]["test_collection"]
+
+    if "test" not in collection.find_one({"test": "test"}):  # type: ignore
+        collection.insert_many(
+            [
+                {"test": "test"},
+                {"test2": "test"},
+                {"test3": "test"},
+                {"test4": "test"},
+            ]
+        )
+    output = db.collection_info
+    expected_output = """
+    Collection Name: test_collection
+
+    2 sample documents from test_collection:
+    {'_id': , 'test': 'test'}
+    {'_id': , 'test2': 'test'}
+    """
+    output = re.sub(r"ObjectId\('.+'\)", "", output)
+
+    assert sorted(" ".join(output.split())) == sorted(" ".join(expected_output.split()))
+
+
+def test_mongo_database_run() -> None:
+    """Test that run works properly."""
+    db = MongoDatabase.from_uri(uri)
+    output = db.run("{ 'find': 'test_collection', 'filter': { 'test4': 'test' } }")
+    expected_output = """
+    Result:
+    {'_id': , 'test4': 'test'}
+    """
+    output = re.sub(r"ObjectId\('.+'\)", "", output)
+
+    assert sorted(" ".join(output.split())) == sorted(" ".join(expected_output.split()))
--- a/libs/langchain/tests/integration_tests/agents/init.py
+++ b/libs/langchain/tests/integration_tests/agents/init.py
--- a/libs/langchain/tests/integration_tests/agents/test_ainetwork_agent.py
+++ b/libs/langchain/tests/integration_tests/agents/test_ainetwork_agent.py
@@ -0,0 +1,175 @@
+import asyncio
+import os
+import time
+import urllib.request
+import uuid
+from enum import Enum
+from typing import Any
+from urllib.error import HTTPError
+
+import pytest
+
+from langchain.agents import AgentType, initialize_agent
+from langchain.agents.agent_toolkits.ainetwork.toolkit import AINetworkToolkit
+from langchain.chat_models import ChatOpenAI
+from langchain.tools.ainetwork.utils import authenticate
+
+
+class Match(Enum):
+    __test__ = False
+    ListWildcard = 1
+    StrWildcard = 2
+    DictWildcard = 3
+    IntWildcard = 4
+    FloatWildcard = 5
+    ObjectWildcard = 6
+
+    @classmethod
+    def match(cls, value: Any, template: Any) -> bool:
+        if template is cls.ListWildcard:
+            return isinstance(value, list)
+        elif template is cls.StrWildcard:
+            return isinstance(value, str)
+        elif template is cls.DictWildcard:
+            return isinstance(value, dict)
+        elif template is cls.IntWildcard:
+            return isinstance(value, int)
+        elif template is cls.FloatWildcard:
+            return isinstance(value, float)
+        elif template is cls.ObjectWildcard:
+            return True
+        elif type(value) != type(template):
+            return False
+        elif isinstance(value, dict):
+            if len(value) != len(template):
+                return False
+            for k, v in value.items():
+                if k not in template or not cls.match(v, template[k]):
+                    return False
+            return True
+        elif isinstance(value, list):
+            if len(value) != len(template):
+                return False
+            for i in range(len(value)):
+                if not cls.match(value[i], template[i]):
+                    return False
+            return True
+        else:
+            return value == template
+
+
+@pytest.mark.requires("ain")
+def test_ainetwork_toolkit() -> None:
+    def get(path: str, type: str = "value", default: Any = None) -> Any:
+        ref = ain.db.ref(path)
+        value = asyncio.run(
+            {
+                "value": ref.getValue,
+                "rule": ref.getRule,
+                "owner": ref.getOwner,
+            }[type]()
+        )
+        return default if value is None else value
+
+    def validate(path: str, template: Any, type: str = "value") -> bool:
+        value = get(path, type)
+        return Match.match(value, template)
+
+    if not os.environ.get("AIN_BLOCKCHAIN_ACCOUNT_PRIVATE_KEY", None):
+        from ain.account import Account
+
+        account = Account.create()
+        os.environ["AIN_BLOCKCHAIN_ACCOUNT_PRIVATE_KEY"] = account.private_key
+
+    interface = authenticate(network="testnet")
+    toolkit = AINetworkToolkit(network="testnet", interface=interface)
+    llm = ChatOpenAI(model="gpt-4", temperature=0)
+    agent = initialize_agent(
+        tools=toolkit.get_tools(),
+        llm=llm,
+        verbose=True,
+        agent=AgentType.OPENAI_FUNCTIONS,
+    )
+    ain = interface
+    self_address = ain.wallet.defaultAccount.address
+    co_address = "0x6813Eb9362372EEF6200f3b1dbC3f819671cBA69"
+
+    # Test creating an app
+    UUID = uuid.UUID(
+        int=(int(time.time() * 1000) << 64) | (uuid.uuid4().int & ((1 << 64) - 1))
+    )
+    app_name = f"_langchain_test__{str(UUID).replace('-', '_')}"
+    agent.run(f"""Create app {app_name}""")
+    validate(f"/manage_app/{app_name}/config", {"admin": {self_address: True}})
+    validate(f"/apps/{app_name}/DB", None, "owner")
+
+    # Test reading owner config
+    agent.run(f"""Read owner config of /apps/{app_name}/DB .""")
+    assert ...
+
+    # Test granting owner config
+    agent.run(
+        f"""Grant owner authority to {co_address} for edit write rule permission of /apps/{app_name}/DB_co ."""  # noqa: E501
+    )
+    validate(
+        f"/apps/{app_name}/DB_co",
+        {
+            ".owner": {
+                "owners": {
+                    co_address: {
+                        "branch_owner": False,
+                        "write_function": False,
+                        "write_owner": False,
+                        "write_rule": True,
+                    }
+                }
+            }
+        },
+        "owner",
+    )
+
+    # Test reading owner config
+    agent.run(f"""Read owner config of /apps/{app_name}/DB_co .""")
+    assert ...
+
+    # Test reading owner config
+    agent.run(f"""Read owner config of /apps/{app_name}/DB .""")
+    assert ...  # Check if owner {self_address} exists
+
+    # Test reading a value
+    agent.run(f"""Read value in /apps/{app_name}/DB""")
+    assert ...  # empty
+
+    # Test writing a value
+    agent.run(f"""Write value {{1: 1904, 2: 43}} in /apps/{app_name}/DB""")
+    validate(f"/apps/{app_name}/DB", {1: 1904, 2: 43})
+
+    # Test reading a value
+    agent.run(f"""Read value in /apps/{app_name}/DB""")
+    assert ...  # check value
+
+    # Test reading a rule
+    agent.run(f"""Read write rule of app {app_name} .""")
+    assert ...  # check rule that self_address exists
+
+    # Test sending AIN
+    self_balance = get(f"/accounts/{self_address}/balance", default=0)
+    transaction_history = get(f"/transfer/{self_address}/{co_address}", default={})
+    if self_balance < 1:
+        try:
+            with urllib.request.urlopen(
+                f"http://faucet.ainetwork.ai/api/test/{self_address}/"
+            ) as response:
+                try_test = response.getcode()
+        except HTTPError as e:
+            try_test = e.getcode()
+    else:
+        try_test = 200
+
+    if try_test == 200:
+        agent.run(f"""Send 1 AIN to {co_address}""")
+        transaction_update = get(f"/transfer/{self_address}/{co_address}", default={})
+        assert any(
+            transaction_update[key]["value"] == 1
+            for key in transaction_update.keys() - transaction_history.keys()
+        )
--- a/libs/langchain/tests/integration_tests/agents/test_powerbi_agent.py
+++ b/libs/langchain/tests/integration_tests/agents/test_powerbi_agent.py
@@ -0,0 +1,47 @@
+import pytest
+
+from langchain.agents.agent_toolkits import PowerBIToolkit, create_pbi_agent
+from langchain.chat_models import ChatOpenAI
+from langchain.utilities.powerbi import PowerBIDataset
+from langchain.utils import get_from_env
+
+
+def azure_installed() -> bool:
+    try:
+        from azure.core.credentials import TokenCredential  # noqa: F401
+        from azure.identity import DefaultAzureCredential  # noqa: F401
+
+        return True
+    except Exception as e:
+        print(f"azure not installed, skipping test {e}")
+        return False
+
+
+@pytest.mark.skipif(not azure_installed(), reason="requires azure package")
+def test_daxquery() -> None:
+    from azure.identity import DefaultAzureCredential
+
+    DATASET_ID = get_from_env("", "POWERBI_DATASET_ID")
+    TABLE_NAME = get_from_env("", "POWERBI_TABLE_NAME")
+    NUM_ROWS = get_from_env("", "POWERBI_NUMROWS")
+
+    fast_llm = ChatOpenAI(
+        temperature=0.5, max_tokens=1000, model_name="gpt-3.5-turbo", verbose=True
+    )
+    smart_llm = ChatOpenAI(
+        temperature=0, max_tokens=100, model_name="gpt-4", verbose=True
+    )
+
+    toolkit = PowerBIToolkit(
+        powerbi=PowerBIDataset(
+            dataset_id=DATASET_ID,
+            table_names=[TABLE_NAME],
+            credential=DefaultAzureCredential(),
+        ),
+        llm=smart_llm,
+    )
+
+    agent_executor = create_pbi_agent(llm=fast_llm, toolkit=toolkit, verbose=True)
+
+    output = agent_executor.run(f"How many rows are in the table, {TABLE_NAME}")
+    assert NUM_ROWS in output
--- a/poetry.lock
+++ b/poetry.lock
				`@@ -0,0 +1 @@`
				`"""Tools for interacting with a MongoDB database."""`