Merge branch 'kayvane1-align-search-tools' into vwp/align_search_tools

Add docs for Fly.io deployment (#3584 )
A minimal example of how to deploy LangChain to Fly.io using Flask.
2026-04-20 05:04:50 +00:00 · 2023-04-26 15:04:23 -07:00 · 2023-04-26 15:04:10 -07:00 · 2023-04-26 15:04:10 -07:00 · 2023-04-26 15:04:10 -07:00 · 2023-04-26 15:04:10 -07:00
21 changed files with 76 additions and 597 deletions
--- a/docs/_static/MetalDash.png
+++ b/docs/_static/MetalDash.png
--- a/docs/ecosystem/metal.md
+++ b/docs/ecosystem/metal.md
@@ -1,26 +0,0 @@
-# Metal
-
-This page covers how to use [Metal](https://getmetal.io) within LangChain.
-
-## What is Metal?
-
-Metal is a  managed retrieval & memory platform built for production. Easily index your data into `Metal` and run semantic search and retrieval on it.
-
-![Metal](../_static/MetalDash.png)
-
-## Quick start
-
-Get started by [creating a Metal account](https://app.getmetal.io/signup).
-
-Then, you can easily take advantage of the `MetalRetriever` class to start retrieving your data for semantic search, prompting context, etc. This class takes a `Metal` instance and a dictionary of parameters to pass to the Metal API.
-
-```python
-from langchain.retrievers import MetalRetriever
-from metal_sdk.metal import Metal
-
-
-metal = Metal("API_KEY", "CLIENT_ID", "INDEX_ID");
-retriever = MetalRetriever(metal, params={"limit": 2})
-
-docs = retriever.get_relevant_documents("search term")
-```
--- a/docs/modules/agents/tools/examples/bash.ipynb
+++ b/docs/modules/agents/tools/examples/bash.ipynb
@@ -39,27 +39,11 @@
          "name": "stdout",
          "output_type": "stream",
          "text": [
-            "apify.ipynb\n",
-            "arxiv.ipynb\n",
            "bash.ipynb\n",
-            "bing_search.ipynb\n",
-            "chatgpt_plugins.ipynb\n",
-            "ddg.ipynb\n",
-            "google_places.ipynb\n",
            "google_search.ipynb\n",
-            "google_serper.ipynb\n",
-            "gradio_tools.ipynb\n",
-            "human_tools.ipynb\n",
-            "ifttt.ipynb\n",
-            "openweathermap.ipynb\n",
            "python.ipynb\n",
            "requests.ipynb\n",
-            "search_tools.ipynb\n",
-            "searx_search.ipynb\n",
            "serpapi.ipynb\n",
-            "wikipedia.ipynb\n",
-            "wolfram_alpha.ipynb\n",
-            "zapier.ipynb\n",
            "\n"
          ]
        }
@@ -68,95 +52,10 @@
        "print(bash.run(\"ls\"))"
      ]
    },
-    {
-      "cell_type": "code",
-      "execution_count": 4,
-      "id": "e7896f8e",
-      "metadata": {},
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "apify.ipynb\n",
-            "arxiv.ipynb\n",
-            "bash.ipynb\n",
-            "bing_search.ipynb\n",
-            "chatgpt_plugins.ipynb\n",
-            "ddg.ipynb\n",
-            "google_places.ipynb\n",
-            "google_search.ipynb\n",
-            "google_serper.ipynb\n",
-            "gradio_tools.ipynb\n",
-            "human_tools.ipynb\n",
-            "ifttt.ipynb\n",
-            "openweathermap.ipynb\n",
-            "python.ipynb\n",
-            "requests.ipynb\n",
-            "search_tools.ipynb\n",
-            "searx_search.ipynb\n",
-            "serpapi.ipynb\n",
-            "wikipedia.ipynb\n",
-            "wolfram_alpha.ipynb\n",
-            "zapier.ipynb\n",
-            "\n"
-          ]
-        }
-      ],
-      "source": [
-        "bash.run(\"cd ..\")\n",
-        "# The commands are executed in a new subprocess each time, meaning that\n",
-        "# this call will return the same results as the last.\n",
-        "print(bash.run(\"ls\"))"
-      ]
-    },
-    {
-      "attachments": {},
-      "cell_type": "markdown",
-      "id": "851fee9f",
-      "metadata": {},
-      "source": [
-        "## Terminal Persistance\n",
-        "\n",
-        "By default, the bash command will be executed in a new subprocess each time. To retain a persistent bash session, we can use the `persistent=True` arg."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 5,
-      "id": "4a93ea2c",
-      "metadata": {},
-      "outputs": [],
-      "source": [
-        "bash = BashProcess(persistent=True)"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 6,
-      "id": "a1e98b78",
-      "metadata": {},
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "custom_tools.ipynb\t\tmulti_input_tool.ipynb\n",
-            "examples\t\t\ttool_input_validation.ipynb\n",
-            "getting_started.md\n"
-          ]
-        }
-      ],
-      "source": [
-        "bash.run(\"cd ..\")\n",
-        "# Note the list of files is different\n",
-        "print(bash.run(\"ls\"))"
-      ]
-    },
    {
      "cell_type": "code",
      "execution_count": null,
-      "id": "e13c1c9c",
+      "id": "851fee9f",
      "metadata": {},
      "outputs": [],
      "source": []
@@ -178,7 +77,7 @@
      "name": "python",
      "nbconvert_exporter": "python",
      "pygments_lexer": "ipython3",
-      "version": "3.8.16"
+      "version": "3.10.9"
    }
  },
  "nbformat": 4,
--- a/docs/modules/agents/tools/examples/ddg.ipynb
+++ b/docs/modules/agents/tools/examples/ddg.ipynb
@@ -27,7 +27,7 @@
   "metadata": {},
   "outputs": [],
   "source": [
-    "from langchain.tools import DuckDuckGoSearchRun"
+    "from langchain.tools import DuckDuckGoSearchTool"
   ]
  },
  {
@@ -37,7 +37,7 @@
   "metadata": {},
   "outputs": [],
   "source": [
-    "search = DuckDuckGoSearchRun()"
+    "search = DuckDuckGoSearchTool()"
   ]
  },
  {
--- a/docs/modules/chains/examples/llm_bash.ipynb
+++ b/docs/modules/chains/examples/llm_bash.ipynb
@@ -24,8 +24,8 @@
      "\n",
      "```bash\n",
      "echo \"Hello World\"\n",
-      "```\u001b[0m\n",
-      "Code: \u001b[33;1m\u001b[1;3m['echo \"Hello World\"']\u001b[0m\n",
+      "```\u001b[0m['```bash', 'echo \"Hello World\"', '```']\n",
+      "\n",
      "Answer: \u001b[33;1m\u001b[1;3mHello World\n",
      "\u001b[0m\n",
      "\u001b[1m> Finished chain.\u001b[0m\n"
@@ -65,7 +65,7 @@
  },
  {
   "cell_type": "code",
-   "execution_count": 2,
+   "execution_count": 28,
   "metadata": {},
   "outputs": [],
   "source": [
@@ -93,7 +93,7 @@
  },
  {
   "cell_type": "code",
-   "execution_count": 3,
+   "execution_count": 29,
   "metadata": {},
   "outputs": [
    {
@@ -107,8 +107,8 @@
      "\n",
      "```bash\n",
      "printf \"Hello World\\n\"\n",
-      "```\u001b[0m\n",
-      "Code: \u001b[33;1m\u001b[1;3m['printf \"Hello World\\\\n\"']\u001b[0m\n",
+      "```\u001b[0m['```bash', 'printf \"Hello World\\\\n\"', '```']\n",
+      "\n",
      "Answer: \u001b[33;1m\u001b[1;3mHello World\n",
      "\u001b[0m\n",
      "\u001b[1m> Finished chain.\u001b[0m\n"
@@ -120,7 +120,7 @@
       "'Hello World\\n'"
      ]
     },
-     "execution_count": 3,
+     "execution_count": 29,
     "metadata": {},
     "output_type": "execute_result"
    }
@@ -132,114 +132,6 @@
    "\n",
    "bash_chain.run(text)"
   ]
-  },
-  {
-   "attachments": {},
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Persistent Terminal\n",
-    "\n",
-    "By default, the chain will run in a separate subprocess each time it is called. This behavior can be changed by instantiating with a persistent bash process."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\n",
-      "\n",
-      "\u001b[1m> Entering new LLMBashChain chain...\u001b[0m\n",
-      "List the current directory then move up a level.\u001b[32;1m\u001b[1;3m\n",
-      "\n",
-      "```bash\n",
-      "ls\n",
-      "cd ..\n",
-      "```\u001b[0m\n",
-      "Code: \u001b[33;1m\u001b[1;3m['ls', 'cd ..']\u001b[0m\n",
-      "Answer: \u001b[33;1m\u001b[1;3mapi.ipynb\t\t\tllm_summarization_checker.ipynb\n",
-      "constitutional_chain.ipynb\tmoderation.ipynb\n",
-      "llm_bash.ipynb\t\t\topenai_openapi.yaml\n",
-      "llm_checker.ipynb\t\topenapi.ipynb\n",
-      "llm_math.ipynb\t\t\tpal.ipynb\n",
-      "llm_requests.ipynb\t\tsqlite.ipynb\u001b[0m\n",
-      "\u001b[1m> Finished chain.\u001b[0m\n"
-     ]
-    },
-    {
-     "data": {
-      "text/plain": [
-       "'api.ipynb\\t\\t\\tllm_summarization_checker.ipynb\\r\\nconstitutional_chain.ipynb\\tmoderation.ipynb\\r\\nllm_bash.ipynb\\t\\t\\topenai_openapi.yaml\\r\\nllm_checker.ipynb\\t\\topenapi.ipynb\\r\\nllm_math.ipynb\\t\\t\\tpal.ipynb\\r\\nllm_requests.ipynb\\t\\tsqlite.ipynb'"
-      ]
-     },
-     "execution_count": 4,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "from langchain.utilities.bash import BashProcess\n",
-    "\n",
-    "\n",
-    "persistent_process = BashProcess(persistent=True)\n",
-    "bash_chain = LLMBashChain.from_bash_process(llm=llm, bash_process=persistent_process, verbose=True)\n",
-    "\n",
-    "text = \"List the current directory then move up a level.\"\n",
-    "\n",
-    "bash_chain.run(text)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 5,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\n",
-      "\n",
-      "\u001b[1m> Entering new LLMBashChain chain...\u001b[0m\n",
-      "List the current directory then move up a level.\u001b[32;1m\u001b[1;3m\n",
-      "\n",
-      "```bash\n",
-      "ls\n",
-      "cd ..\n",
-      "```\u001b[0m\n",
-      "Code: \u001b[33;1m\u001b[1;3m['ls', 'cd ..']\u001b[0m\n",
-      "Answer: \u001b[33;1m\u001b[1;3mexamples\t\tgetting_started.ipynb\tindex_examples\n",
-      "generic\t\t\thow_to_guides.rst\u001b[0m\n",
-      "\u001b[1m> Finished chain.\u001b[0m\n"
-     ]
-    },
-    {
-     "data": {
-      "text/plain": [
-       "'examples\\t\\tgetting_started.ipynb\\tindex_examples\\r\\ngeneric\\t\\t\\thow_to_guides.rst'"
-      ]
-     },
-     "execution_count": 5,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "# Run the same command again and see that the state is maintained between calls\n",
-    "bash_chain.run(text)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": []
  }
 ],
 "metadata": {
@@ -258,7 +150,7 @@
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
-   "version": "3.8.16"
+   "version": "3.10.6"
  }
 },
 "nbformat": 4,
--- a/docs/use_cases/autonomous_agents/marathon_times.ipynb
+++ b/docs/use_cases/autonomous_agents/marathon_times.ipynb
@@ -219,7 +219,7 @@
   },
   "outputs": [],
   "source": [
-    "from langchain.tools import BaseTool, DuckDuckGoSearchRun\n",
+    "from langchain.tools import BaseTool, DuckDuckGoSearchTool\n",
    "from langchain.text_splitter import RecursiveCharacterTextSplitter\n",
    "\n",
    "from pydantic import Field\n",
@@ -321,7 +321,7 @@
   "outputs": [],
   "source": [
    "# !pip install duckduckgo_search\n",
-    "web_search = DuckDuckGoSearchRun()"
+    "web_search = DuckDuckGoSearchTool()"
   ]
  },
  {
@@ -618,7 +618,7 @@
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
-   "version": "3.8.16"
+   "version": "3.11.2"
  }
 },
 "nbformat": 4,
--- a/langchain/agents/agent_toolkits/pandas/base.py
+++ b/langchain/agents/agent_toolkits/pandas/base.py
@@ -35,7 +35,7 @@ def create_pandas_dataframe_agent(
    prompt = ZeroShotAgent.create_prompt(
        tools, prefix=prefix, suffix=suffix, input_variables=input_variables
    )
-    partial_prompt = prompt.partial(df=str(df.head().to_markdown()))
+    partial_prompt = prompt.partial(df=str(df.head()))
    llm_chain = LLMChain(
        llm=llm,
        prompt=partial_prompt,
--- a/langchain/agents/load_tools.py
+++ b/langchain/agents/load_tools.py
@@ -15,7 +15,7 @@ from langchain.requests import TextRequestsWrapper
 from langchain.tools.arxiv.tool import ArxivQueryRun
 from langchain.tools.base import BaseTool
 from langchain.tools.bing_search.tool import BingSearchRun
-from langchain.tools.ddg_search.tool import DuckDuckGoSearchRun
+from langchain.tools.ddg_search.tool import DuckDuckGoSearchTool
 from langchain.tools.google_search.tool import GoogleSearchResults, GoogleSearchRun
 from langchain.tools.human.tool import HumanInputRun
 from langchain.tools.python.tool import PythonREPLTool
@@ -219,7 +219,7 @@ def _get_bing_search(**kwargs: Any) -> BaseTool:


 def _get_ddg_search(**kwargs: Any) -> BaseTool:
-    return DuckDuckGoSearchRun(api_wrapper=DuckDuckGoSearchAPIWrapper(**kwargs))
+    return DuckDuckGoSearchTool(api_wrapper=DuckDuckGoSearchAPIWrapper(**kwargs))


 def _get_human_tool(**kwargs: Any) -> BaseTool:
--- a/langchain/chains/llm_bash/base.py
+++ b/langchain/chains/llm_bash/base.py
@@ -1,46 +1,15 @@
 """Chain that interprets a prompt and executes bash code to perform bash operations."""
-import logging
-import re
-from typing import Any, Dict, List
+from typing import Dict, List

-from pydantic import Extra, Field
+from pydantic import Extra

 from langchain.chains.base import Chain
 from langchain.chains.llm import LLMChain
 from langchain.chains.llm_bash.prompt import PROMPT
 from langchain.prompts.base import BasePromptTemplate
-from langchain.schema import BaseLanguageModel, BaseOutputParser, OutputParserException
+from langchain.schema import BaseLanguageModel
 from langchain.utilities.bash import BashProcess

-logger = logging.getLogger(__name__)
-
-
-class BashOutputParser(BaseOutputParser):
-    """Parser for bash output."""
-
-    def parse(self, text: str) -> List[str]:
-        if "```bash" in text:
-            return self.get_code_blocks(text)
-        else:
-            raise OutputParserException(
-                f"Failed to parse bash output. Got: {text}",
-            )
-
-    @staticmethod
-    def get_code_blocks(t: str) -> List[str]:
-        """Get multiple code blocks from the LLM result."""
-        code_blocks: List[str] = []
-        # Bash markdown code blocks
-        pattern = re.compile(r"```bash(.*?)(?:\n\s*)```", re.DOTALL)
-        for match in pattern.finditer(t):
-            matched = match.group(1).strip()
-            if matched:
-                code_blocks.extend(
-                    [line for line in matched.split("\n") if line.strip()]
-                )
-
-        return code_blocks
-

 class LLMBashChain(Chain):
    """Chain that interprets a prompt and executes bash code to perform bash operations.
@@ -57,8 +26,6 @@ class LLMBashChain(Chain):
    input_key: str = "question"  #: :meta private:
    output_key: str = "answer"  #: :meta private:
    prompt: BasePromptTemplate = PROMPT
-    output_parser: BaseOutputParser = Field(default_factory=BashOutputParser)
-    bash_process: BashProcess = Field(default_factory=BashProcess)  #: :meta private:

    class Config:
        """Configuration for this pydantic object."""
@@ -84,40 +51,29 @@ class LLMBashChain(Chain):

    def _call(self, inputs: Dict[str, str]) -> Dict[str, str]:
        llm_executor = LLMChain(prompt=self.prompt, llm=self.llm)
-
+        bash_executor = BashProcess()
        self.callback_manager.on_text(inputs[self.input_key], verbose=self.verbose)

        t = llm_executor.predict(question=inputs[self.input_key])
        self.callback_manager.on_text(t, color="green", verbose=self.verbose)
+
        t = t.strip()
-        try:
-            command_list = self.output_parser.parse(t)
-        except OutputParserException as e:
-            self.callback_manager.on_chain_error(e, verbose=self.verbose)
-            raise e
+        if t.startswith("```bash"):
+            # Split the string into a list of substrings
+            command_list = t.split("\n")
+            print(command_list)

-        if self.verbose:
-            self.callback_manager.on_text("\nCode: ", verbose=self.verbose)
-            self.callback_manager.on_text(
-                str(command_list), color="yellow", verbose=self.verbose
-            )
+            # Remove the first and last substrings
+            command_list = [s for s in command_list[1:-1]]
+            output = bash_executor.run(command_list)

-        output = self.bash_process.run(command_list)
+            self.callback_manager.on_text("\nAnswer: ", verbose=self.verbose)
+            self.callback_manager.on_text(output, color="yellow", verbose=self.verbose)

-        self.callback_manager.on_text("\nAnswer: ", verbose=self.verbose)
-        self.callback_manager.on_text(output, color="yellow", verbose=self.verbose)
+        else:
+            raise ValueError(f"unknown format from LLM: {t}")
        return {self.output_key: output}

    @property
    def _chain_type(self) -> str:
        return "llm_bash_chain"
-
-    @classmethod
-    def from_bash_process(
-        cls,
-        bash_process: BashProcess,
-        llm: BaseLanguageModel,
-        **kwargs: Any,
-    ) -> "LLMBashChain":
-        """Create a LLMBashChain from a BashProcess."""
-        return cls(llm=llm, bash_process=bash_process, **kwargs)
--- a/langchain/docker-compose.yaml
+++ b/langchain/docker-compose.yaml
@@ -26,4 +26,4 @@ services:
      - POSTGRES_USER=postgres
      - POSTGRES_DB=postgres
    expose:
-      - 5432
+      - 5432:5432
--- a/langchain/document_loaders/html_bs.py
+++ b/langchain/document_loaders/html_bs.py
@@ -17,7 +17,6 @@ class BSHTMLLoader(BaseLoader):
        file_path: str,
        open_encoding: Union[str, None] = None,
        bs_kwargs: Union[dict, None] = None,
-        get_text_separator: str = "",
    ) -> None:
        """Initialise with path, and optionally, file encoding to use, and any kwargs
        to pass to the BeautifulSoup object."""
@@ -34,7 +33,6 @@ class BSHTMLLoader(BaseLoader):
        if bs_kwargs is None:
            bs_kwargs = {"features": "lxml"}
        self.bs_kwargs = bs_kwargs
-        self.get_text_separator = get_text_separator

    def load(self) -> List[Document]:
        from bs4 import BeautifulSoup
@@ -43,7 +41,7 @@ class BSHTMLLoader(BaseLoader):
        with open(self.file_path, "r", encoding=self.open_encoding) as f:
            soup = BeautifulSoup(f, **self.bs_kwargs)

-        text = soup.get_text(self.get_text_separator)
+        text = soup.get_text()

        if soup.title:
            title = str(soup.title.string)
--- a/langchain/tools/init.py
+++ b/langchain/tools/init.py
@@ -11,17 +11,11 @@ from langchain.tools.openapi.utils.openapi_utils import OpenAPISpec
 from langchain.tools.plugin import AIPluginTool

 __all__ = [
-    "AIPluginTool",
-    "APIOperation",
-    "BingSearchResults",
-    "BingSearchRun",
-    "DuckDuckGoSearchResults",
-    "DuckDuckGoSearchRun",
-    "DuckDuckGoSearchRun",
-    "GooglePlacesTool",
-    "GoogleSearchResults",
-    "GoogleSearchRun",
-    "IFTTTWebhook",
-    "OpenAPISpec",
    "BaseTool",
+    "IFTTTWebhook",
+    "AIPluginTool",
+    "OpenAPISpec",
+    "APIOperation",
+    "GooglePlacesTool",
+    "DuckDuckGoSearchTool",
 ]
--- a/langchain/tools/ddg_search/init.py
+++ b/langchain/tools/ddg_search/init.py
@@ -1,5 +1,5 @@
 """DuckDuckGo Search API toolkit."""

-from langchain.tools.ddg_search.tool import DuckDuckGoSearchRun
+from langchain.tools.ddg_search.tool import DuckDuckGoSearchTool

-__all__ = ["DuckDuckGoSearchRun"]
+__all__ = ["DuckDuckGoSearchTool"]
--- a/langchain/tools/ddg_search/tool.py
+++ b/langchain/tools/ddg_search/tool.py
@@ -1,13 +1,10 @@
 """Tool for the DuckDuckGo search API."""

-import warnings
-from typing import Any
-
 from pydantic import Field

 from langchain.tools.base import BaseTool
 from langchain.utilities.duckduckgo_search import DuckDuckGoSearchAPIWrapper
-
+import warnings

 class DuckDuckGoSearchRun(BaseTool):
    """Tool that adds the capability to query the DuckDuckGo search API."""
@@ -32,7 +29,7 @@ class DuckDuckGoSearchRun(BaseTool):


 class DuckDuckGoSearchResults(BaseTool):
-    """Tool that queries the Duck Duck Go Search API and get back json."""
+    """Tool that has capability to query the Duck Duck Go Search API and get back json."""

    name = "DuckDuckGo Results JSON"
    description = (
@@ -53,11 +50,10 @@ class DuckDuckGoSearchResults(BaseTool):
        """Use the tool asynchronously."""
        raise NotImplementedError("DuckDuckGoSearchResults does not support async")

-
-def DuckDuckGoSearchTool(*args: Any, **kwargs: Any) -> DuckDuckGoSearchRun:
+def DuckDuckGoSearchTool(*args, **kwargs):
    warnings.warn(
        "DuckDuckGoSearchTool will be deprecated in the future. "
        "Please use DuckDuckGoSearchRun instead.",
        DeprecationWarning,
    )
-    return DuckDuckGoSearchRun(*args, **kwargs)
+    return DuckDuckGoSearchRun(*args, **kwargs)
--- a/langchain/utilities/bash.py
+++ b/langchain/utilities/bash.py
@@ -1,59 +1,24 @@
 """Wrapper around subprocess to run commands."""
-import re
 import subprocess
 from typing import List, Union
-from uuid import uuid4
-
-import pexpect


 class BashProcess:
    """Executes bash commands and returns the output."""

-    def __init__(
-        self,
-        strip_newlines: bool = False,
-        return_err_output: bool = False,
-        persistent: bool = False,
-    ):
+    def __init__(self, strip_newlines: bool = False, return_err_output: bool = False):
        """Initialize with stripping newlines."""
        self.strip_newlines = strip_newlines
        self.return_err_output = return_err_output
-        self.prompt = ""
-        self.process = None
-        if persistent:
-            self.prompt = str(uuid4())
-            self.process = self._initialize_persistent_process(self.prompt)
-
-    @staticmethod
-    def _initialize_persistent_process(prompt: str) -> pexpect.spawn:
-        # Start bash in a clean environment
-        process = pexpect.spawn(
-            "env", ["-i", "bash", "--norc", "--noprofile"], encoding="utf-8"
-        )
-        # Set the custom prompt
-        process.sendline("PS1=" + prompt)
-
-        process.expect_exact(prompt, timeout=10)
-        return process

    def run(self, commands: Union[str, List[str]]) -> str:
        """Run commands and return final output."""
        if isinstance(commands, str):
            commands = [commands]
        commands = ";".join(commands)
-        if self.process is not None:
-            return self._run_persistent(
-                commands,
-            )
-        else:
-            return self._run(commands)
-
-    def _run(self, command: str) -> str:
-        """Run commands and return final output."""
        try:
            output = subprocess.run(
-                command,
+                commands,
                shell=True,
                check=True,
                stdout=subprocess.PIPE,
@@ -66,31 +31,3 @@ class BashProcess:
        if self.strip_newlines:
            output = output.strip()
        return output
-
-    def process_output(self, output: str, command: str) -> str:
-        # Remove the command from the output using a regular expression
-        pattern = re.escape(command) + r"\s*\n"
-        output = re.sub(pattern, "", output, count=1)
-        return output.strip()
-
-    def _run_persistent(self, command: str) -> str:
-        """Run commands and return final output."""
-        if self.process is None:
-            raise ValueError("Process not initialized")
-        self.process.sendline(command)
-
-        # Clear the output with an empty string
-        self.process.expect(self.prompt, timeout=10)
-        self.process.sendline("")
-
-        try:
-            self.process.expect([self.prompt, pexpect.EOF], timeout=10)
-        except pexpect.TIMEOUT:
-            return f"Timeout error while executing command {command}"
-        if self.process.after == pexpect.EOF:
-            return f"Exited with error status: {self.process.exitstatus}"
-        output = self.process.before
-        output = self.process_output(output, command)
-        if self.strip_newlines:
-            return output.strip()
-        return output
--- a/langchain/utilities/duckduckgo_search.py
+++ b/langchain/utilities/duckduckgo_search.py
@@ -41,7 +41,7 @@ class DuckDuckGoSearchAPIWrapper(BaseModel):
    def run(self, query: str) -> str:
        from duckduckgo_search import ddg

-        """Run query through DuckDuckGo and return concatenated results."""
+        """Run query through DuckDuckGo and return results."""
        results = ddg(
            query,
            region=self.region,
@@ -54,7 +54,7 @@ class DuckDuckGoSearchAPIWrapper(BaseModel):
        snippets = [result["body"] for result in results]
        return " ".join(snippets)

-    def results(self, query: str, num_results: int) -> List[Dict[str, str]]:
+    def results(self, query: str, num_results: int) -> List[Dict]:
        """Run query through DuckDuckGo and return metadata.

        Args:
@@ -80,7 +80,7 @@ class DuckDuckGoSearchAPIWrapper(BaseModel):
        if results is None or len(results) == 0:
            return [{"Result": "No good DuckDuckGo Search Result was found"}]

-        def to_metadata(result: Dict) -> Dict[str, str]:
+        def to_metadata(result: Dict) -> Dict:
            return {
                "snippet": result["body"],
                "title": result["title"],
--- a/langchain/utilities/serpapi.py
+++ b/langchain/utilities/serpapi.py
@@ -77,23 +77,7 @@ class SerpAPIWrapper(BaseModel):
        return values

    async def arun(self, query: str) -> str:
-        """Run query through SerpAPI and parse result async."""
-        return self._process_response(await self.aresults(query))
-
-    def run(self, query: str) -> str:
-        """Run query through SerpAPI and parse result."""
-        return self._process_response(self.results(query))
-
-    def results(self, query: str) -> dict:
-        """Run query through SerpAPI and return the raw result."""
-        params = self.get_params(query)
-        with HiddenPrints():
-            search = self.search_engine(params)
-            res = search.get_dict()
-        return res
-
-    async def aresults(self, query: str) -> dict:
-        """Use aiohttp to run query through SerpAPI and return the results async."""
+        """Use aiohttp to run query through SerpAPI and parse result."""

        def construct_url_and_params() -> Tuple[str, Dict[str, str]]:
            params = self.get_params(query)
@@ -113,6 +97,18 @@ class SerpAPIWrapper(BaseModel):
            async with self.aiosession.get(url, params=params) as response:
                res = await response.json()

+        return self._process_response(res)
+
+    def run(self, query: str) -> str:
+        """Run query through SerpAPI and parse result."""
+        return self._process_response(self.results(query))
+
+    def results(self, query: str) -> dict:
+        """Run query through SerpAPI and return the raw result."""
+        params = self.get_params(query)
+        with HiddenPrints():
+            search = self.search_engine(params)
+            res = search.get_dict()
        return res

    def get_params(self, query: str) -> Dict[str, str]:
--- a/tests/integration_tests/document_loaders/test_bshtml.py
+++ b/tests/integration_tests/document_loaders/test_bshtml.py
@@ -9,17 +9,15 @@ from langchain.document_loaders.html_bs import BSHTMLLoader
 def test_bs_html_loader() -> None:
    """Test unstructured loader."""
    file_path = Path(__file__).parent.parent / "examples/example.html"
-    loader = BSHTMLLoader(str(file_path), get_text_separator="|")
+    loader = BSHTMLLoader(str(file_path))
    docs = loader.load()

    assert len(docs) == 1

    metadata = docs[0].metadata
-    content = docs[0].page_content

    assert metadata["title"] == "Chew dad's slippers"
    assert metadata["source"] == str(file_path)
-    assert content[:2] == "\n|"


@pytest.mark.skipif(
--- a/tests/regression_tests/test_chat_agents.py
+++ b/tests/regression_tests/test_chat_agents.py
@@ -1,50 +0,0 @@
-"""Test chat agents in various scenarios."""
-
-from typing import Set
-
-import pytest
-
-from langchain.agents.agent_types import AgentType
-from langchain.agents.initialize import initialize_agent
-from langchain.agents.tools import Tool
-from langchain.chains.llm_math.base import LLMMathChain
-from langchain.chat_models.openai import ChatOpenAI
-from langchain.tools.ddg_search.tool import DuckDuckGoSearchRun
-from langchain.tools.plugin import AIPluginTool
-
-TEST_CASES = [
-    (
-        "What's the current time in NYC?",
-        {"DuckDuckGo Search"},
-    ),
-    ("What is a shoe that's available on Klarna?", {"KlarnaProducts"}),
-    ("What's 3*4.2*1.7", {"Calculator"}),
-]
-
-
-@pytest.mark.parametrize("query, used_tools", TEST_CASES)
-def test_chat_agent(query: str, used_tools: Set[str]) -> None:
-    """Test chat agent."""
-    llm = ChatOpenAI(temperature=0)
-    llm_math_chain = LLMMathChain(llm=llm)
-    tools = [
-        DuckDuckGoSearchRun(),
-        AIPluginTool.from_plugin_url(
-            "https://www.klarna.com/.well-known/ai-plugin.json"
-        ),
-        Tool(
-            name="Calculator",
-            func=llm_math_chain.run,
-            description="useful for doing calculations",
-        ),
-    ]
-    agent_executor = initialize_agent(
-        tools,
-        llm,
-        AgentType.CHAT_ZERO_SHOT_REACT_DESCRIPTION,
-        return_intermediate_steps=True,
-    )
-    result = agent_executor({"input": query})
-    intermediate_steps = result["intermediate_steps"]
-    tool_sequences = [act.tool for act, _ in intermediate_steps]
-    assert set(tool_sequences) == used_tools
--- a/tests/unit_tests/chains/test_llm_bash.py
+++ b/tests/unit_tests/chains/test_llm_bash.py
@@ -3,107 +3,26 @@ import sys

 import pytest

-from langchain.chains.llm_bash.base import BashOutputParser, LLMBashChain
+from langchain.chains.llm_bash.base import LLMBashChain
 from langchain.chains.llm_bash.prompt import _PROMPT_TEMPLATE
-from langchain.schema import OutputParserException
 from tests.unit_tests.llms.fake_llm import FakeLLM

-_SAMPLE_CODE = """
-Unrelated text
-```bash
-echo hello
-```
-Unrelated text
-"""
-
-
-_SAMPLE_CODE_2_LINES = """
-Unrelated text
-```bash
-echo hello
-
-echo world
-```
-Unrelated text
-"""
-

@pytest.fixture
-def output_parser() -> BashOutputParser:
-    """Output parser for testing."""
-    return BashOutputParser()
+def fake_llm_bash_chain() -> LLMBashChain:
+    """Fake LLM Bash chain for testing."""
+    question = "Please write a bash script that prints 'Hello World' to the console."
+    prompt = _PROMPT_TEMPLATE.format(question=question)
+    queries = {prompt: "```bash\nexpr 1 + 1\n```"}
+    fake_llm = FakeLLM(queries=queries)
+    return LLMBashChain(llm=fake_llm, input_key="q", output_key="a")


@pytest.mark.skipif(
    sys.platform.startswith("win"), reason="Test not supported on Windows"
 )
-def test_simple_question() -> None:
+def test_simple_question(fake_llm_bash_chain: LLMBashChain) -> None:
    """Test simple question that should not need python."""
    question = "Please write a bash script that prints 'Hello World' to the console."
-    prompt = _PROMPT_TEMPLATE.format(question=question)
-    queries = {prompt: "```bash\nexpr 1 + 1\n```"}
-    fake_llm = FakeLLM(queries=queries)
-    fake_llm_bash_chain = LLMBashChain(llm=fake_llm, input_key="q", output_key="a")
    output = fake_llm_bash_chain.run(question)
    assert output == "2\n"
-
-
-def test_get_code(output_parser: BashOutputParser) -> None:
-    """Test the parser."""
-    code_lines = output_parser.parse(_SAMPLE_CODE)
-    code = [c for c in code_lines if c.strip()]
-    assert code == code_lines
-    assert code == ["echo hello"]
-
-    code_lines = output_parser.parse(_SAMPLE_CODE + _SAMPLE_CODE_2_LINES)
-    assert code_lines == ["echo hello", "echo hello", "echo world"]
-
-
-def test_parsing_error() -> None:
-    """Test that LLM Output without a bash block raises an exce"""
-    question = "Please echo 'hello world' to the terminal."
-    prompt = _PROMPT_TEMPLATE.format(question=question)
-    queries = {
-        prompt: """
-```text
-echo 'hello world'
-```
-"""
-    }
-    fake_llm = FakeLLM(queries=queries)
-    fake_llm_bash_chain = LLMBashChain(llm=fake_llm, input_key="q", output_key="a")
-    with pytest.raises(OutputParserException):
-        fake_llm_bash_chain.run(question)
-
-
-def test_get_code_lines_mixed_blocks(output_parser: BashOutputParser) -> None:
-    text = """
-Unrelated text
-```bash
-echo hello
-ls && pwd && ls
-```
-
-```python
-print("hello")
-```
-
-```bash
-echo goodbye
-```
-"""
-    code_lines = output_parser.parse(text)
-    assert code_lines == ["echo hello", "ls && pwd && ls", "echo goodbye"]
-
-
-def test_get_code_lines_simple_nested_ticks(output_parser: BashOutputParser) -> None:
-    """Test that backticks w/o a newline are ignored."""
-    text = """
-Unrelated text
-```bash
-echo hello
-echo "```bash is in this string```"
-```
-"""
-    code_lines = output_parser.parse(text)
-    assert code_lines == ["echo hello", 'echo "```bash is in this string```"']
--- a/tests/unit_tests/test_bash.py
+++ b/tests/unit_tests/test_bash.py
@@ -21,23 +21,6 @@ def test_pwd_command() -> None:
    assert output == subprocess.check_output("pwd", shell=True).decode()


-@pytest.mark.skipif(
-    sys.platform.startswith("win"), reason="Test not supported on Windows"
-)
-def test_pwd_command_persistent() -> None:
-    """Test correct functionality when the bash process is persistent."""
-    session = BashProcess(persistent=True, strip_newlines=True)
-    commands = ["pwd"]
-    output = session.run(commands)
-
-    assert subprocess.check_output("pwd", shell=True).decode().strip() in output
-
-    session.run(["cd .."])
-    new_output = session.run(["pwd"])
-    # Assert that the new_output is a parent of the old output
-    assert Path(output).parent == Path(new_output)
-
-
@pytest.mark.skipif(
    sys.platform.startswith("win"), reason="Test not supported on Windows"
 )
@@ -83,16 +66,3 @@ def test_create_directory_and_files(tmp_path: Path) -> None:
    # check that the files were created in the temporary directory
    output = session.run([f"ls {temp_dir}"])
    assert output == "file1.txt\nfile2.txt"
-
-
-@pytest.mark.skipif(
-    sys.platform.startswith("win"), reason="Test not supported on Windows"
-)
-def test_create_bash_persistent() -> None:
-    """Test the pexpect persistent bash terminal"""
-    session = BashProcess(persistent=True)
-    response = session.run("echo hello")
-    response += session.run("echo world")
-
-    assert "hello" in response
-    assert "world" in response