langchain/libs/community/tests/integration_tests/retrievers/test_merger_retriever.py

from langchain.retrievers.merger_retriever import MergerRetriever
from langchain_core.vectorstores import InMemoryVectorStore

from langchain_community.embeddings import OpenAIEmbeddings


def test_merger_retriever_get_relevant_docs() -> None:
    """Test get_relevant_docs."""
    texts_group_a = [
        "This is a document about the Boston Celtics",
        "Fly me to the moon is one of my favourite songs."
        "I simply love going to the movies",
    ]
    texts_group_b = [
        "This is a document about the Poenix Suns",
        "The Boston Celtics won the game by 20 points",
        "Real stupidity beats artificial intelligence every time. TP",
    ]
    embeddings = OpenAIEmbeddings()
    retriever_a = InMemoryVectorStore.from_texts(
        texts_group_a, embedding=embeddings
    ).as_retriever(search_kwargs={"k": 1})
    retriever_b = InMemoryVectorStore.from_texts(
        texts_group_b, embedding=embeddings
    ).as_retriever(search_kwargs={"k": 1})

    # The Lord of the Retrievers.
    lotr = MergerRetriever(retrievers=[retriever_a, retriever_b])

    actual = lotr.invoke("Tell me about the Celtics")
    assert len(actual) == 2
    assert texts_group_a[0] in [d.page_content for d in actual]
    assert texts_group_b[1] in [d.page_content for d in actual]