community[patch]: Correct the calling to collection_name in qdrant (#16920)

## Description In #16608, the calling `collection_name` was wrong. I made a fix for it. Sorry for the inconvenience! ## Issue https://github.com/langchain-ai/langchain/issues/16962 ## Dependencies N/A  --------- Co-authored-by: Kumar Shivendu <kshivendu1@gmail.com> Co-authored-by: Harrison Chase <hw.chase.17@gmail.com>
2025-07-05 20:58:25 +00:00 · 2024-02-05 03:45:35 +09:00 · 2024-02-05 03:45:35 +09:00 · bcfce146d8
commit bcfce146d8
parent 849051102a
10 changed files with 123 additions and 52 deletions
--- a/libs/community/langchain_community/retrievers/qdrant_sparse_vector_retriever.py
+++ b/libs/community/langchain_community/retrievers/qdrant_sparse_vector_retriever.py
@ -120,7 +120,10 @@ class QdrantSparseVectorRetriever(BaseRetriever):
        )
        return [
            Qdrant._document_from_scored_point(
-                point, self.content_payload_key, self.metadata_payload_key
+                point,
                self.collection_name,
                self.content_payload_key,
                self.metadata_payload_key,
            )
            for point in results
        ]
--- a/libs/community/langchain_community/vectorstores/qdrant.py
+++ b/libs/community/langchain_community/vectorstores/qdrant.py
@ -620,7 +620,10 @@ class Qdrant(VectorStore):
        return [
            (
                self._document_from_scored_point(
-                    result, self.content_payload_key, self.metadata_payload_key
+                    result,
                    self.collection_name,
                    self.content_payload_key,
                    self.metadata_payload_key,
                ),
                result.score,
            )
@ -713,7 +716,10 @@ class Qdrant(VectorStore):
        return [
            (
                self._document_from_scored_point(
-                    result, self.content_payload_key, self.metadata_payload_key
+                    result,
                    self.collection_name,
                    self.content_payload_key,
                    self.metadata_payload_key,
                ),
                result.score,
            )
@ -1051,7 +1057,10 @@ class Qdrant(VectorStore):
        return [
            (
                self._document_from_scored_point(
-                    results[i], self.content_payload_key, self.metadata_payload_key
+                    results[i],
                    self.collection_name,
                    self.content_payload_key,
                    self.metadata_payload_key,
                ),
                results[i].score,
            )
@ -1123,7 +1132,10 @@ class Qdrant(VectorStore):
        return [
            (
                self._document_from_scored_point(
-                    results[i], self.content_payload_key, self.metadata_payload_key
+                    results[i],
                    self.collection_name,
                    self.content_payload_key,
                    self.metadata_payload_key,
                ),
                results[i].score,
            )
@ -1938,12 +1950,13 @@ class Qdrant(VectorStore):
    def _document_from_scored_point(
        cls,
        scored_point: Any,
        collection_name: str,
        content_payload_key: str,
        metadata_payload_key: str,
    ) -> Document:
        metadata = scored_point.payload.get(metadata_payload_key) or {}
        metadata["_id"] = scored_point.id
-        metadata["_collection_name"] = scored_point.collection_name
+        metadata["_collection_name"] = collection_name
        return Document(
            page_content=scored_point.payload.get(content_payload_key),
            metadata=metadata,
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/async_api/test_from_texts.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/async_api/test_from_texts.py
@ -12,7 +12,10 @@ from tests.integration_tests.vectorstores.fake_embeddings import (
 from tests.integration_tests.vectorstores.qdrant.async_api.fixtures import (
    qdrant_locations,
 )
-from tests.integration_tests.vectorstores.qdrant.common import qdrant_is_not_running
+from tests.integration_tests.vectorstores.qdrant.common import (
    assert_documents_equals,
    qdrant_is_not_running,
 )
@pytest.mark.parametrize("qdrant_location", qdrant_locations())
@ -245,4 +248,6 @@ async def test_qdrant_from_texts_stores_metadatas(
        location=qdrant_location,
    )
    output = await docsearch.asimilarity_search("foo", k=1)
-    assert output == [Document(page_content="foo", metadata={"page": 0})]
+    assert_documents_equals(
        output, [Document(page_content="foo", metadata={"page": 0})]
    )
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/async_api/test_max_marginal_relevance.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/async_api/test_max_marginal_relevance.py
@ -10,6 +10,7 @@ from tests.integration_tests.vectorstores.fake_embeddings import (
 from tests.integration_tests.vectorstores.qdrant.async_api.fixtures import (
    qdrant_locations,
 )
 from tests.integration_tests.vectorstores.qdrant.common import assert_documents_equals
@pytest.mark.parametrize("batch_size", [1, 64])
@ -41,7 +42,10 @@ async def test_qdrant_max_marginal_relevance_search(
    output = await docsearch.amax_marginal_relevance_search(
        "foo", k=2, fetch_k=3, lambda_mult=0.0
    )
-    assert output == [
+    assert_documents_equals(
        output,
        [
            Document(page_content="foo", metadata={"page": 0}),
            Document(page_content="baz", metadata={"page": 2}),
-    ]
+        ],
    )
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/async_api/test_similarity_search.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/async_api/test_similarity_search.py
@ -11,6 +11,7 @@ from tests.integration_tests.vectorstores.fake_embeddings import (
 from tests.integration_tests.vectorstores.qdrant.async_api.fixtures import (
    qdrant_locations,
 )
 from tests.integration_tests.vectorstores.qdrant.common import assert_documents_equals
@pytest.mark.parametrize("batch_size", [1, 64])
@ -37,7 +38,7 @@ async def test_qdrant_similarity_search(
        location=qdrant_location,
    )
    output = await docsearch.asimilarity_search("foo", k=1)
-    assert output == [Document(page_content="foo")]
+    assert_documents_equals(output, [Document(page_content="foo")])
@pytest.mark.parametrize("batch_size", [1, 64])
@ -65,7 +66,7 @@ async def test_qdrant_similarity_search_by_vector(
    )
    embeddings = ConsistentFakeEmbeddings().embed_query("foo")
    output = await docsearch.asimilarity_search_by_vector(embeddings, k=1)
-    assert output == [Document(page_content="foo")]
+    assert_documents_equals(output, [Document(page_content="foo")])
@pytest.mark.parametrize("batch_size", [1, 64])
@ -95,7 +96,7 @@ async def test_qdrant_similarity_search_with_score_by_vector(
    output = await docsearch.asimilarity_search_with_score_by_vector(embeddings, k=1)
    assert len(output) == 1
    document, score = output[0]
-    assert document == Document(page_content="foo")
+    assert_documents_equals([document], [Document(page_content="foo")])
    assert score >= 0
@ -123,12 +124,15 @@ async def test_qdrant_similarity_search_filters(
    output = await docsearch.asimilarity_search(
        "foo", k=1, filter={"page": 1, "metadata": {"page": 2, "pages": [3]}}
    )
-    assert output == [
+    assert_documents_equals(
        output,
        [
            Document(
                page_content="bar",
                metadata={"page": 1, "metadata": {"page": 2, "pages": [3, -1]}},
            )
-    ]
+        ],
    )
@pytest.mark.parametrize("vector_name", [None, "my-vector"])
@ -262,12 +266,15 @@ async def test_qdrant_similarity_search_filters_with_qdrant_filters(
        ]
    )
    output = await docsearch.asimilarity_search("foo", k=1, filter=qdrant_filter)
-    assert output == [
+    assert_documents_equals(
        output,
        [
            Document(
                page_content="bar",
                metadata={"page": 1, "details": {"page": 2, "pages": [3, -1]}},
            )
-    ]
+        ],
    )
@pytest.mark.parametrize("batch_size", [1, 64])
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/common.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/common.py
@ -1,3 +1,8 @@
 from typing import List
 from langchain_core.documents import Document
 def qdrant_is_not_running() -> bool:
    """Check if Qdrant is not running."""
    import requests
@ -8,3 +13,18 @@ def qdrant_is_not_running() -> bool:
        return response_json.get("title") != "qdrant - vector search engine"
    except (requests.exceptions.ConnectionError, requests.exceptions.Timeout):
        return True
 def assert_documents_equals(actual: List[Document], expected: List[Document]):
    assert len(actual) == len(expected)
    for actual_doc, expected_doc in zip(actual, expected):
        assert actual_doc.page_content == expected_doc.page_content
        assert "_id" in actual_doc.metadata
        assert "_collection_name" in actual_doc.metadata
        actual_doc.metadata.pop("_id")
        actual_doc.metadata.pop("_collection_name")
        assert actual_doc.metadata == expected_doc.metadata
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/test_add_texts.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/test_add_texts.py
@ -8,6 +8,7 @@ from langchain_community.vectorstores import Qdrant
 from tests.integration_tests.vectorstores.fake_embeddings import (
    ConsistentFakeEmbeddings,
 )
 from tests.integration_tests.vectorstores.qdrant.common import assert_documents_equals
@pytest.mark.parametrize("batch_size", [1, 64])
@ -33,7 +34,7 @@ def test_qdrant_add_documents_extends_existing_collection(
    # ConsistentFakeEmbeddings return the same query embedding as the first document
    # embedding computed in `embedding.embed_documents`. Thus, "foo" embedding is the
    # same as "foobar" embedding
-    assert output == [Document(page_content="foobar")]
+    assert_documents_equals(output, [Document(page_content="foobar")])
@pytest.mark.parametrize("batch_size", [1, 64])
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/test_from_texts.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/test_from_texts.py
@ -10,7 +10,10 @@ from langchain_community.vectorstores.qdrant import QdrantException
 from tests.integration_tests.vectorstores.fake_embeddings import (
    ConsistentFakeEmbeddings,
 )
-from tests.integration_tests.vectorstores.qdrant.common import qdrant_is_not_running
+from tests.integration_tests.vectorstores.qdrant.common import (
    assert_documents_equals,
    qdrant_is_not_running,
 )
 def test_qdrant_from_texts_stores_duplicated_texts() -> None:
@ -257,7 +260,9 @@ def test_qdrant_from_texts_stores_metadatas(
        batch_size=batch_size,
    )
    output = docsearch.similarity_search("foo", k=1)
-    assert output == [Document(page_content="foo", metadata={"page": 0})]
+    assert_documents_equals(
        output, [Document(page_content="foo", metadata={"page": 0})]
    )
@pytest.mark.skipif(qdrant_is_not_running(), reason="Qdrant is not running")
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/test_max_marginal_relevance.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/test_max_marginal_relevance.py
@ -7,6 +7,7 @@ from langchain_community.vectorstores import Qdrant
 from tests.integration_tests.vectorstores.fake_embeddings import (
    ConsistentFakeEmbeddings,
 )
 from tests.integration_tests.vectorstores.qdrant.common import assert_documents_equals
@pytest.mark.parametrize("batch_size", [1, 64])
@ -49,14 +50,18 @@ def test_qdrant_max_marginal_relevance_search(
    output = docsearch.max_marginal_relevance_search(
        "foo", k=2, fetch_k=3, lambda_mult=0.0
    )
-    assert output == [
+    assert_documents_equals(
        output,
        [
            Document(page_content="foo", metadata={"page": 0}),
            Document(page_content="baz", metadata={"page": 2}),
-    ]
+        ],
    )
    output = docsearch.max_marginal_relevance_search(
        "foo", k=2, fetch_k=3, lambda_mult=0.0, filter=filter
    )
-    assert output == [
+    assert_documents_equals(
-        Document(page_content="baz", metadata={"page": 2}),
+        output,
-    ]
+        [Document(page_content="baz", metadata={"page": 2})],
    )
--- a/libs/community/tests/integration_tests/vectorstores/qdrant/test_similarity_search.py
+++ b/libs/community/tests/integration_tests/vectorstores/qdrant/test_similarity_search.py
@ -8,6 +8,7 @@ from langchain_community.vectorstores import Qdrant
 from tests.integration_tests.vectorstores.fake_embeddings import (
    ConsistentFakeEmbeddings,
 )
 from tests.integration_tests.vectorstores.qdrant.common import assert_documents_equals
@pytest.mark.parametrize("batch_size", [1, 64])
@ -32,7 +33,7 @@ def test_qdrant_similarity_search(
        vector_name=vector_name,
    )
    output = docsearch.similarity_search("foo", k=1)
-    assert output == [Document(page_content="foo")]
+    assert_documents_equals(actual=output, expected=[Document(page_content="foo")])
@pytest.mark.parametrize("batch_size", [1, 64])
@ -58,7 +59,7 @@ def test_qdrant_similarity_search_by_vector(
    )
    embeddings = ConsistentFakeEmbeddings().embed_query("foo")
    output = docsearch.similarity_search_by_vector(embeddings, k=1)
-    assert output == [Document(page_content="foo")]
+    assert_documents_equals(output, [Document(page_content="foo")])
@pytest.mark.parametrize("batch_size", [1, 64])
@ -86,7 +87,7 @@ def test_qdrant_similarity_search_with_score_by_vector(
    output = docsearch.similarity_search_with_score_by_vector(embeddings, k=1)
    assert len(output) == 1
    document, score = output[0]
-    assert document == Document(page_content="foo")
+    assert_documents_equals(actual=[document], expected=[Document(page_content="foo")])
    assert score >= 0
@ -113,12 +114,16 @@ def test_qdrant_similarity_search_filters(
    output = docsearch.similarity_search(
        "foo", k=1, filter={"page": 1, "metadata": {"page": 2, "pages": [3]}}
    )
-    assert output == [
+
    assert_documents_equals(
        actual=output,
        expected=[
            Document(
                page_content="bar",
                metadata={"page": 1, "metadata": {"page": 2, "pages": [3, -1]}},
            )
-    ]
+        ],
    )
@pytest.mark.parametrize("vector_name", [None, "my-vector"])
@ -240,12 +245,15 @@ def test_qdrant_similarity_search_filters_with_qdrant_filters(
        ]
    )
    output = docsearch.similarity_search("foo", k=1, filter=qdrant_filter)
-    assert output == [
+    assert_documents_equals(
        actual=output,
        expected=[
            Document(
                page_content="bar",
                metadata={"page": 1, "details": {"page": 2, "pages": [3, -1]}},
            )
-    ]
+        ],
    )
@pytest.mark.parametrize("batch_size", [1, 64])