templates: Add Ollama multi-modal templates (#14868)

Templates for [local multi-modal LLMs](https://llava-vl.github.io/llava-interactive/) using - * Image summaries * Multi-modal embeddings --------- Co-authored-by: Erick Friis <erick@langchain.dev>
2025-09-04 20:46:45 +00:00 · 2023-12-20 15:28:53 -08:00
parent 57d1eb733f
commit 320c3ae4c8
31 changed files with 7478 additions and 56 deletions
--- a/templates/rag-multi-modal-local/ingest.py
+++ b/templates/rag-multi-modal-local/ingest.py
@@ -0,0 +1,35 @@
+import os
+from pathlib import Path
+
+from langchain.vectorstores import Chroma
+from langchain_experimental.open_clip import OpenCLIPEmbeddings
+
+# Load images
+img_dump_path = Path(__file__).parent / "docs/"
+rel_img_dump_path = img_dump_path.relative_to(Path.cwd())
+image_uris = sorted(
+    [
+        os.path.join(rel_img_dump_path, image_name)
+        for image_name in os.listdir(rel_img_dump_path)
+        if image_name.endswith(".jpg")
+    ]
+)
+
+# Index
+vectorstore = Path(__file__).parent / "chroma_db_multi_modal"
+re_vectorstore_path = vectorstore.relative_to(Path.cwd())
+
+# Load embedding function
+print("Loading embedding function")
+embedding = OpenCLIPEmbeddings(model_name="ViT-H-14", checkpoint="laion2b_s32b_b79k")
+
+# Create chroma
+vectorstore_mmembd = Chroma(
+    collection_name="multi-modal-rag",
+    persist_directory=str(Path(__file__).parent / "chroma_db_multi_modal"),
+    embedding_function=embedding,
+)
+
+# Add images
+print("Embedding images")
+vectorstore_mmembd.add_images(uris=image_uris)