diff --git a/libs/langchain/langchain/embeddings/azure_openai.py b/libs/langchain/langchain/embeddings/azure_openai.py
index 35c7447dad0..9729c2bace4 100644
--- a/libs/langchain/langchain/embeddings/azure_openai.py
+++ b/libs/langchain/langchain/embeddings/azure_openai.py
@@ -83,6 +83,10 @@ class AzureOpenAIEmbeddings(OpenAIEmbeddings):
         values["azure_ad_token"] = values["azure_ad_token"] or os.getenv(
             "AZURE_OPENAI_AD_TOKEN"
         )
+        # Azure OpenAI embedding models allow a maximum of 16 texts
+        # at a time in each batch
+        # See: https://learn.microsoft.com/en-us/azure/ai-services/openai/reference#embeddings
+        values["chunk_size"] = min(values["chunk_size"], 16)
         try:
             import openai
 
diff --git a/libs/langchain/langchain/embeddings/openai.py b/libs/langchain/langchain/embeddings/openai.py
index a159a75be72..7cb69921868 100644
--- a/libs/langchain/langchain/embeddings/openai.py
+++ b/libs/langchain/langchain/embeddings/openai.py
@@ -291,7 +291,7 @@ class OpenAIEmbeddings(BaseModel, Embeddings):
             # Azure OpenAI embedding models allow a maximum of 16 texts
             # at a time in each batch
             # See: https://learn.microsoft.com/en-us/azure/ai-services/openai/reference#embeddings
-            values["chunk_size"] = max(values["chunk_size"], 16)
+            values["chunk_size"] = min(values["chunk_size"], 16)
         else:
             default_api_version = ""
         values["openai_api_version"] = get_from_dict_or_env(
diff --git a/libs/langchain/tests/integration_tests/embeddings/test_azure_openai.py b/libs/langchain/tests/integration_tests/embeddings/test_azure_openai.py
index dc15a9763e2..2987ecba03b 100644
--- a/libs/langchain/tests/integration_tests/embeddings/test_azure_openai.py
+++ b/libs/langchain/tests/integration_tests/embeddings/test_azure_openai.py
@@ -30,12 +30,25 @@ def test_azure_openai_embedding_documents_multiple() -> None:
     embedding = _get_embeddings(chunk_size=2)
     embedding.embedding_ctx_length = 8191
     output = embedding.embed_documents(documents)
+    assert embedding.chunk_size == 2
     assert len(output) == 3
     assert len(output[0]) == 1536
     assert len(output[1]) == 1536
     assert len(output[2]) == 1536
 
 
+def test_azure_openai_embedding_documents_chunk_size() -> None:
+    """Test openai embeddings."""
+    documents = ["foo bar"] * 20
+    embedding = _get_embeddings()
+    embedding.embedding_ctx_length = 8191
+    output = embedding.embed_documents(documents)
+    # Max 16 chunks per batch on Azure OpenAI embeddings
+    assert embedding.chunk_size == 16
+    assert len(output) == 20
+    assert all([len(out) == 1536 for out in output])
+
+
 @pytest.mark.asyncio
 async def test_azure_openai_embedding_documents_async_multiple() -> None:
     """Test openai embeddings."""