llmodel: dlopen llama.cpp libraries lazily instead of eagerly

Signed-off-by: Jared Van Bortel <jared@nomic.ai>
2025-09-23 04:21:45 +00:00 · 2024-12-16 15:44:22 -05:00
parent 21c06fdebf
commit 7a1559e3df
5 changed files with 83 additions and 96 deletions
--- a/gpt4all-chat/src/chatllm.cpp
+++ b/gpt4all-chat/src/chatllm.cpp
@@ -528,7 +528,7 @@ bool ChatLLM::loadNewModel(const ModelInfo &modelInfo, QVariantMap &modelLoadPro
    bool actualDeviceIsCPU = true;

 #if defined(Q_OS_MAC) && defined(__aarch64__)
-    if (m_llModelInfo.model->implementation().buildVariant() == "metal")
+    if (m_llModelInfo.model->implementation().buildBackend() == "metal")
        actualDeviceIsCPU = false;
 #else
    if (requestedDevice != "CPU") {
--- a/gpt4all-chat/src/embllm.cpp
+++ b/gpt4all-chat/src/embllm.cpp
@@ -108,7 +108,7 @@ bool EmbeddingLLMWorker::loadModel()
    bool actualDeviceIsCPU = true;

 #if defined(Q_OS_MAC) && defined(__aarch64__)
-    if (m_model->implementation().buildVariant() == "metal")
+    if (m_model->implementation().buildBackend() == "metal")
        actualDeviceIsCPU = false;
 #else
    if (requestedDevice != "CPU") {