llama.cpp: gemma: allow offloading the output tensor (#1997)

Signed-off-by: Jared Van Bortel <jared@nomic.ai>
2025-09-24 13:04:00 +00:00 · 2024-02-22 14:06:18 -05:00
parent c1dcb3f5b8
commit fc6c5ea0c7
1 changed files with 1 additions and 1 deletions
--- a/gpt4all-backend/llama.cpp-mainline
+++ b/gpt4all-backend/llama.cpp-mainline