Add q8_0 kernels to kompute shaders and bump to latest llama/gguf.

2025-09-07 03:20:26 +00:00 · 2023-10-05 10:52:58 -04:00
parent 1534df3e9f
commit f605a5b686
2 changed files with 3 additions and 1 deletions
--- a/gpt4all-backend/llama.cpp-mainline
+++ b/gpt4all-backend/llama.cpp-mainline
--- a/gpt4all-backend/llama.cpp.cmake
+++ b/gpt4all-backend/llama.cpp.cmake
@@ -239,6 +239,7 @@ if (LLAMA_KOMPUTE)
          kompute/op_rmsnorm.comp
          kompute/op_diagmask.comp
          kompute/op_mul_mat_f16.comp
+          kompute/op_mul_mat_q8_0.comp
          kompute/op_mul_mat_q4_0.comp
          kompute/op_mul_mat_q4_1.comp
          kompute/op_mul_mat_q6_k.comp
@@ -268,6 +269,7 @@ if (LLAMA_KOMPUTE)
          shaderop_rmsnorm.h
          shaderop_diagmask.h
          shaderop_mul_mat_f16.h
+          shaderop_mul_mat_q8_0.h
          shaderop_mul_mat_q4_0.h
          shaderop_mul_mat_q4_1.h
          shaderop_mul_mat_q6_k.h