ml/backend/ggml: use default CUDA compression mode (#10314)

2025-05-10 18:06:33 +02:00 · 2025-04-16 22:54:20 -04:00 · 2025-04-16 22:54:20 -04:00 · 09bb2e30f6
commit 09bb2e30f6
parent dc264be6ff
1 changed files with 1 additions and 1 deletions
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@ -24,7 +24,7 @@ set(GGML_LLAMAFILE ON)
 set(GGML_CUDA_PEER_MAX_BATCH_SIZE 128)
 set(GGML_CUDA_GRAPHS ON)
 set(GGML_CUDA_FA ON)
-set(GGML_CUDA_COMPRESSION_MODE none)
+set(GGML_CUDA_COMPRESSION_MODE default)
 if((CMAKE_OSX_ARCHITECTURES AND NOT CMAKE_OSX_ARCHITECTURES MATCHES "arm64")
    OR (NOT CMAKE_OSX_ARCHITECTURES AND NOT CMAKE_SYSTEM_PROCESSOR MATCHES "arm|aarch64|ARM64|ARMv[0-9]+"))