Introduce GPU Overhead env var (#5922)

Provide a mechanism for users to set aside an amount of VRAM on each GPU to make room for other applications they want to start after Ollama, or workaround memory prediction bugs
2025-05-11 18:36:41 +02:00 · 2024-09-05 13:46:35 -07:00 · 2024-09-05 13:46:35 -07:00 · b05c9e83d9
commit b05c9e83d9
parent a60d9b89ce
3 changed files with 28 additions and 3 deletions
--- a/cmd/cmd.go
+++ b/cmd/cmd.go
@ -1421,6 +1421,7 @@ func NewCLI() *cobra.Command {
 				envVars["OLLAMA_TMPDIR"],
 				envVars["OLLAMA_FLASH_ATTENTION"],
 				envVars["OLLAMA_LLM_LIBRARY"],
+				envVars["OLLAMA_GPU_OVERHEAD"],
 			})
 		default:
 			appendEnvDocs(cmd, envs)