fix: warn when engine_args in OpenAIServerConfig are ignored

JRMeyer · JRMeyer · commit 2c6e4bfe9402 · 2025-11-29T02:48:58.000+01:00
Add a runtime warning when users pass engine-initialization-only
arguments (max_logprobs, gpu_memory_utilization, tensor_parallel_size,
max_model_len) via OpenAIServerConfig.engine_args.

These arguments are silently ignored because the vLLM engine is
initialized by Unsloth before OpenAIServerConfig is applied.
The warning guides users to use TrainableModel._internal_config
instead.
diff --git a/src/art/dev/openai_server.py b/src/art/dev/openai_server.py
@@ -1,9 +1,17 @@
+import warnings
 from typing import Literal
 
 from typing_extensions import TypedDict
 
 from .engine import EngineArgs
 
+ENGINE_INIT_ONLY_ARGS = {
+    "max_logprobs",
+    "gpu_memory_utilization",
+    "tensor_parallel_size",
+    "max_model_len",
+}
+
 
 def get_openai_server_config(
     model_name: str,
@@ -35,6 +43,16 @@ def get_openai_server_config(
         generation_config="vllm",
     )
     engine_args.update(config.get("engine_args", {}))
+    user_engine_args = config.get("engine_args", {})
+    ignored_args = set(user_engine_args.keys()) & ENGINE_INIT_ONLY_ARGS
+    if ignored_args:
+        warnings.warn(
+            f"OpenAIServerConfig.engine_args contains {ignored_args} which will be "
+            f"ignored. The vLLM engine is initialized by Unsloth before this config "
+            f"is applied. Use TrainableModel._internal_config.engine_args instead.",
+            UserWarning,
+            stacklevel=2,
+        )
     return OpenAIServerConfig(
         log_file=log_file, server_args=server_args, engine_args=engine_args
     )