apache · tvalentyn · Jun 11, 2025 · Jun 11, 2025 · claudevdm · Jun 11, 2025
diff --git a/sdks/python/apache_beam/ml/inference/vllm_inference.py b/sdks/python/apache_beam/ml/inference/vllm_inference.py
@@ -114,28 +114,30 @@ def __init__(self, model_name: str, vllm_server_kwargs: dict[str, str]):
     self._server_started = False
     self._server_process = None
     self._server_port: int = -1
+    self._server_process_lock = threading.RLock()
 model.check_connectivity() 
 model.check_connectivity() 
 
     self.start_server()
 
   def start_server(self, retries=3):
-    if not self._server_started:
-      server_cmd = [
-          sys.executable,
-          '-m',
-          'vllm.entrypoints.openai.api_server',
-          '--model',
-          self._model_name,
-          '--port',
-          '{{PORT}}',
-      ]
-      for k, v in self._vllm_server_kwargs.items():
-        server_cmd.append(f'--{k}')
-        # Only add values for commands with value part.
-        if v is not None:
-          server_cmd.append(v)
-      self._server_process, self._server_port = start_process(server_cmd)
-
-    self.check_connectivity(retries)
+    with self._server_process_lock:
+      if not self._server_started:
+        server_cmd = [
+            sys.executable,
+            '-m',
+            'vllm.entrypoints.openai.api_server',
+            '--model',
+            self._model_name,
+            '--port',
+            '{{PORT}}',
+        ]
+        for k, v in self._vllm_server_kwargs.items():
+          server_cmd.append(f'--{k}')
+          # Only add values for commands with value part.
+          if v is not None:
+            server_cmd.append(v)
+        self._server_process, self._server_port = start_process(server_cmd)
+
+      self.check_connectivity(retries)
 
   def get_server_port(self) -> int:
     if not self._server_started: