Fix multi-parallelism (TP+DP or PP+DP) by Jeronymous · Pull Request #2 · OpenLLM-France/lighteval

Jeronymous · 2026-02-20T15:21:06Z

Also start to implement context parallelism (when the version of VLLM permits it), but unfortunately that is still failing in our env with VLLM 0.15.1 :

  File ".../vllm/v1/worker/gpu_worker.py", line 412, in initialize_from_config
    self.model_runner.initialize_kv_cache(kv_cache_config)
  File ".../vllm/v1/worker/gpu_model_runner.py", line 5874, in initialize_kv_cache
    self.initialize_attn_backend(kv_cache_config)
  File ".../vllm/v1/worker/gpu_model_runner.py", line 5225, in initialize_attn_backend
    check_attention_cp_compatibility(self.vllm_config)
  File ".../vllm/v1/worker/cp_utils.py", line 39, in check_attention_cp_compatibility
    assert layer_impl.supports_pcp, (
AssertionError: PCP requires attention impls' support, but the impl FlashAttentionImpl does not support PCP.

…it (>= 0.15). Unfortunately, it currently fails with VLLM 0.15.1 in our env: File ".../vllm/v1/worker/gpu_worker.py", line 412, in initialize_from_config self.model_runner.initialize_kv_cache(kv_cache_config) File ".../vllm/v1/worker/gpu_model_runner.py", line 5874, in initialize_kv_cache self.initialize_attn_backend(kv_cache_config) File ".../vllm/v1/worker/gpu_model_runner.py", line 5225, in initialize_attn_backend check_attention_cp_compatibility(self.vllm_config) File ".../vllm/v1/worker/cp_utils.py", line 39, in check_attention_cp_compatibility assert layer_impl.supports_pcp, ( AssertionError: PCP requires attention impls' support, but the impl FlashAttentionImpl does not support PCP.

Jeronymous added 3 commits February 19, 2026 15:10

Fix mix of data and pipeline parallelism

aafd3db

remove unnecessary deps (already there)

637d2ef

Jeronymous merged commit 1167c70 into main Feb 20, 2026

Jeronymous deleted the parallelism branch February 20, 2026 15:21

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix multi-parallelism (TP+DP or PP+DP)#2

Fix multi-parallelism (TP+DP or PP+DP)#2
Jeronymous merged 3 commits intomainfrom
parallelism

Jeronymous commented Feb 20, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

Jeronymous commented Feb 20, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant