[vLLM] AttributeError: 'MultiprocExecutor' object has no attribute 'workers'

Notice

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

꾸준하게

[vLLM] AttributeError: 'MultiprocExecutor' object has no attribute 'workers' 본문

이슈 해결

[vLLM] AttributeError: 'MultiprocExecutor' object has no attribute 'workers'

yeonsikc 2025. 5. 7. 22:58

H100 * 8 환경의 서버 2개에서 각각 같은 환경의 Docker로 LLama4, Gemma3를 구동하였는데 A서버의 경우, 4개 이상의 gpu로 잘 동작하는 반면, B서버의 경우, 2개까지의 gpu만 동작하고 4개 이상의 gpu를 할당할 경우 아래와 같은 오류가 발생하였다.

ERROR 05-07 10:11:11 [core.py:396] File "/opt/conda/lib/python3.11/site-packages/vllm/v1/executor/multiproc_executor.py", line 370, in wait_for_ready ERROR 05-07 10:11:11 [core.py:396] raise e from None ERROR 05-07 10:11:11 [core.py:396] Exception: WorkerProc initialization failed due to an exception in a background process. See stack trace for root cause.

<중략>

File "/opt/conda/lib/python3.11/site-packages/vllm/v1/executor/multiproc_executor.py", line 228, in shutdown for w in self.workers: ^^^^^^^^^^^^ AttributeError: 'MultiprocExecutor' object has no attribute 'workers'

<중략>

File "/opt/conda/lib/python3.11/site-packages/vllm/v1/engine/core_client.py", line 430, in _wait_for_engine_startup raise RuntimeError("Engine core initialization failed. " RuntimeError: Engine core initialization failed. See root cause above.

문제 해결에 꽤 오랜 시간을 허비하게 되었으며, 해결방법을 아래에 공유한다.

vllm 서버 구동 전에 아래 환경들을 export함으로써 해결이 되었다.

nccl 관련 이슈이나, 구체적인 원인은 시간상 파악하지 못하였다.

export NCCL_P2P_DISABLE=1

export NCCL_IB_DISABLE=1

export NCCL_SHM_DISABLE=1

export NCCL_SOCKET_IFNAME=lo

export NCCL_LAUNCH_MODE=GROUP

'이슈 해결' 카테고리의 다른 글

[vLLM] ValueError: 'aimv2' is already used by a Transformers config, pick another name. (0)	2025.08.22
[torch] torch._C._cuda_getDeviceCount() = 0 해결 (0)	2025.08.22
ImportError: /home/lawform/miniconda3/envs/ys/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.32' not found (0)	2024.12.03
[Azure] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. (2)	2024.09.02
[VS code] Python Debugger가 작동하지 않을 때 (외부코드) (0)	2024.08.17

'이슈 해결' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

꾸준하게

꾸준하게

[vLLM] AttributeError: 'MultiprocExecutor' object has no attribute 'workers' 본문

[vLLM] AttributeError: 'MultiprocExecutor' object has no attribute 'workers'

'이슈 해결' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역