Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- sfttrainer
- multi-gpu
- Mac
- ubuntu
- Gemma
- gemma2
- llama-4-scout-17b-16e-instruct
- Fine-tuning
- diffusion
- PEFT
- llm
- backbone
- tensor-parallel
- nccl
- CPT
- langchain
- transformer
- llama-4
- gemma-3
- lora+
- prompt
- Lora
- glibcxx
- domain-adapted pre-training
- vLLM
- Text-to-Image
- instruction tuning
- gemma-3-27b-it
- error: mkl-service + intel(r)
- ViT
Archives
- Today
- Total
꾸준하게
[Azure] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 본문
이슈 해결
[Azure] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
yeonsikc 2024. 9. 2. 16:17발생 이슈
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
해결방법 : Azure가 아닌 일반 local machine에서 해결 가능한 방법
Secure Boot : Enable 상태일 경우 Bios 모드에 진입해서 Disable로 바꾸어야한다. Secure Mode일때 Nvidia driver를 설치할 때 Sign을 막아서 생기는 문제로 Disable로 수정하면 해결이 된다. 만약 Azure를 사용중이라면 VM 생성 시 Security type을 Trusted launch virtual machines가 아닌 Standard로 해야 Disable이 된다.
Secure boot 확인 명령어
mokutil --sb-state
해결방법 : Azure
Azure의 경우 위 해결방법에 추가적으로 본 방법을 같이 수행한다.(secure boot : disabled)
1. portal.azure.com > virtual machines 접속
2. 대상 머신 이름 클릭
3. 좌측 Settings > Extensions + applications 클릭
4. NvidiaGpuDriverLinux 설치(1시간 가량 오래 걸리니 참고 기달리자)
위 방법으로 설치하니 자동으로 nvidia-driver가 설치되었다.
즉, 별도로 nvidia-driver를 설치할 필요가 없다.
'이슈 해결' 카테고리의 다른 글
[vLLM] AttributeError: 'MultiprocExecutor' object has no attribute 'workers' (0) | 2025.05.07 |
---|---|
ImportError: /home/lawform/miniconda3/envs/ys/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.32' not found (0) | 2024.12.03 |
[VS code] Python Debugger가 작동하지 않을 때 (외부코드) (0) | 2024.08.17 |
[Mac] OSError: Ghostscript is not installed. (0) | 2024.08.12 |
[Mac] error: externally-managed-environment (0) | 2024.08.06 |