꾸준하게

[Azure] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 본문

이슈 해결

[Azure] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.

yeonsikc 2024. 9. 2. 16:17

발생 이슈

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

 

해결방법 :  Azure가 아닌 일반 local machine에서 해결 가능한 방법

Secure Boot : Enable 상태일 경우 Bios 모드에 진입해서 Disable로 바꾸어야한다. Secure Mode일때 Nvidia driver를 설치할 때 Sign을 막아서 생기는 문제로 Disable로 수정하면 해결이 된다. 만약 Azure를 사용중이라면 VM 생성 시 Security typeTrusted launch virtual machines가 아닌 Standard로 해야 Disable이 된다.

 

Secure boot 확인 명령어

mokutil --sb-state

해결방법 : Azure

Azure의 경우 위 해결방법에 추가적으로 본 방법을 같이 수행한다.(secure boot : disabled)

 

1. portal.azure.com  > virtual machines 접속

2. 대상 머신 이름 클릭

3. 좌측 Settings > Extensions + applications 클릭

4. NvidiaGpuDriverLinux 설치(1시간 가량 오래 걸리니 참고 기달리자)

 

위 방법으로 설치하니 자동으로 nvidia-driver가 설치되었다.

즉, 별도로 nvidia-driver를 설치할 필요가 없다.