阅读量:3
问题描述:
服务器重装Ubuntu 22.04系统,具备10张显卡,使用nvidia-smi显示只有9张显卡,有一张显卡消失了,重装驱动也不能解决问题。参考博客:(600条消息) ubuntu 18.04 两张GPU显卡,nvidia-smi只显示一张_nvidia-smi只显示一张显卡_Jason.su.ai的博客-CSDN博客
1、使用lspci |grep NVIDIA指令看看显卡物理连接是否出现问题
可以看到10块显卡都能显示,说明连接没有问题。
2、使用指令ls -l /dev/nvidia*查看nvidia驱动是否正常
可以看到10块显卡的驱动都正常。
3、使用echo "hello" > /dev/nvidia0 查看通信是否正常
可以看到第6块显卡读写出现错误,出现这种情况应该就是该块显卡坏掉了,少一块就少一块吧。没有解决问题,解决后再来更新!