GPU 監控配置

2024年2月6日 22点热度 0人点赞

dcgm-exporter

錯誤記錄

Q1:docker run -d --name=gpu_monitor --gpus all --rm -p 9400:9400 nvidia/dcgm-exporter

docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

apt-get install nvidia-container-runtime

systemctl restart docker

#--restart unless-stopped --privileged=true

docker run -d --name gpu_monitor --hostname gpu-204-155 --gpus all --rm -p 9400:9400 nvidia/dcgm-exporter