Articles of nvidia

Error de libGL: no se pudo cargar el controller swrast en el contenedor del docker

Tengo un contenedor Docker desde el cual bash ejecutar una aplicación pyqt. Todo funciona bien, excepto que un pedazo de la GUI no puede renderizar. Los loggings del docker lo tiran: libGL error: failed to load driver: swrast X Error: GLXBadContext 169 Extension: 154 (Uknown extension) Minor opcode: 6 (Unknown request) Resource id: 0x6400003 X […]

¿Cómo usar Nomad con Nvidia Docker?

¿Hay alguna forma de usar nvidia-docker con Nomad ? El progtwig para computación en Nvidia funciona localmente pero no funciona con nvidia-docker (usa CPU en lugar de GPU). ¿Cuál es la forma preferida de hacer eso? Utilice el controller nvidia-docker para Nomad Utilice el ejecutable raw docker exec para ejecutar nvidia-docker De alguna manera, conecta […]

no puede instalar nvidia-docker – dpkg: los problemas de dependencia impiden la configuration de nvidia-docker

Estoy tratando de instalar nvidia–docker desde el enlace https://github.com/NVIDIA/nvidia-docker para distribuciones de ubuntu pero ejecutándose sudo dpkg -i /tmp/nvidia-docker*.deb && rm /tmp/nvidia-docker*.deb Estoy recibiendo un error de seguimiento. dpkg -i nvidia-docker_1.0.1-1_amd64.deb (Reading database … 11114 files and directories currently installed.) Preparing to unpack nvidia-docker_1.0.1-1_amd64.deb … Unpacking nvidia-docker (1.0.1-1) over (1.0.1-1) … dpkg: dependency problems prevent […]

Dockerfile con anidamiento a través de twigs no maestras

Tengo pocas imágenes de Dockerfile con la siguiente anidación: MyImage (maestro) FROM shalakhin/base -> Base (maestro) FROM centos7 Es posible de hacer: MyImage (gpu) FROM shalakhin/base:gpu -> Base (gpu) FROM centos7:gpu ? Lo necesito porque la twig principal tiene una configuration pnetworkingeterminada, mientras que yo quiero admitir la image nvidia–docker que no debe usar centos7, […]

Nvidia-docker – no puedo encontrar libnvcuvid.so en el process de construcción

Escribí un Dockerfile que construye mi aplicación QT y tengo algunos problemas en la compilation. Si el command de compilation está en Dockerfile, muestra este error: ninja: error: '/usr/lib/x86_64-linux-gnu/libnvcuvid.so', needed by 'bin/x64/release/*****/librtmpPlugin.so', missing and no known rule to make it Agregué un enlace simbólico que resuelve este error en un contenedor temporal: ln -s /usr/local/nvidia/lib64/libnvcuvid.so.1 […]

¿Cómo conectarse al server Nvidia MPS desde un contenedor Docker?

Quiero superponer el uso de la GPU con muchos contenedores Docker. Nvidia proporciona una utilidad para hacer esto: el service de process múltiple que se documenta aquí . Específicamente dice: Cuando CUDA se inicializa por primera vez en un progtwig, el controller CUDA intenta conectarse al daemon de control de MPS. Si el bash de […]

Nvidia-docker agrega la carpeta al contenedor

Soy bastante nuevo en los contenedores de Docker. Entiendo que hay operaciones ADD y COPY para que un contenedor pueda ver los files. ¿Cómo se le da acceso al contenedor a un directory determinado donde puedo poner mis sets de datos? Digamos que tengo un directory / home / username / dataset ¿cómo lo hago […]

¿Está disponible NCCL2 en el contenedor acoplable?

Voy a build un clúster GPU infiniband para aprendizaje profundo. Dado que hay varios hosts, me gustaría facilitar la implementación mediante el uso de nvidia–docker (Dockerfile). Muchos frameworks de aprendizaje profundo tienen su contenedor oficial (Dockerfile), así que creo que es natural para muchas personas considerarlo. Sé cómo COPIAR las bibliotecas NCCL2 descargadas previamente en […]

¿Cómo verificar la versión de nvidia-docker?

He intentado nvidia-docker –version , pero parece que solo muestra la versión de Docker. Después de una investigación de documentos oficiales, no pude encontrar ninguna información sobre esto. ¿Cómo verificar la versión de nvidia-docker ?

¿Por qué el contenedor Docker puede ver todos los dispositivos GPU en el host?

Versión de host de O / S: CentOS 7.3 Versión Docker: 1.12.6 Versión CUDA 8.0.61 Hay 4 GPU en la máquina host. A continuación están los detalles: "Devices": [ { "PathOnHost": "/dev/nvidiactl", "PathInContainer": "/dev/nvidiactl", "CgroupPermissions": "mrw" }, { "PathOnHost": "/dev/nvidia-uvm", "PathInContainer": "/dev/nvidia-uvm", "CgroupPermissions": "mrw" }, { "PathOnHost": "/dev/nvidia2", "PathInContainer": "/dev/nvidia0", "CgroupPermissions": "mrw" }, { "PathOnHost": […]