... | ... | @@ -57,9 +57,25 @@ conda install accelerate |
|
|
```
|
|
|
|
|
|
## Compléments ##
|
|
|
### Cartes GPU disponibles ###
|
|
|
Sur la machine portant les gpu, il y a deux cartes disponibles, numérotées 0 et 1.
|
|
|
Par défaut, si l'on n'utilise qu'une seule carte, c'est la carte 0 qui est utilisé; c'est un souci si tous les utilisateurs vont sur la carte 0 et aucun sur la carte 1.
|
|
|
|
|
|
Aussi, la variable `CUDA_VISIBLE_DEVICES` est placé aléatoirement (en fait non, suivant la parité de la session) à 0 ou 1.
|
|
|
Si vous souhaitez utiliser les 2 cartes :
|
|
|
```bash
|
|
|
export CUDA_VISIBLE_DEVICES=0,1
|
|
|
```
|
|
|
ou bien
|
|
|
```bash
|
|
|
unset CUDA_VISIBLE_DEVICES
|
|
|
```
|
|
|
### Monitoring ###
|
|
|
Si l'on souhaite une sorte de `top` pour les gpu :
|
|
|
```bash
|
|
|
nvidia-smi --loop=2
|
|
|
```
|
|
|
|
|
|
Pour plus d'informations :
|
|
|
```bash
|
|
|
nvidia-smi -q -d MEMORY,UTILIZATION,TEMPERATURE,POWER,CLOCK,COMPUTE,PIDS,PERFORMANCE -l
|
|
|
``` |