Interruption de service, lundi 30 mars
For the record
Jérémie Neveu 11:35: je suis en train de faire TD sur le cloud avec 16 étudiants, sur les FFT. Il y a des soucis en ce moment, apparemment ça a freezé chez eux et on a des difficultés à s'y reconnecter. Normalement le premier exo c'était une FFT d'un sinus, à moins qu'un étudiant est mis un million de points je ne pense pas qu'on ait trop sollicité le serveur ? Ou alors c'est un problème de réseau ?
@nicolas.thiery: J'ai pu me connecter par ssh. 71 serveurs, dont la plupart datant d'il y a plus de trois heures, c'est pas énorme. top indique un process à 100%, mais sinon il y a de la marge sur le CPU et la mémoire.
top - 11:49:15 up 57 days, 17:27, 1 user, load average: 10,21, 7,84, 6,47 Tasks: 832 total, 3 running, 829 sleeping, 0 stopped, 0 zombie %Cpu(s): 3,7 us, 0,1 sy, 0,0 ni, 96,0 id, 0,0 wa, 0,0 hi, 0,1 si, 0,2 st KiB Mem : 65973752 total, 15642748 free, 19608600 used, 30722404 buff/cache KiB Swap: 31457280+total, 31426998+free, 302816 used. 38956092 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 3020 centos 20 0 1899872 77768 13476 R 99,7 0,1 68:53.81 python 12367 nthierry 20 0 158408 3008 1536 R 1,3 0,0 0:00.21 top 1415 root 20 0 986464 106132 8668 S 0,7 0,2 18:04.23 node 7691 centos 20 0 1222760 147980 10224 S 0,7 0,2 1:00.04 python 16916 root 20 0 2228292 2592 1476 S 0,7 0,0 0:02.00 docker-proxy
De fait, je n'arrive pas à démarrer mon serveur Jupyter: "Start My server" rame.
Bref, je n'ai pas de bon diagnostic et je ne sais pas trop quoi faire. Au pire, je peux redémarrer le serveur si tu me donnes un top; il n'y a probablement peu d'autres utilisateurs en dehors de vous.
Ah ça y est mon serveur a démarré.
Jérémie Neveu, 12:08 ça a redémarré pour moi il y a une vingtaine de minutes. Les étudiants bossent de noueau correctement.
Jérémie Neveu, 15:27 là juste maintenant le jupyter a crashé, vous pouvez faire un diagnostic ?
@nicolas.thiery: Oui, j'ai vu. Je n'arrivais même pas à me connecter dessus pour analyser. Le serveur a été rebooté il y a 41 minutes. Mais pas par moi! Là ça remarche et il y a 32 personnes connectées. Marco, tu en sais plus?
@philippo 17:00 nous avons effectivement eu des soucis sur jupytercloud. J’ai du redémarré la machine virtuelle. Celle-ci était devenu totalement innacessible en réseau avec pas mal de soucis de kmalloc au niveau des kernels docker.