Panne groupe froid (15/09/2014)

Ajouté par Pierre Gay il y a plus de 4 ans

Probablement suite à des coupures électriques ce weekend, le groupe froid associé à Avakas est tombé en panne.

Privé de refroidissement, le cluster a automatiquement éteint tous les nœuds de calcul pour éviter une surchauffe de la salle machine.

Nous avons contacté la maintenance du constructeur.

Nous vous tiendrons au courant de l'évolution de la situation.

15/09/2014:
La société SAITA est intervenue sur le groupe froid cet après midi. Une alarme "flow switch 1" bloquait le système. Le groupe a été redémarré, mais ce soir, l'alarme est de nouveau apparue. Le Cluster est toujours arrêté, nous attendons une nouvelle intervention pour demain.

16/9/2014:
Nouvelle intervention de la société SAIA. Le groupe froid est réparé (ballon d'expansion regonflé, fuite de gaz colmatée). Après quelques heures de surveillance et de tests, nous remettons le cluster en production.


Commentaires

Ajouté par Mehrez Agnaou il y a plus de 4 ans

Merci pour votre réponse.
Bonne journée,
Mehrez Agnaou

Ajouté par Antoine Villesuzanne il y a plus de 4 ans

Merci! Cependant, la société SAITA étant basée à St Médard d'Eyrans, on pouvait espérer des délais d'intervention autrement plus courts (en particulier au vu du nombre d'utilisateurs et de jobs en cours sur le cluster)...