Wiki

Présentation de la machine Avakas

Le cluster Avakas est composé de plusieurs groupes de machines accessibles:
  • Les nœuds interactifs frontaux (x2): machines sur lesquelles l'utilisateur se connecte pour mettre au point et lancer ses travaux, manipuler ses données et ses résultats
  • Les nœuds de calcul c6100 (x264): ce sont les machines sur lesquelles les travaux sont exécutés (par l'intermédiaire du Gestionnaire de Travaux)
    • 2 processeurs hexacœurs (12 cœurs par nœud) Intel® Xeon® x5675 @ 3,06 GHz
    • 48 Go RAM
    • machines node001 à node264
  • Les nœuds de calcul bigmem R910 (x4): ces nœuds ont des caractéristiques différentes par rapport aux nœuds de calcul: plus de mémoire, plus de cœurs (mais les processeurs sont plus lents), disque locaux plus rapides
    • 4 processeurs 10 cœurs (40 cœurs par nœud) Intel® Xeon® E7-4870 @ 2,4 GHz
    • 512 Go RAM
    • 4 disques SAS 10krpm
    • machines bigmem01 à bigmem04
  • Les nœuds de visu (x4): les machines de visualisation déportée
    • 2 processeurs Intel® Xeon® Sandy Bridge octocœurs @ 2,20 GHz
    • 128Go RAM
    • 2 cartes graphiques NVidia® Tesla® M2070Q
    • pour y accéder, voir: Visualisation_déportée
    • machines visu01, visu02, visu05, visu06
  • D'autres machines composent le cluster, mais elles ne sont normalement pas accessibles aux utilisateurs
    • nœuds d'administration
    • serveurs de fichiers NFS qui stockent les répertoires d'accueil des utilisateurs et leurs sauvegarde (voir FS_home)
    • serveurs de fichiers Fraunhoffer qui stockent les données du système de fichier parallèle (voir FS_scratch)
  • Interconnexion Infiniband QDR – switch Qlogic® 324 ports

Environnement logiciel

Les nœuds du cluster fournissent un environnement ScientificLinux 6

On y trouve notamment:

Les espaces disques

  • FS_tmp: espace temporaire local aux nœuds de calcul
  • FS_home: espace NFS pour les données des comptes utilisateurs
  • FS_scratch: système de fichiers parallèle pour les données des jobs. NB: Cet espace n'est pas destiné à l'archivage! les fichiers y sont nettoyés régulièrement par un système automatique!

Gestionnaire de travaux

Les ressources de calcul proprement dites sont accessibles par un gestionnaire de travaux. Il permet à l'utilisateur de réserver les ressources nécessaires à un calcul décrit dans un script de soumission. Ce script est en général un script shell (mais il peut être en Python, etc...) qui contient éventuellement des directives propres au gestionnaire de travaux.

Le Gestionnaire de Travaux d'avakas est Torque+Maui

Une explication de la configuration du gestionnaire de travaux: Configuration Scheduler