Le projet

Présentation

Un nouveau système de stockage porté par le Mésocentre de Calcul Intensif Aquitain et 6 partenaires :
  • Université de Bordeaux, Mésocentre de Calcul Intensif Aquitain (MCIA)
  • Centre de Bioinformatique de Bordeaux(CBiB)
  • Institut de Mathématiques de Bordeaux (IMB)
  • Institut des Sciences Moléculaires (ISM)
  • Université de Pau et des Pays de l'Adour (UPPA)
  • Institut Bergonié (http://www.bergonie.org/)

L'objectif est de disposer d'un stockage des données de grande capacité, sécurisé, durable et évolutif en complément des possibilités existantes (stokage NFS des /home utilisateur, stockage parallèle de haute performance FhGFS).
Le projet a été validé par le comité scientifique du MCIA en octobre 2013 et financé pour la plus grande partie par le MCIA. Certains partenaires ont aussi ajouté leurs propres ressources (CBiB, Institut Bergonié).

Qu'est-ce que c'est

Ce système de stockage est basé sur le logiciel de gestion de données iRODS http://irods.org/.

iRODS est un système de stockage dit "objet". C'est à dire que pour travailler sur un fichier, il faut le récupérer préalablement avec la commande iget monFichier. De même, pour déposer un objet sur ce système de stockage: iput monFichier. Il existe ainsi une myriade de "icommand" pour gérer en ligne de commande ces fichiers (ils, iput, iget, irm, irsync, icp etc.). Ces commandes sont assez similaires a ce que l'on connaît (ls, rm, rsync, cp, etc.). Pour plus d'informations, voir ICommands.
Mais il est aussi possible d'utiliser une interface graphique pour visualiser et travailler sur ces données: iDrop

iRODS a été conçu pour assurer la gestion d'une grande quantité de donnée.
Par gestion, on entends par exemple: être capable de transferer de grande quantité de données, de les stocker, de gérer finement les droits d'accès, d'associer des métadonneés aux données, de définir des politiques (durée de rétention, nombre de réplication, emplacement de stockage, etc.) ou de définir des actions à réaliser automatiquement.
Il est aussi capable d'agréger des ressources hétérogènes (disques, bandes, etc.)
C'est donc un système puissant mais qui peut s'avérer complexe de prime abord.
La gestion de ces données est réalisé dans iRODS à l'aide de "règles" et de "microservices.
Le language utilisé pour définir ces règles et microservices est assez complexe à prendre en main.

iRODS en bref:
  • iRODS = Integrated Rule-Oriented Data-management System
  • Site web: https://www.irods.org
  • Historique de plus de 12 ans (issu du monde de la grille de calcul)
  • Open source, licence BSD
  • Développé par le "Data Intensive Cyber Environments (DICE) Center" + partenaires (CC-IN2P3, ...)
  • Supporté par la "National Archives and Records Administration" et la "National Science Foundation"
  • Projets internationaux (des centaines de collaborateurs)
  • Plusieurs Po de données, des centaines de millions de fichiers dans le monde
  • Références: National Aeronautics and Space Administration (NASA), Bibliothèque Nationale de France (BNF), Sanger Institute, BaBar Experiment, etc.
  • Pour aller plus loin: http://irods.org/resources/

Techniquement

Chaque centre partenaire héberge au moins:
- 1 DELL R720XD (8 cœurs, 64GB RAM, 12 disques 4 To)
- 3 DELL MD1200 (12 disques 4 To)
Représentant ~ 192 To bruts

Pour un total de ~ 1,1Po brut.

La sécurisation est assuré par un RAID6 et la couche logicielle iRODS qui réplique les données sur plusieurs sites.

Ainsi, sur chaque serveur est installé iRODS.

La solution se compose;
  • d'un serveur dédié « iCAT » (métacatalogue)
    C'est là que sont enregistrés la localisation de chaque fichiers, les métadonnées associées, etc.
    C'est le serveur central de la solution.
    Ce service tourne sur une machine virtuelle appelé "icat0" qui fait tourner iRODS ("icat enabled") et une base de donnée PostgreSQL.
  • Des ressources de stockage (iRODS Server)
  • Un système de « règles »

Et le tout est administré via un gestionnaire de configuration (saltstack) et supervisé via Nagios et Munin

DELL_R720xd_3_MD1200.png (108,273 ko) David Benaben, 22/08/2014 12:04

partenaires_mcia-irods_500px.png (75,057 ko) David Benaben, 29/05/2017 11:11

schema_architecture_iRODS-MCIA.png (118,462 ko) David Benaben, 29/05/2017 11:22