Job workflow

Gestion des workflows en dehors des jobs

Si vous avez besoin de lancer un processus à l’extérieur d’un job, par exemple un gestionnaire de workflow ou un IDE connecté aux clusters comme l’outil RemoteSSH de VSCode, ne le faites pas depuis la frontale des clusters.

Pour cela, nous donnons l’accès à plusieurs machines, dahu-workflow[N], depuis lesquelles vous pouvez soumettre des jobs sur tous les clusters, par exemple:

$ ssh dahu-workflow1.ciment

        WELCOME TO THE WORKFLOW HOST FOR GRICAD CLUSTERS !

   ********* You are logged on a secondary dahu frontend ********
   This host is reserved to workflow processes that submit jobs
   to Dahu nodes. You can also submit jobs on bigfoot or luke
   with ssh. For example:
       ssh bigfoot oarsub ...

      NOTE: Bigfoot home is mounted into /home-bigfoot

   WARNING: - Other users may create high workloads
            - Workflow hosts are provided in a best-effort way
            - Workflow hosts are susceptible to breakdown
            - Use at your own risks!

   **************************************************************

Ces hôtes sont utiles pour les gestionnaires de workflows, les outils de post processing ou les outils de développement qui nécessitent une trop grande quantité de ressource pour les frontales des clusters. Pour rappel, les frontales des clusters sont faites pour la soumission et le monitoring de jobs.

Par défaut, les répertoires de home sont ceux du cluster Dahu. Cependant, vous pouvez avoir accès aux répertoires home de Bigfoot dans /home-bigfoot. Bien entendu, vous avez également accès aux espaces de stockage Bettik et Silenus dans leurs points de montage habituels que sont /bettik et /silenus.

Les frontends de workflows disponibles sont :

  • dahu-workflow1: dual Intel(R) Xeon(R) Silver 4114 CPU @ 2.20GHz (10 cores) avec 192 GB de RAM. ATTENTION: /silenus est disponible, mais seulement à travers une connexion Ethernet lente.
  • dahu-workflow2: dual Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz (10 cores) avec 192 GB de RAM et un scratch SSD de 700 GB monté dans /scratch. L’accès à Silenus est rapide depuis dahu-workflow2 (Omnipath networking).

Les hôtes de Workflow sont mis à disposition selon la règle du best-effort, il s’agit d’anciennes machines qui sont moins monitorées. Ainsi, de tels hôtes peuvent être surchargés (à cause des utilisateurs lançant des logiciels lourds), voire même, dans les cas extrêmes, soumis à une interruption de service.