Jan. 2024 - Jan. 2025

MCO plateforme HPC — Naarea - energie (petits reacteurs modulaires)

Nanterre



--- Contexte ---

Startup dans la filiere petits reacteurs nucleaires modulaires (SMR) ; systeme d'information majoritairement sous Windows , avec decision d'investir dans une plateforme HPC pour la simulation et le calcul scientifique.



--- Zone protegee - annuaire, auth et messagerie ---

L'ensemble du parc Linux etait situe dans une zone reseau protegee . Il fallait donc des infrastructures dediees sur ce perimetre : un annuaire LDAP , un mecanisme d' authentification propre a la zone, et un relais SMTP pour la messagerie des services concernes.



--- Master Linux - preconisations ANSSI ---

A Naarea , elaboration d'un master Linux pour deployer un socle homogene et durable : capitalisation sur mon experience et alignement sur les guides et preconisations de l' ANSSI (durcissement, bonnes pratiques).



--- Plateforme Lenovo - cluster Slurm ---

Infrastructure Lenovo : 10 noeuds de calcul , 4 machines de developpement , 3 machines sous Proxmox pour l'hebergement de VMs. NAS avec partages NFS pour les donnees partagees exploitees par le cluster Slurm . Reseau InfiniBand . Configuration de l'ensemble avec Salt (SaltStack). Observabilite et exploitation : Grafana, Prometheus, Centreon ; OpenMP, MPI, Python, Bash ; Helm selon les besoins.



--- Mission - Slurm, Proxmox et support Linux ---

Exploitation du cluster Slurm et de l'infrastructure Proxmox (virtualisation, hebergement des machines virtuelles). Role multi-casquette sur les besoins necessitant un Linux : integration des codes de calcul avec les bibliotheques scientifiques (MPI, pile logicielle HPC) ; chaines d' integration continue avec GitLab ; conteneurs - demarrage sous Docker , puis usage d' Apptainer (Singularity) pour les charges compatibles avec le calcul haute performance.

