Das Team für digitale Forschung und Entwicklung (DRD) ist bei Covestro für innovative Berechnungslösungen für die chemische Produkt- und Anwendungsentwicklung zuständig. DRD integriert Fachwissen in den Bereichen Materialsimulationen und computergestützte Chemie, Laborautomatisierung, R&D Data Science, High Performance Computing und Quantum Computing. In Ihrer neuen Rolle als HPC Operations Assistant im High Performance and Quantum Computing Team werden Sie die folgenden Aufgaben übernehmen:
- Sie unterstützen die Verwaltung von Linux-basierten HPC-Clustern mit Tausenden von AMD EPYC-basierten CPU-Kernen und umfangreichen GPU-Ressourcen wie NVIDIA DGX-Knoten zur Unterstützung von chemischen Simulationen und Data-Science-Workflows
- Sie pflegen und fördern eine DevOps- und GitOps-Mentalität und verfolgen einen Everything-as-Code-Ansatz, der Tools wie Ansible, xCAT, GitLab CI/CD, Spack für Konfigurationsmanagement, Softwareinstallation, Infrastruktur-Upgrades, Sicherheit, Tests und automatisierte Bereitstellungen integriert
- Sie übernehmen eine aktive Rolle bei der Verbesserung, Entwicklung und Umsetzung von Konzepten für Sicherheitsstandards, Upgrade-Strategien, Wartungszeiträume und Datenmanagement
- Sie sind auf dem neusten Stand und nehmen an HPC-Konferenzen und -Veranstaltungen teil, um sich mit Anbietern zu treffen und neue HPC-Technologien zu erkunden, z. B. Arm-Prozessoren wie NVIDIA Grace Hopper Superchip, SoCs wie NVIDIA BlueField DPU oder FPGAs für HPC
- Sie sind die erste Anlaufstelle für die technische Beratung erfahrener HPC-Anwender und beheben Probleme in einer R&D Umgebung unter Anwendung agiler Prinzipien mit Jira
- Sie arbeiten an der Verbesserung und Erstellung von technischer Dokumentation im Wiki-Stil in Form von Benutzerhandbüchern und Verwaltungsanweisungen für die HPC-Infrastruktur in Confluence mit
- Die Stelle setzt keine Verfügbarkeit für Nacht- oder Wochenendschichten voraus
- Sie verfügen über eine abgeschlossene Berufsausbildung als Fachinformatiker/in Systemadministration oder elektronische Datenverarbeitung (z.B. Systeminformatiker/in, Fachinformatiker/in für Systemintegration, Fachinformatiker/in für digitale Vernetzung) oder eine vergleichbare Qualifikation
- Sie verfügen über fundierte Kenntnisse und Erfahrungen in der Administration von RHEL-basierten Servern (Rocky/Alma Linux) oder verwandten Linux-Distributionen und der Behebung von Systemproblemen in einer komplexen Umgebung
- Darüber hinaus haben Sie Kenntnisse in Bash-Scripting, zumindest Grundkenntnisse in der Python-Programmierung und Erfahrung mit Versionskontrolle mittels git
- Sie haben Grundkenntnisse in HPC-Software wie Slurm, OpenHPC, OpenMPI, Intel oneAPI, NVIDIA toolchain, Lmod, etc. Sie haben ein starkes Interesse daran, die folgenden Technologien zu erlernen und mit ihnen zu arbeiten: verteilte Dateisysteme, InfiniBand-Netzwerke, Singularity und Large Language Models (LLMs) in einer HPC-Umgebung
- Sie sind sicher im Umgang mit der englischen Sprache und verfügen über gute mündliche und schriftliche Kommunikationsfähigkeiten
- Sie sind offen für die Arbeit in einem vielfältigen internationalen Umfeld und verfügen über eine innovations- und dienstleistungsorientierte Denkweise
Bitte erwähne bei deiner Bewerbung, dass du diese Stelle auf max-talent.de gefunden hast