Senior Networking Solution Test Engineer – AI Cluster Debugging
Senior Networking Solution Test Engineer – AI Cluster Debugging

Senior Networking Solution Test Engineer – AI Cluster Debugging

Vollzeit 80000 - 110000 € / Jahr (geschätzt) Kein Home Office möglich
Go Premium
J

Auf einen Blick

  • Aufgaben: Entwickle und teste hochmoderne KI-Cluster-Netzwerklösungen in einem dynamischen Team.
  • Arbeitgeber: Führendes Unternehmen im Bereich KI-Infrastruktur mit innovativer Kultur.
  • Mitarbeitervorteile: Wettbewerbsfähige Vergütung, Zugang zu modernsten Technologien und internationalem Team.
  • Andere Informationen: Vielfältige Karrierechancen in einem inklusiven Arbeitsumfeld.
  • Warum dieser Job: Gestalte die Zukunft der KI mit und löse komplexe technische Herausforderungen.
  • Gewünschte Qualifikationen: Erfahrung in Linux-Netzwerken und komplexem Debugging erforderlich.

Das voraussichtliche Gehalt liegt zwischen 80000 - 110000 € pro Jahr.

Diese Rolle befindet sich an der Spitze der Validierung von großangelegter KI-Infrastruktur, wo Netzwerke, Systemtechnik und Arbeitslasten der künstlichen Intelligenz zusammenkommen. Sie sind verantwortlich für die Gewährleistung der Zuverlässigkeit und Leistung komplexer KI-Cluster, die auf Hochgeschwindigkeitsverbindungstechnologien wie NVLink, Ethernet und InfiniBand basieren. In einer hoch technischen und kollaborativen Umgebung werden Sie tiefgreifende systematische Probleme untersuchen, die Hardware, Treiber, Netzwerkstacks und KI-Frameworks umfassen.

Die Position erfordert ein starkes Debugging-Gespür und die Fähigkeit, reale Kundenszenarien in fortschrittlichen Testumgebungen zu reproduzieren und zu analysieren. Sie tragen direkt zur Stabilität und Skalierbarkeit von KI-Trainings- und Inferenzsystemen der nächsten Generation bei, die in großem Maßstab eingesetzt werden. Dies ist eine praktische Ingenieursrolle, in der Ihre Analysen und Ergebnisse die Produktqualität und Systemleistung direkt beeinflussen.

Verantwortlichkeiten
  • Entwerfen und Überprüfen von Teststrategien und Produktanforderungen für NVLink-, Ethernet- und InfiniBand-basierte KI-Cluster-Systeme.
  • Aufbauen und Pflegen realistischer, großangelegter Testumgebungen, die die Kundeninfrastruktur für KI nachahmen, einschließlich heterogener Hardware- und Software-Stacks.
  • Leiten der End-to-End-System-Debugging über Hardware, Firmware, Netzwerke und KI-Software-Schichten zur Identifizierung und Behebung von Ursachen.
  • Analysieren von Protokollen, Überprüfen von Quellcode und Validieren von Fehlerbehebungen über Komponenten wie NICs, DPUs, Switches und KI-Kommunikationsbibliotheken.
  • Eng mit Entwicklungsteams zusammenarbeiten, um Protokolle wie NCCL, RoCE und RDMA zu debuggen und zu optimieren.
  • Definieren, Entwerfen und Leiten von Automatisierungsbemühungen für robuste Testframeworks, die umsetzbare Protokolle, Metriken und Traces erzeugen.
  • Durchführen von Regressionstests, Leistungstests, Funktionstests und Skalierbarkeitstests sowie Bereitstellung klarer, datengestützter technischer Berichte.
  • Profilieren und Benchmarking von KI-Trainings- und Inferenzarbeitslasten, Korrelation des Anwendungsverhaltens mit System- und Netzwerkleistungsmetriken.
Anforderungen
  • Abschluss (Bachelor oder Master) in Informatik, Elektrotechnik oder gleichwertige praktische Erfahrung in der System-/Netzwerktechnik.
  • Über 8 Jahre Erfahrung in Linux-basierten Netzwerken, Systemtests und komplexen Debugging-Umgebungen.
  • Starke Expertise in Linux-Netzwerktools und Debugging-Dienstprogrammen (z.B. tcpdump, ethtool, iproute2, perf).
  • Nachgewiesene Erfahrung in der Fehlersuche auf Produktionsniveau, hypothesengeleitetem Debugging und Ursachenanalyse unter Druck.
  • Solides Verständnis der NIC-Architektur, Offloads, Warteschlangenmanagement und Interaktionen zwischen Treiber/Firmware.
  • Tiefes Wissen über KI-Netzwerktechnologien wie NCCL, RoCE und RDMA.
  • Fähigkeit, Quellcode in C/C++, Python oder ähnlichen Sprachen zu lesen, zu verstehen und zu debuggen.
  • Starke Skript- und Automatisierungsfähigkeiten mit Bash, Python und/oder Ansible.
  • Erfahrung in schnelllebigen technischen Umgebungen mit starker Anpassungsfähigkeit und Lernfähigkeit.
  • Ausgezeichnete analytische, kommunikative und kollaborative Fähigkeiten mit starkem Verantwortungsbewusstsein.
Vorteile
  • Wettbewerbsfähige Vergütung, die mit der Expertise auf Senior-Ebene und den Standards des Schweizer Marktes übereinstimmt.
  • Gelegenheit, an modernsten KI-Cluster- und Hochleistungsnetzwerktechnologien zu arbeiten.
  • Einblick in großangelegte Systeme, die fortschrittliche KI-Trainings- und Inferenzarbeitslasten antreiben.
  • Hochtechnische, forschungsgetriebene Ingenieurumgebung mit starkem Innovationsfokus.
  • Kollaboratives internationales Team, das an Infrastrukturherausforderungen der nächsten Generation arbeitet.
  • Zugang zu komplexen, großangelegten Testumgebungen und fortschrittlichen Debugging-Tools.
  • Inklusive Arbeitsplatzkultur, die Vielfalt, Gleichheit und berufliches Wachstum unterstützt.
  • Umzug und Unterbringung von Barrierefreiheitsbedürfnissen, wo zutreffend.

Senior Networking Solution Test Engineer – AI Cluster Debugging Arbeitgeber: Jobgether

Als Arbeitgeber in der Schweiz bieten wir Ihnen die Möglichkeit, an der Spitze der Validierung von KI-Infrastrukturen zu arbeiten, wo Networking und Systeme auf innovative Weise zusammenkommen. Unsere hochtechnische und kollaborative Arbeitsumgebung fördert nicht nur Ihre berufliche Weiterentwicklung, sondern ermöglicht es Ihnen auch, an bahnbrechenden Technologien zu arbeiten, die die Zukunft der KI gestalten. Wir legen großen Wert auf Vielfalt und Chancengleichheit und unterstützen aktiv die berufliche Entfaltung unserer Mitarbeiter.
J

Kontaktperson:

Jobgether HR Team

StudySmarter Bewerbungstipps 🤫

So bekommst du den Job: Senior Networking Solution Test Engineer – AI Cluster Debugging

Tipp Nummer 1

Netzwerken ist der Schlüssel! Nutze Plattformen wie LinkedIn, um mit Fachleuten aus der Branche in Kontakt zu treten. Lass uns wissen, wenn du Hilfe beim Erstellen eines ansprechenden Profils brauchst!

Tipp Nummer 2

Bereite dich auf technische Interviews vor! Übe das Debugging und die Analyse von Systemproblemen, denn das wird oft gefragt. Wir können dir Ressourcen zur Verfügung stellen, um deine Fähigkeiten zu verbessern.

Tipp Nummer 3

Sei proaktiv und zeige dein Interesse! Wenn du eine Stelle im Auge hast, zögere nicht, direkt bei uns nachzufragen oder dich über unsere Website zu bewerben. Wir lieben es, engagierte Kandidaten zu sehen!

Tipp Nummer 4

Mach dich mit den neuesten Technologien vertraut! Halte dich über Entwicklungen in der KI-Cluster-Technologie und Netzwerktechnologien auf dem Laufenden. Das zeigt, dass du bereit bist, in einem sich schnell verändernden Umfeld zu arbeiten.

Diese Fähigkeiten machen dich zur top Bewerber*in für die Stelle: Senior Networking Solution Test Engineer – AI Cluster Debugging

Debugging-Intuition
NVLink
Ethernet
InfiniBand
System-Level Debugging
Log-Analyse
C/C++
Python
Bash
Ansible
NCCL
RoCE
RDMA
Linux-Netzwerk-Tools
Automatisierung

Tipps für deine Bewerbung 🫡

Mach es persönlich!: Wenn du deine Bewerbung schreibst, vergiss nicht, einen persönlichen Touch hinzuzufügen. Zeig uns, warum du genau zu StudySmarter passt und was dich an der Rolle als Senior Networking Solution Test Engineer begeistert!

Sei präzise und klar!: Achte darauf, dass deine Bewerbung klar und präzise ist. Verwende einfache Sprache und vermeide Fachjargon, wenn es nicht nötig ist. Wir wollen schnell verstehen, was du kannst und wie du uns helfen kannst!

Beziehe dich auf die Anforderungen!: Schau dir die Jobbeschreibung genau an und beziehe dich auf die geforderten Fähigkeiten und Erfahrungen. Erkläre, wie deine bisherigen Erfahrungen mit Linux-Netzwerken und Debugging dir helfen werden, in dieser Rolle erfolgreich zu sein.

Bewirb dich über unsere Website!: Wir empfehlen dir, dich direkt über unsere Website zu bewerben. So stellst du sicher, dass deine Bewerbung schnell bei uns landet und wir sie direkt im richtigen Kontext sehen können. Wir freuen uns auf deine Bewerbung!

Wie du dich auf ein Vorstellungsgespräch bei Jobgether vorbereitest

Verstehe die Technologien

Mach dich mit den spezifischen Technologien vertraut, die in der Stellenbeschreibung erwähnt werden, wie NVLink, Ethernet und InfiniBand. Zeige im Interview, dass du nicht nur die Grundlagen verstehst, sondern auch, wie sie in komplexen AI-Cluster-Systemen zusammenarbeiten.

Praktische Beispiele vorbereiten

Bereite konkrete Beispiele aus deiner bisherigen Berufserfahrung vor, die deine Fähigkeiten im Debugging und in der Systemanalyse demonstrieren. Sei bereit, über Herausforderungen zu sprechen, die du gemeistert hast, und wie du zur Stabilität und Leistung von Systemen beigetragen hast.

Fragen stellen

Zeige dein Interesse an der Rolle, indem du gezielte Fragen stellst. Frage nach den aktuellen Herausforderungen, mit denen das Team konfrontiert ist, oder nach den Tools, die sie verwenden. Das zeigt, dass du proaktiv bist und wirklich an der Position interessiert bist.

Teamarbeit betonen

Da die Rolle stark auf Zusammenarbeit ausgelegt ist, solltest du Beispiele für erfolgreiche Teamprojekte oder Kooperationen hervorheben. Erkläre, wie du in der Vergangenheit mit anderen Abteilungen zusammengearbeitet hast, um Probleme zu lösen und innovative Lösungen zu entwickeln.

Senior Networking Solution Test Engineer – AI Cluster Debugging
Jobgether
Premium gehen

Schneller zum Traumjob mit Premium

Deine Bewerbung wird als „Top Bewerbung“ bei unseren Partnern gekennzeichnet
Individuelles Feedback zu Lebenslauf und Anschreiben, einschließlich der Anpassung an spezifische Stellenanforderungen
Gehöre zu den ersten Bewerbern für neue Stellen mit unserem AI Bewerbungsassistenten
1:1 Unterstützung und Karriereberatung durch unsere Career Coaches
Premium gehen

Geld-zurück-Garantie, wenn du innerhalb von 6 Monaten keinen Job findest

>