Lasso Informatics est une jeune entreprise SaaS dotée d’une plateforme de gestion et d’analyse de données de recherche qui rassemble des données multimodales (imagerie, génétique, comportement et bioéchantillons) pour des études à grande échelle. Des milliers de chercheurs à travers le monde s’appuient aujourd’hui sur notre plateforme, et nous itérons et améliorons rapidement pour repousser les limites du possible en gestion de données de recherche.
Nous vivons pour innover et donnons aux scientifiques les moyens de se concentrer sur la science, et non sur la technologie, ce qui accélère le chemin vers la découverte et la guérison.
Notre équipe est incroyablement diversifiée, tant par les parcours que par les expertises, et ce n’est pas un hasard. Nous croyons que les solutions les plus créatives et les plus puissantes émergent de différentes façons d’appréhender le monde. Vous travaillerez dans un écosystème inspirant aux côtés de professionnels de renommée mondiale en médecine, physique, ingénierie, imagerie, épidémiologie, développement logiciel et génétique. Nous mettons tout en oeuvre pour encourager nos collègues à être des leaders d’opinion et à innover avec des solutions nouvelles dans un domaine passionnant et en évolution rapide.
Nous cherchons un(e) ingénieur(e) principal(e) ou senior en infrastructure infonuagique pour prendre en charge de bout en bout les environnements AWS et GCP de Lasso. AWS est notre cloud principal ; GCP est une présence en croissance.
Il s’agit d’un rôle à haute autonomie et à fort impact, axé sur :
-
Stabiliser et faire évoluer l’infrastructure infonuagique en période de croissance rapide
-
Bâtir un modèle opérationnel durable et à faible friction
-
Rehausser les standards d’observabilité, de gouvernance et de fiabilité
Ce poste n’est pas axé sur les tickets. Vous devrez évaluer l’environnement actuel, cerner les lacunes et mener des améliorations significatives de manière autonome. Vous jouerez un rôle central dans l’évolution de la fonction SysOps vers un modèle opérationnel proactif et responsable, avec un impact visible dès les premiers mois.
-
Gérer et exploiter des environnements AWS et GCP multi-comptes (accès, fiabilité, coûts et posture de sécurité)
-
Assurer la planification de la capacité, les correctifs et l’optimisation des coûts de manière proactive
-
Gérer l’infrastructure à l’aide de l’Infrastructure as Code (Terraform, Ansible ou équivalent)
-
Identifier et corriger les risques de sécurité, les mauvaises configurations et les lacunes de fiabilité
-
Gérer et faire évoluer la pile d’observabilité Datadog dans tous les environnements
-
Assurer une couverture solide des journaux, métriques et alertes pour les systèmes en production
-
Améliorer continuellement le ratio signal/bruit des alertes
-
Concevoir et maintenir un tableau de bord opérationnel unifié offrant une visibilité en temps réel
-
Obtenir des améliorations mesurables du MTTD et du MTTR dans les six premiers mois
-
Diriger la réponse aux incidents, l’analyse des causes profondes et les rétrospectives
-
Améliorer la résilience des systèmes en s’attaquant aux causes profondes et en prévenant la récurrence
-
Identifier et combler les lacunes de surveillance et d’opérations avant qu’elles ne se manifestent en incidents
-
Maintenir une documentation de qualité production pour les systèmes critiques, incluant les schémas d’architecture, les procédures opérationnelles standard et les guides de gestion des incidents
-
Veiller à ce que la documentation permette aux autres ingénieurs d’agir de manière autonome
-
Maintenir la documentation à jour par rapport à la réalité des systèmes au fil de l’évolution des environnements
Apporter des améliorations constantes et mesurables en matière de réduction de l’automatisation et du labeur, de couverture et de qualité de l’observabilité, de posture de sécurité et de préparation à la conformité, ainsi que des processus et outils opérationnels. Aborder les problèmes avec une vision systémique : corriger les causes profondes, pas les symptômes.
ATTENTE FONDAMENTALE : Le ou la candidat(e) idéal(e) a un parcours éprouvé d’amélioration concrète d’environnements imparfaits — en prenant en charge sans attendre de directives et en haussant les standards d’exploitation de l’infrastructure.
-
5 ans ou plus d’expérience en infrastructure / systèmes infonuagiques, avec une expérience pratique récente et substantielle dans AWS
-
Solide expérience pratique des services AWS essentiels (EC2, S3, RDS, EKS, IAM, VPC, etc.)
-
Expérience fonctionnelle avec GCP (Compute Engine, GKE, IAM, etc.)
-
Expérience dans la mise en place ou l’évolution significative d’une pile d’observabilité (Datadog de préférence)
-
Capacité démontrée à travailler de manière autonome : cerner les problèmes, concevoir des solutions et obtenir des résultats
-
Expérience en environnements réglementés ou axés sur la conformité (HIPAA, RGPD, NIST, SOC 2 ou équivalent)
-
Solides compétences en scripting et automatisation (Bash, Python ou équivalent)
-
Expérience avec l’Infrastructure as Code (Terraform de préférence)
-
Capacité à produire une documentation technique claire et de qualité production
-
Doit être légalement autorisé(e) à travailler au Canada
-
Certifications AWS ou GCP
-
Expérience avec Kubernetes (EKS, GKE)
-
Expérience dans la mise à l’échelle d’infrastructures en environnement SaaS à forte croissance
-
Expérience en santé, sciences de la vie ou systèmes à destination gouvernementale
-
Expérience à titre de voix technique senior ou de référence au sein d’une équipe
Nous travaillons sur une infrastructure qui soutient de vraies recherches cliniques et académiques en Amérique du Nord et en Europe, avec un haut niveau d’autonomie, une collaboration directe avec l’ingénierie et la direction, et la possibilité de bâtir une fonction SysOps de premier plan à partir de bases solides.
-
Salaire compétitif avec prime de performance liée à des résultats d’infrastructure mesurables
-
Régime d’avantages sociaux collectifs (payé à 100 % par l’employeur)
-
Cotisation de contrepartie au REER (2 %)
-
Budget de développement professionnel (certifications et formations AWS, GCP, Datadog)
-
Flexibilité hybride, basé à Montréal, 2 jours par semaine au bureau