Ajouter 30 services à un monolithe: platform as a service @ Doctolib
10:35 - 11:20 Conférence / Architecture / INTERMEDIATE Salle Casoar TadorneChez Doctolib, nous découpons le monolithe historique. En plus de la difficulté métier à faire cela, nous avons dû repenser sur comment déployer de nouveaux services. Il y a un an : 40 pull requests, 3 semaines pour aller en prod. Aujourd'hui : moins de 3 heures.
Pour cela nous sommes passés d'une infrastructure gérée par des SRE à une plateforme self-service facilement utilisable par les développeurs. Résultat aujourd'hui plus de 90% des PRs infrastructure sont écrites et validées par les équipes elles-mêmes.
Mais le chemin pour y arriver n'a pas été évident. Ce talk revient sur les choix faits et les difficultés rencontrées, avec deux points de vue complémentaires : celui d'un Principal SRE, qui doit garantir la fiabilité, la sécurité et la conformité dans un contexte de santé, et celui d'un PM, qui doit rendre la plateforme compréhensible, adoptable et réellement utile pour les équipes.
Description
- L'outil n'était pas la question. Quel outil choisir ? Terraform ? Helm? Kubernetes ? Cette question n'est pas la plus importante. Le vrai sujet est de trouver le bon niveau d'abstraction pour les développeurs - et ça ne se décide pas dans un design doc. Nous l'avons découvert en travaillant avec les premières équipes et en affinant nos descripteurs de deploiment au fil des use cases.
- Liberté et garde-fous. Comment faire du « You build you run it » sans accès à la production dans un domaine aussi contraignant que la santé? Comment satisfaire les contraintes SRE pour garantir la scalabilité et la stabilité de la plateforme, tout en fournissant une interface simple a utiliser et qui permettent aux équipes de continuer à innover?
- L'avenir ? Un fichier YAML est une interface idéale pour un LLM. Le déploiment n'est plus un sujet. Mais de nombreux sujets restent ouverts. Comment faire évoluer la plateforme pour supporter de nouvelles technologies? Comment permettre aux équipes d'étre toujours plus autonome pour opérer leur services en production?
