Ingénieur Senior DevOps & Infrastructure de plateforme

Je construis l'infrastructure
sur laquelle tournent les villes.

Et je la construis souveraine — une infrastructure que vous possédez vraiment, open source de bout en bout, sans dépendance aux hyperscalers ni verrouillage propriétaire.

Infrastructure bare-metal en propre · Linux + Kubernetes + GitOps · 100 000+ capteurs IoT en production · zéro verrouillage fournisseur

Je suis Belhadj Kessas. Je conçois et j'exploite une infrastructure numérique que les organisations possèdent vraiment — Linux, Kubernetes et GitOps sur du bare-metal qu'elles contrôlent, open source depuis le noyau. La preuve phare : l'un des plus grands déploiements Smart City municipaux de France, à Montpellier Méditerranée Métropole, au service de 500 000+ citoyens — 100 000+ capteurs IoT en production sur la qualité de l'air, la gestion des déchets, le comptage eau et énergie, et la mobilité. Pas un pilote, pas une démo. Une ville bien réelle, qui tourne sur une infrastructure qu'elle possède.

Montpellier, France · CKA — Certified Kubernetes Administrator, en cours (CNCF, 2026)

100,000+ capteurs IoT en production
500,000+ citoyens desservis par la plateforme
100% open source, maîtrisé de bout en bout
0 dépendance aux hyperscalers
4 clusters Kubernetes, pilotés en GitOps
1 min d'une gateway muette à l'alerte déclenchée

Possédé, pas loué

Sorti du cloud, sur une infrastructure que nous possédons

J'ai sorti cette plateforme du cloud managé — de conteneurs Docker sur des VMs louées vers une architecture multi-cluster entièrement on-premise et pilotée par GitOps, que l'organisation possède en propre. Un choix de souveraineté délibéré : les données vivent sur une infrastructure que nous contrôlons, chaque changement est auditable dans Git, et toute la stack est open source, depuis le noyau Linux.

Aujourd'hui, c'est quatre clusters Kubernetes bare-metal dont chaque couche est déclarée dans Git. Un git push déclenche un runner auto-hébergé qui appelle l'API de l'hyperviseur et monte un cluster complet — RKE2, Cilium, MetalLB, ArgoCD — sans aucune étape manuelle. Détruisez-le, poussez à nouveau, et vous récupérez un cluster identique.

Aucune dépendance aux hyperscalers. Aucun verrouillage propriétaire. Une infrastructure que vous possédez, que vous pouvez auditer, et que vous pouvez opérer sans moi.

De l'edge au cloud

Une plateforme, du capteur au tableau de bord

production RKE2 sur VMware vSphere la charge réelle de la ville — 100k+ capteurs, chaque service aux citoyens
pré-production RKE2 sur Proxmox cible de promotion identique — les changements font leurs preuves ici d'abord
supervision RKE2 dédié 3 nœuds le substrat d'observabilité, sur son propre domaine de panne — détaillé plus bas
labo edge gpu Cluster Jetson Orin expérimentations d'inférence vision par ordinateur YOLO, scheduling GPU-aware — en route vers le MLOps sur matériel souverain

Livré en 2026

L'observabilité a son propre cluster

En 2026, j'ai livré une plateforme d'observabilité centralisée et multi-tenant sur un cluster dédié à trois nœuds : Mimir pour les métriques long terme et Loki pour les logs, tous deux adossés au stockage objet S3 Rook-Ceph. Des collecteurs Grafana Alloy en production et pré-production y font du remote-write, séparés en trois tenants isolés — production, pré-production, et le cluster de supervision qui se surveille lui-même. Un seul Grafana fédère toutes les sources.

Provisionné comme tout le reste — OpenTofu → Ansible → GitLab CI → RKE2 → ArgoCD — et alimenté par le trafic de production réel de 100 000+ capteurs.

Le point d'architecture, c'est la séparation des responsabilités : le substrat d'observabilité vit sur son propre cluster, donc perdre un cluster surveillé ne signifie jamais perdre la capacité de le voir.

Mon expertise

De la profondeur là où ça compte

Kubernetes & ingénierie de plateforme

Multi-cluster RKE2/Rancher sur bare-metal — production sur VMware vSphere, pré-production sur Proxmox. Pas de control plane managé, pas de dépendance cloud. MetalLB, Rook-Ceph, Cilium (eBPF), Envoy Gateway, Helm.

CKA en cours — CNCF, attendu 2026

GitOps & infrastructure as code

ArgoCD, GitLab CI/CD, OpenTofu, Terraform, Ansible. Cycle de vie complet en code : provisioning des clusters, déploiement applicatif, détection de dérive, promotion d'environnements. J'ai bâti une plateforme self-service où des partenaires externes déploient via Git sans jamais toucher aux internes des clusters.

Possédé, auditable, sans hyperscaler

IoT & réseaux à grande échelle

LoRaWAN de bout en bout à l'échelle urbaine : planification RF, déploiement de gateways, segmentation VLAN, un serveur réseau LoRaWAN multi-tenant sur Kubernetes. Provisioning automatisé des devices et mises à jour OTA pour une flotte de 100k+. Des pipelines edge-to-cloud qui survivent aux pannes partielles.

Observabilité & SRE

Conception d'une stack de télémétrie à deux niveaux partie de zéro — Zabbix à l'extérieur des clusters ; une plateforme Mimir + Loki centralisée et multi-tenant avec des collecteurs Grafana Alloy à l'intérieur, sur son propre cluster dédié. Des seuils de dégradation proactifs, pas des alarmes post-incident.

Détection en minutes, pas en jours

Programmation & émergent

Python (Django), Rust, Bash. Vision par ordinateur sur le labo edge GPU : expérimentations d'inférence YOLO sur un cluster Jetson Orin, scheduling Kubernetes GPU-aware. Prototypage d'un Kubeflow on-prem pour l'analyse de logs assistée par IA.

Des preuves, pas des promesses

Vérifiable indépendamment

Une minute, pas des jours
  1. T+0:00 Une gateway LoRa devient muette — coupure d'alimentation physique.
  2. T+1 min La supervision se déclenche. Pas quand les données des capteurs manquent — mais quand la gateway cesse de répondre.
  3. Même heure Un technicien est sur site et trouve la panne — résolue avant que le trou de données ne compte.
« La vraie mesure d'une plateforme d'observabilité, ce n'est pas le nombre d'incidents qu'elle aide à résoudre — c'est le nombre qu'elle prévient. »

Au-delà du travail

La radio, c'est la passion

Contact

Parlons-en.

Si vous construisez une infrastructure dont des gens dépendent — ou si vous voulez simplement parler radio et Kubernetes — j'aimerais avoir de vos nouvelles.

contact@belhadj.dev