Description de l'offre
Lieu : à Paris La Défense
Durée et/ou période du stage : De janvier / Septembre 2024
En tant que stagiaire, vous serez intégré(e) au sein du Département développement logiciel (100 personnes) ET participerez aux projets concernant l’acquisition, la gestion, et la structuration de la donnée LiDAR à Rte. Ces adaptations reposent en partie sur une digitalisation innovante, et c’est pour cette raison que Rte a mis en place une nouvelle équipe dédiée au développement logiciel.
Parmi ses missions : définir les bonnes pratiques pour un code efficace et maintenable mais aussi appuyer les autres équipes sur des missions plus spécifiques nécessitant des développements rigoureux, lors de phases de faisabilité ou sur des sujets nouveaux comme le machine/deep learning.
Contexte :
Les politiques publiques en France, en Europe et dans le monde, impactent le système énergétique en profondeur. En particulier, le réseau électrique est amené à jouer un rôle prépondérant pour relever les défis de la transition énergétique.
Le réseau français a été construit et est entretenu par EDF puis Rte. La construction du réseau ayant été rythmée par deux vagues - sur la période de l’après-guerre puis pendant la construction du parc nucléaire - le renouvellement du réseau va devoir absorber ces deux pics. Aussi parmi les différentes options, Rte a développé des capacités de collecte de données LiDAR pour mieux observer sont réseau et donc assurer une maintenance plus fine, le tout en utilisant les vols de routine de ses hélicoptères. Une chaîne de traitement semi-automatisée est déployée et permet de traiter les données et de les transformer afin de les mettre à disposition des différents métiers de l’entreprise.
Ces données sont volumineuses mais très précieuses puisqu’elles permettent d’avoir une vision instantanée et informatisée des différents éléments de l’infrastructure du réseau, ainsi que leur environnement proche, ce qui permet entre autres d’estimer si un entretien est nécessaire sous les lignes ou sur la ligne.
Parmi les briques disponibles dans la chaîne en production, deux nous intéressent en particulier : classification et vectorisation. La première permet la classification automatique des points LiDAR. Parmi les différentes classes, certaines sont standards et utilisée par d’autres acteurs de la cartographie comme l’IGN (végétation, bâtiments…), d’autres sont spécialisées pour identifier les infrastructures électriques (pylône, câble, chaîne d’isolateurs…). La seconde permet de vectoriser les différents câbles.
En parallèle de cette chaîne d’acquisition, une importante base de données LiDAR réelles, labellisées et vérifiées manuellement est disponible en version classifiée et vectorisée, ce qui permet d’envisager une utilisation par des algorithmes d’apprentissage automatique.
Missions :
L’enjeu du stage est de proposer des modèles concurrents (dits challengers) aux deux modèles de classification et de vectorisation utilisés. Le sujet regroupant ainsi plusieurs problématiques consistantes, il est envisagé de scinder le sujet pour plusieurs stagiaires sur la partie classification et sur la partie vectorisation.
Pour ce faire le stagiaire pourra s’appuyer d’abord sur les personnes, ressources et connaissances internes, mais aussi sur l’importante communauté du point cloud (Open3D ML), sur le framework PyTorch (Open3D ML, torch points3d, …), ainsi que sur les liens entre Rte et l’équipe datascience de l’IGN qui travaille sur des sujets similaires. Il ne s’agira pas de redévelopper un modèle ou une architecture en particulier mais plutôt d’adapter les modèles existants aux spécificités du cas d’usage Rte / réseau électrique français.
Les étapes du stage seront classiques pour du deep learning :
- Analyser et prendre en main les données disponibles et les problématiques sur le sujet
- Proposer rapidement une chaîne permettant d’obtenir un premier modèle (sélection de données, nettoyage, preprocessing, entraînement, métriques de sortie).
- Faire une veille sur les modèles existants et proposer des modèles réentrainés sur les données de Rte.
- Intégrer le modèle dans un algorithme et mettre le modèle en mode « production ».
- Au regard des résultats, analyser et proposer un workflow permettant le meilleur compromis action manuelle/automatisation maximisant le taux de réussite.
Il sera possible d’intégrer les travaux sur une chaîne de MLOps selon l’avancement du stage.