Je suis data scientist passionné par l’Intelligence Artificielle, avec une formation en informatique et en mathématiques. Je suis actuellement data scientist en alternance chez Dassault Systèmes SE à Vélizy-Villacoublay, où je développe des outils d’IA aidant les développeurs à corriger automatiquement leur code grâce aux grands modèles de langage.
Expériences professionnelles
Data Scientist en alternance — Dassault Systèmes SE
Août 2021 – aujourd’hui · Vélizy-Villacoublay, France
Projet R&D pour corriger automatiquement les bugs de code avec l’IA (grands modèles de langage) :
- État de l’art sur la correction automatique de code (approches deep learning).
- Pipelines de collecte massive de données (Spark, HDFS, Hive).
- Exploration, analyse et prétraitement des données (ex. représentation par arbres syntaxiques abstraits).
- Modèles de ML proposant des corrections (Seq2Seq, Graph Neural Networks, Transformers : GPT, BERT, T5).
- Évaluation et comparaison des modèles sur des données de production réelles.
- Intégration des modèles dans les chaînes DevOps de production (web service pour un plugin IDE).
- Communication et présentation des résultats aux clients.
Stagiaire Analyse d’images & support statistique — Enza Zaden France
Mai 2021 – Août 2021 · Stage de 3 mois (à distance)
- Analyse d’images par segmentation et reporting statistique en R.
- Application d’algorithmes de ML sur les caractéristiques extraites pour la prédiction.
- Optimisation des temps d’exécution et déploiement de la solution sur le cloud (Azure).
Formation
- Master Intelligence Artificielle, Systèmes, Données (alternance) — Université Paris Dauphine – PSL, Paris · 2022–2023
- Master Data Science (alternance) — Université Paris-Saclay, Orsay · 2021–2022
- Licence 3, Informatique & Mathématiques de la décision et des données — Université Paris Dauphine – PSL, Paris · 2020–2021
- Cycle préparatoire en informatique (Bac +2) — ESI – École Nationale Supérieure d’Informatique, Alger · 2018–2020
Compétences
Python · TensorFlow · Keras · PyTorch · HuggingFace · Google Cloud Platform · Spark · SQL