Data Scientist & Ingénieur IA

Des enjeux métier à une IA en production.

Je conçois et déploie des applications IA, du cadrage à la mise en production. Vingt-deux ans d'ingénierie et une solide pratique de la donnée. Je combine rigueur technique, ancrage métier et sens de la pédagogie.

Disponible immédiatement
Lyon · France
NLP · Machine Learning · Audio & speech processing

Projets

Open source · 2026

Quelques réalisations qui résument ma pratique :

NLP & RAG

SmartWatch

Stable

juin 2025

Pipeline d'automatisation de mise à jour pour data.grandlyon.com. Exploite embeddings et LLM pour produire une sortie structurée et univoque.

Python LLM Web Scraping Embeddings NLP

Voir

NLP & RAG

ForzaEmbed

Stable

juil. 2025

Framework Python de benchmarking pour modèles d'embedding textuel : grid search sur les stratégies de chunking et métriques de similarité, avec heatmap textuelle et visualisations des espaces d'embeddings.

Python NLP Embeddings Benchmark RAG Chunking Open Source

Voir

Audio & speech processing

ASR.lab

Stable

oct. 2025

Plateforme d'évaluation comparative pour les systèmes de reconnaissance vocale automatique : dégradation, amélioration et normalisation contrôlées du signal audio, ainsi que comparaison entre plusieurs moteurs; avec des rapports interactifs.

ASR Benchmark Whisper Nemo Speech recognition

Voir

DevOps & monitoring

Veona

Bêta

mai 2026

Plateforme de supervision système : agent Go léger, serveur TypeScript/Hono, stockage time-series VictoriaMetrics et moteur ML intégré (anomalies, prévisions, score de santé).

Go TypeScript Monitoring VictoriaMetrics Time Series Machine Learning Docker

Voir

Audio & speech processing

StellaScript

Stable

sept. 2025

Pipeline Python de transcription audio local, avec diarisation des locuteurs, utilisable en temps réel (micro) ou sur fichier. Fonctionne sans accès internet après téléchargement des modèles.

Python Speech Processing WhisperX Diarization Pyannote SpeechBrain Open Source

Voir

Data visualization

Selma

Actif

avr. 2026

Application React/TypeScript pour visualiser et parcourir des taxonomies hiérarchiques et DAG dans un navigateur.

DAG TypeScript React Vite React Flow Tailwind i18n

Voir

AI training & mentoring

School of Statistics

Bêta

juin 2026

Visualisations interactives pour explorer les concepts de statistiques et d'apprentissage automatique.

TypeScript Statistiques Visualisation de données Chart.js D3.js

Voir

Audio & speech processing

FLAC Toolkit

Stable

oct. 2025

Un utilitaire en ligne de commande pour la validation de bas niveau, la réparation automatisée, la détection de doublons audio et la normalisation ReplayGain de fichiers FLAC.

Python Analyse Binaire Traitement Audio CLI Rapports HTML Interactifs RFC 9639 ReplayGain

Voir

AI training & mentoring

Immersion IA

Stable

juin 2025

Co-conception et animation d'ateliers de formation à l'IA. Production de ressources pédagogiques (livret de prompting, manuel de l'animateur) pour les agents de la Métropole de Lyon.

LLM Prompt Engineering Formation Pédagogie

Voir

Liens

Retrouvez ci-dessous mes différents réseaux professionnels, mes coordonnées ainsi que mon CV interactif.

LinkedIn ↗ in/berangerthomas

GitHub ↗ @berangerthomas

Hugging Face ↗ @berangerthomas

E-mail beranger.thomas@proton.me

CV interactif ↗ Curriculum vitæ en ligne