Béranger Thomas

Data Scientist & Ingénieur IA

Des enjeux métier à une IA en production.

Je conçois et déploie des applications IA, du cadrage à la mise en production. Vingt-deux ans d'ingénierie et une solide pratique de la donnée. Je combine rigueur technique, ancrage métier et sens de la pédagogie.

  • Disponible immédiatement
  • Lyon · France
  • NLP · Machine Learning · Audio & speech processing

Projets

Open source · 2026

Quelques réalisations qui résument ma pratique :

SmartWatch
NLP & RAG

SmartWatch

Stable
juin 2025

Pipeline d'automatisation de mise à jour pour data.grandlyon.com. Exploite embeddings et LLM pour produire une sortie structurée et univoque.

Python LLM Web Scraping Embeddings NLP
ForzaEmbed
NLP & RAG

ForzaEmbed

Stable
juil. 2025

Framework Python de benchmarking pour modèles d'embedding textuel : grid search sur les stratégies de chunking et métriques de similarité, avec heatmap textuelle et visualisations des espaces d'embeddings.

Python NLP Embeddings Benchmark RAG Chunking Open Source
ASR.lab
Audio & speech processing

ASR.lab

Stable
oct. 2025

Plateforme d'évaluation comparative pour les systèmes de reconnaissance vocale automatique : dégradation, amélioration et normalisation contrôlées du signal audio, ainsi que comparaison entre plusieurs moteurs; avec des rapports interactifs.

ASR Benchmark Whisper Nemo Speech recognition
Veona
DevOps & monitoring

Veona

Bêta
mai 2026

Plateforme de supervision système : agent Go léger, serveur TypeScript/Hono, stockage time-series VictoriaMetrics et moteur ML intégré (anomalies, prévisions, score de santé).

Go TypeScript Monitoring VictoriaMetrics Time Series Machine Learning Docker
StellaScript
Audio & speech processing

StellaScript

Stable
sept. 2025

Pipeline Python de transcription audio local, avec diarisation des locuteurs, utilisable en temps réel (micro) ou sur fichier. Fonctionne sans accès internet après téléchargement des modèles.

Python Speech Processing WhisperX Diarization Pyannote SpeechBrain Open Source
Selma
Data visualization

Selma

Actif
avr. 2026

Application React/TypeScript pour visualiser et parcourir des taxonomies hiérarchiques et DAG dans un navigateur.

DAG TypeScript React Vite React Flow Tailwind i18n
FLAC Toolkit
Audio & speech processing

FLAC Toolkit

Stable
oct. 2025

Un utilitaire en ligne de commande pour la validation de bas niveau, la réparation automatisée, la détection de doublons audio et la normalisation ReplayGain de fichiers FLAC.

Python Analyse Binaire Traitement Audio CLI Rapports HTML Interactifs RFC 9639 ReplayGain
Immersion IA
AI training & mentoring

Immersion IA

Stable
juin 2025

Co-conception et animation d'ateliers de formation à l'IA. Production de ressources pédagogiques (livret de prompting, manuel de l'animateur) pour les agents de la Métropole de Lyon.

LLM Prompt Engineering Formation Pédagogie