Portfolio

Autres projets

Projets réalisés en solo. Ils contiennent principalement pipelines data, data visualisation, gouvernance appliquée et intelligence artificielle.

SNCF Data Observatory — Data Quality Monitor (en cours...)

Avr 2026
Data EngineeringData GovernanceFastAPINext.jsPythonLangChainDuckDB
Voir le projet

Pipeline temps réel d'ingestion de données ferroviaires SNCF (GTFS-RT Protobuf) traitant 1 400+ trains toutes les 2 minutes. Architecture Medallion Bronze/Silver/Gold sur DuckDB, cadre de gouvernance DAMA-DMBOK complet (Data Catalog, Data Contracts, Data Lineage, Quality Score), et agent IA conversationnel permettant d'interroger 10 ans de données en langage naturel.

Livrables clés

Pipeline GTFS-RT temps réel — 1 400+ trains · cycle 2 minArchitecture Medallion DuckDB — Bronze / Silver / GoldCadre Gouvernance DAMA-DMBOK — Data Catalog · Lineage · SLAAPI REST FastAPI — 14 endpoints + WebSocketDashboard Next.js 4 pages — Live · Historique · Gouvernance · CarteAgent IA SQL — LangChain · Llama 3.3 70B · 10 801 enregistrements

FinanceDataHub — Plateforme de Gouvernance Data & IA

Avr 2026
Data GovernanceBCBS 239DAMA-DMBOKEU AI ActNext.jsTypeScriptZustandRecharts
Voir le projet

Simulation complète d'une mission de conseil en gouvernance Data & IA pour FrontierBank (banque fictive sous surveillance BCE). Le site couvre l'intégralité du périmètre d'un consultant data senior : diagnostic de maturité DAMA-DMBOK, framework de gouvernance & RACI, Data Catalog, Data Quality KPIs, Data Lineage bout en bout, IA Governance EU AI Act et rapport Comex. Programme interactif en 6 phases — les métriques, la conformité BCBS 239 et les modèles IA évoluent dynamiquement à chaque phase.

Livrables clés

Diagnostic maturité DAMA-DMBOK — 8 domaines · Score 1.0 → 4.0/5Framework Gouvernance — RACI · Politiques · Comité DG · 6 rôles dataData Catalog — Glossaire 30 termes · 21 datasets Snowflake certifiésData Quality — 4 KPIs · BCBS 239 14 principes · Plans de remédiationData Lineage SVG — 20 systèmes · 21 flux · Coverage 0% → 100%IA Governance — Registre 5 modèles · EU AI Act · Drift monitoringRapport Comex — Budget 2.4M€ · ROI 3.2x · Synthèse exécutiveSélecteur 6 phases — évolution dynamique de toutes les métriques

Finance Digital Audit Dashboard — CAC40

Avr 2026
Data EngineeringMachine LearningFastAPINext.jsPythonPlotlyCI/CD
Voir le projet

Pipeline data end-to-end sur 10 entreprises du CAC40 : ingestion automatisée via API financière (yfinance), ETL Python, détection d'anomalies financières par Isolation Forest (scikit-learn), dashboard interactif Next.js/Plotly et génération automatique de rapports PDF d'audit. Déployé en production avec CI/CD GitHub Actions.

Livrables clés

Pipeline ETL Python — 10 entreprises CAC40Modèle ML Isolation Forest — 8 ratios financiersDashboard 3 vues : P&L, Anomalies, ComparaisonAPI REST FastAPI — 5 endpointsExport PDF automatiqueCI/CD GitHub Actions + Render + Vercel

BCBS239 Data Governance — Cadre réglementaire bancaire

Fév 2026
BCBS239Data GovernanceFinanceReporting
Voir le projet

Réalisation d'un diagnostic complet du dispositif data avec une approche orientée pilotage financier et performance métier. Analyse des écarts de gouvernance et de conformité, structuration du cadre data : data lineage, définition des rôles (Data Owner / Steward) et mise en place de contrôles.

Livrables clés

Diagnostic data completData lineage documentéRôles Data Owner/StewardContrôles de conformité

Customer Experience Intelligence — Analyse & Data Visualisation

Fév 2026
Power BIKPIData VizAnalyse clients
Voir le projet

Analyse de données clients pour identifier insights, tendances et anomalies impactant la performance. Conception de dashboards interactifs Power BI et mise en place de KPI pour le pilotage métier. Restitution de visualisations claires et exploitables afin d'aider à la prise de décision.

Livrables clés

Dashboards Power BIKPI métierAnalyse des tendancesRapport d'insights

Programme de Gouvernance des Données Critiques

Fév 2026
Data GovernanceRACIData QualityFeuille de route
Voir le projet

Conception et déploiement d'un cadre de gouvernance Data sur un périmètre critique (incidents & performance). Diagnostic de maturité Data & IA, modèle de gouvernance fédéré à l'échelle transverse, formalisation des rôles avec matrice RACI, cadre Data Quality avec KPI et SLA, feuille de route Data priorisée.

Livrables clés

Diagnostic maturité Data & IAMatrice RACI complèteCadre Data Quality (KPI/SLA)Feuille de route priorisée

AI for Kuala Lumpur — Data & IA Decision Platform

Mar 2026
IAData urbainePipelinePrédictif
Voir le projet

Conception d'une plateforme data permettant d'analyser des données urbaines complexes afin de faciliter la prise de décision stratégique. Collecte, structuration et exploitation de données multi-sources (API, datasets ouverts) avec une logique de pipeline data automatisé. Implémentation de cas d'usage IA (analyse prédictive, génération d'insights).

Livrables clés

Plateforme data urbainePipeline multi-sourcesAnalyse prédictiveDashboard décisionnel

CryptoBot — Data Engineering Pipeline

Oct 2025
PythonSQLETLAPITemps réel
Voir le projet

Conception d'un pipeline data complet (API → ingestion → stockage SQL → visualisation) permettant l'exploitation de données en quasi temps réel. Nettoyage, transformation et structuration des données pour garantir leur qualité, cohérence et exploitabilité. Développement d'indicateurs exploitables pour le suivi de performance.

Livrables clés

Pipeline API → SQLIngestion temps réelNettoyage & transformationIndicateurs de performance