Problématique
L'analyse brute de données de ventes historiques est souvent complexe et peu lisible pour les décideurs. L'objectif était de transformer un dataset massif de transactions (2003-2005) en une application web interactive permettant d'explorer visuellement les tendances, la géographie des ventes et la segmentation client sans aucune compétence technique préalable.
Ma Solution
J'ai développé une plateforme analytique modulaire basée sur Streamlit et Python.
Points forts techniques :
Traitement de données (ETL) : Utilisation de Pandas et NumPy pour le nettoyage, l'agrégation et la validation des données en temps réel.
Visualisation Interactive : Intégration de Plotly pour générer des graphiques dynamiques (Séries temporelles, Heatmaps géographiques, Analyse RFM).
Architecture Modulaire : Organisation du code en 4 couches (UI, Tabs, Utils, Config) pour garantir la maintenabilité et la réutilisabilité des composants.
Optimisation : Mise en place d'un système de cache performant pour fluidifier le chargement des données et la mise à jour instantanée des filtres.
Défis & Apprentissages
Le principal défi a été la mise en œuvre de la segmentation client (Analyse RFM) pour classifier automatiquement les profils acheteurs. J'ai également dû optimiser la gestion d'état de la session Streamlit pour permettre aux utilisateurs de naviguer entre 6 modules d'analyse (temporelle, géographique, comportementale, etc.) tout en conservant leurs filtres actifs. Ce projet a renforcé mon expertise en Data Pipeline et en architecture logicielle orientée données.