Le projet de ce notebook a été réalisé dans le cadre de la formation d'ingénieur machine learning proposé par Openclassrooms.
Il portait sur la l'entrainement de modèles destinés à prédire la consommation d'énergie et les émission de CO2 de bâtiments de la ville de Seattle aux Etats Unis.
Il était demandé de réaliser:
- Le nettoyage et l'exploration des données.
- Construire des variables explicatives afin de favoriser l'apprentissage des modèles de machine learning (feature engineering).
- Entraîner différentes familles de modèles de machine learning
- Sélectionner le / les meilleurs modèles et définir les hyperparamètres permettant d'atteindre les meilleures performances
- Déterminer si la variable ENERGYSTARScore, coûteuse à calculée, est nécessaire pour l'entraînement des modèles.
- Un notebook de nettoyage et l'exploration des données et de construction de variables
- Un notebook présentant l'entraînement des modèles.
- Une présentation de synthèse.