Le projet de ce notebook a été réalisé dans le cadre de la formation d'ingénieur machine learning proposé par Openclassrooms.
Il portait sur les développement d'une API de suggestion de tags à destination des utilisateur de Stack Overflow. Il a étét l'occasion de mettre en oeuvre des méthodes de NLP. Ce repository porte sur le développement de l'API poru rpondre au besoin. Un second repository contient les travaux de déploiement de l' API et sa mettre en production
Il était demandé de réaliser:
- Fitrage des données issue de l'API stackexchange explorer
- Réaliser le pétraitement des documents
- Comparer des approches suppervisées (Logistic Regression, Random Forest, Passive aggressif classifier) et non supervisées (NMF,LDA) afin de prédire des tags
- Réaliser les fonctions et classes nécessaire à l'implémentation de l'API.
- Développer une API et la mettre en production
- Un notebook d'exploration des données.
- Un notebook de pré-traitement des documents et d'entrainement des modèles supervisés et non supervisés.
- Un rapport de synthèse des travaux réalisés
- Une présentation sous forme de diapositives