Projet : Optimisation pour l'Apprentissage Machine (MLSD-AMSD 2024/2025)

Projet : Optimisation pour l'Apprentissage Machine (MLSD-AMSD 2024/2025)

Présentation

Ce projet, réalisé dans le cadre du Master 1 MLSD-AMSD (Université Paris Cité) encadré par Lazhar Labiod, explore deux grandes thématiques clés en optimisation appliquée à l'apprentissage automatique :

Décomposition Matricielle (SVD) pour réorganisation et visualisation de données.
Comparaison de méthodes d'optimisation basées sur la descente de gradient et Newton sur différents jeux de données.

Objectifs

Implémenter et comparer la SVD classique et la méthode de la puissance itérée.
Visualiser des matrices de données réordonnées pour mieux interpréter leur structure interne.
Implémenter et évaluer plusieurs algorithmes d'optimisation (BGD, SGD, MiniBatch, Newton, Momentum, Nesterov, Adagrad, RMSProp, Adam, AdamW).
Tester la sensibilité aux hyperparamètres.

Structure du projet

Partie 1 : Décomposition Matricielle et Visualisation

Implémentation de la SVD par la méthode des puissances
Analyse de reconstruction de matrices
Vérification du théorème d'Eckart-Young
Comparaison entre vecteurs propres et vecteurs singuliers
Application de R1SVD pour réorganisation de matrices
Visualisation graphique des matrices réordonnées

Partie 2 : Optimisation pour la Régression Logistique

Implémentation from scratch de :
- Batch Gradient Descent (BGD)
- Stochastic Gradient Descent (SGD)
- Mini-Batch Gradient Descent
- Descente de gradient avec Momentum
- Nesterov Accelerated Gradient
- Newton Method
- Adagrad
- RMSProp
- Adam
- AdamW
Comparaison expérimentale sur 4 jeux de données :
- Haberman (peu d'exemples, peu de features)
- Sonar (peu d'exemples, beaucoup de features)
- Covertype (beaucoup d'exemples, beaucoup de features)
- Mushroom (beaucoup d'exemples, peu de features)
Sensibilité aux hyperparamètres
- Learning Rate
- Batch Size
- Momentum / Beta

Méthodologie Détaillée

SVD (Singular Value Decomposition) :
- Calcul par puissance itérée
- Reconstruction de matrices et mesure de l'erreur (Frobenius norm)
- Test du théorème d'Eckart-Young
- Application à la réorganisation de matrices de similarité
Optimisation de la Régression Logistique :
- Fonction Coût : Log Loss
- Descente avec diverses stratégies d'optimisation
- Évaluation par convergence du coût, temps d'exécution, stabilité
Analyse Expérimentale :
- Visualisation graphique (matplotlib, seaborn)
- Tableaux récapitulatifs (tabulate)

Installation

Prérequis Python >= 3.8 :

pip install numpy pandas matplotlib seaborn scikit-learn tqdm tabulate

Exécution

Ouvrir le projet dans Jupyter Notebook et exécuter les cellules dans l'ordre des sections.

jupyter notebook Projet_Opti_ML_24_FINAL.ipynb

Organisation des fichiers

Projet_Opti_ML_24_FINAL.ipynb
├── Partie 1 : SVD et Visualisation
│   ├── Décomposition Matricielle
│   ├── Reconstruction et Analyse d'erreurs
│   └— Réorganisation des matrices
├── Partie 2 : Optimisation de Modèles
    ├── Implémentation de 10 variantes d'optimisation
    └— Comparaison sur 4 datasets + Analyse de sensibilité

Auteurs

Bastien HOTTELET
Hamady GACKOU
Omar NAMOUS

Projet supervisé par Lazhar Labiod.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Projet_Opti_ML_24.html		Projet_Opti_ML_24.html
Projet_Opti_ML_24.ipynb		Projet_Opti_ML_24.ipynb
Projet_Opti_ML_24.pdf		Projet_Opti_ML_24.pdf
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet : Optimisation pour l'Apprentissage Machine (MLSD-AMSD 2024/2025)

Présentation

Objectifs

Structure du projet

Partie 1 : Décomposition Matricielle et Visualisation

Partie 2 : Optimisation pour la Régression Logistique

Méthodologie Détaillée

Installation

Exécution

Organisation des fichiers

Auteurs

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Projet : Optimisation pour l'Apprentissage Machine (MLSD-AMSD 2024/2025)

Présentation

Objectifs

Structure du projet

Partie 1 : Décomposition Matricielle et Visualisation

Partie 2 : Optimisation pour la Régression Logistique

Méthodologie Détaillée

Installation

Exécution

Organisation des fichiers

Auteurs

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages