Prochaines sessions
Programme
Introduction
- C’est quoi le Machine Learning ?
- L’environnement R pour le Machine Learning
- Comment structurer un projet de Machine Learning
Les essentiels de la manipulation de données en R
- Le tidyverse
- dplyr et tidyr pour manipuler les données
- Les cinq verbes fondamentaux
- Vue d’ensemble des packages fondamentaux en R
- Cas pratique
Analyse de Données Exploratoire (EDA)
- Exploration d’un jeu de données
- Visualisation de données à l’aide de ggplot2
- Comment repérer les valeurs aberrantes
- Comment changer le type des variables
- Cas pratique
Créer un modèle de Machine Learning
- Les modèles supervisés et non-supervisés
- Classification vs Régression
- Systèmes de recommandation
- Le premier modèlede régression : La régression linéaire
- Le premier modèle de classification : Le k-NN
- Cas pratique
Évaluer un modèle de Machine Learning
- Le sur-apprentissage et le sous-apprentissage
- Spliter un jeu de données en entraînement et en test
- Comment effectuer une validation croisée
- Les différentes métriques en classification
- Les différentes métriques en régression
- Cas pratique
Les algorithmes de classification
- La régression logistique
- Les arbres de classification
- Les forêts aléatoires
- Les SVM
- Les SVM à noyau
- Comparatif et récapitulatif
Les algorithmes de régression
- La régression ridge, LASSO, et Elastic net
- Les arbres de régression
- Les forêts aléatoires
- Comparatif et récapitulatif
Communiquer les résultats
- Enregistrer un modèle
- Créer une application Shiny