Deep Learning 2020 #07 - Données structurées (ML)
Septième session de la formation Deep Learning par la pratique 2020.
Tout ce qu’il faut savoir à propos du machine learning sur les données structurées (tabulaires) :
- préparation de données structurées
- arbres de décision et forêts aléatoires
- feature engineering : caractéristiques importantes, redondantes, dépendance partielle, fuites de données, extrapolation
- interprétation : confiance, explication des prédictions
- ensembles : bagging, boosting, gradient boosting machines
- réseaux de neurones, réutilisation des embeddings
Notebook :
https://github.com/laurentprudhon/cours-deeplearning-2020/blob/master/notebooks/07_tabular.ipynb
Tableau :
https://github.com/laurentprudhon/cours-deeplearning-2020/blob/master/whiteboard/tableau_07.png
Lien vidéo YouTube :