Tout ce qu’il faut savoir à propos du machine learning sur les données structurées (tabulaires) :

  • préparation de données structurées
  • arbres de décision et forêts aléatoires
  • feature engineering : caractéristiques importantes, redondantes, dépendance partielle, fuites de données, extrapolation
  • interprétation : confiance, explication des prédictions
  • ensembles : bagging, boosting, gradient boosting machines
  • réseaux de neurones, réutilisation des embeddings

Notebook :

https://github.com/laurentprudhon/cours-deeplearning-2020/blob/master/notebooks/07_tabular.ipynb

Tableau :

https://github.com/laurentprudhon/cours-deeplearning-2020/blob/master/whiteboard/tableau_07.png

Lien vidéo YouTube :

Vidéo session #07