Apprendre le Machine Learning en 2020

Dans cet article, je vous présente le curriculum que je suivrai en 2020 si je devrais apprendre le Machine Learning.

Il faut avoir √©t√© dans un coma depuis 2015 pour ne jamais avoir entendu les mots Machine Learning, Deep Learning, Data Science, Big Data, Intelligence artificielle. Ces mots sont tellement apparus dans la presse que beaucoup sont ceux qui veulent apprendre les comp√©tences pour exercer ce m√©tier. Cette forte demande a conduit √† une masse de contenu de formation en Data Science. L’individu qui souhaite d√©sormais rentrer dans ce milieu est face √† une multitude de ressources, ce qui rend le choix compliqu√©. Tout faire √† la fois est impossible et pas du tout productif. Se construire un plan, un curriculum √† suivre reste la meilleure des choses √† faire. Apr√®s √™tre moi-m√™me pass√© par ces √©tapes je vous pr√©sente dans cet article, le curriculum que je me serais cr√©e si je devrais reprendre √† z√©ro aujourd’hui.

Ce curriculum comporte 4 points essentiels que sont :

  • Python
  • Analyse de donn√©es
  • Le Machine Learning
  • Le Deep Learning

Plan de lesson

A chaque partie de ce curriculum, je suggerai un seul livre qui pourrait aider √† acqu√©rir les comp√©tences requises. Pourquoi les livres et pas les Moocs ? Juste parce que je pr√©f√®re utiliser les livres pour l’apprentissage de concepts avanc√©s. Pourquoi un et pas plusieurs livres ? Le but de ce curriculum n’est pas d’apprendre tout ce qu’il faut savoir, mais plut√īt le n√©cessaire pour d√©buter sur des projets. Dans ce m√™me sens, vous n'√™tes pas tenu de finir chaque livre avant de passer au suivant et n’h√©sitez pas √† revenir sur une notion d√©j√† vu.

Python#

Pourquoi Python ? Pourquoi pas R ? Cette question a √©t√© pos√©e maintes fois. Une recherche “Python vs R " sur Google vous donnera assez d’articles qui en parlent et finissent pas conclure que Python est le langage le plus ad√©quat pour le machine learning. Python est facile √† apprendre, est versatile et est utilis√© par une large communaut√© de data scientists qui publie beaucoup de contenus pour aider les d√©butants √† commencer. Plusieurs librairies de Data Science sont √©galement √† l’origine de la c√©l√©brit√© de Python.

Quelles sont les bases de Python √† connaitre pour commencer l’apprentissage de la data science ? Pour ceux qui ont d√©j√† une exp√©rience en programmation avec un autre langage, il suffira d’apprendre la syntaxe de Python. Pour ceux qui n’ont pas d’exp√©rience en Python, il faudra apprendre dans l’ordre.

  • Les variables
  • Les Types de donn√©es en python
  • Les conditions et les boucles en python
  • Les fonctions et les modules
  • La manipulation des fichiers avec python
  • L’orient√© objet avec python

Le livre que je propose pour apprendre ces est le suivant : Automate the Boring stuff with Python. Ce livre est gratuit et même disponible directement sous forme de page web à cette adresse : https://automatetheboringstuff.com/ .

Automate the boring stuff

Une fois ces bases acquises, nous pouvons rentrer dans le vif su sujet.

Analyse de données#

A la fin de cette partie, vous √™tes cens√© √™tre capable d’importer des donn√©es de diff√©rents formats, les nettoyer, transformer √† votre guise afin de repondre √† des questions pertinentes avec des sch√©mas √† l’appuie. Cette partie aurait pu s’appeler Python pour la data Science. Dans un projet typique de Machine Learning, vous utiliserez les librairies suivantes 80% du temps. Dans l’ordre

  • Numpy pour le calcul scientifique
  • Pandas pour la manipulation des donn√©es
  • Matplotlib et Seaborn pour la visualisation des donn√©es

Le livre que je recommande pour cette partie est : Python Data Science Handbook. Comme le livre pr√©c√©dent, celui-ci est gratuit √©galement et disponible sous forme de page web √† l’adresse suivante : https://jakevdp.github.io/PythonDataScienceHandbook/

Le code de ce livre est disponible sur github sous forme de Jupyter notebooks sur le d√©p√īt suivant : https://github.com/jakevdp/PythonDataScienceHandbook

Python Data Science Handbook

Machine Learning#

Vous √™tes pr√™t pour l’apprentissage du Machine Learning. Ici vous allez apprendre les concepts du Machine Learning, les algorithmes utilis√©s et comment les impl√©menter avec la librairie scikit-learn. Le livre suivant vous apprendra √† cr√©er des mod√®les de Machine Learning et m√™me commencer √† comp√©tir dans des comp√©titions sur Kaggle.

Ce livre n’est pas gratuit mais le code est √©galement disponible sur github sous forme de jupyter notebooks sur le dep√īt suivant : https://github.com/amueller/introduction_to_ml_with_python

Introduction to Machine Learning with Python

Deep Learning#

Bienvenu √† la partie la plus interessante du Machine Learning : Le Deep Learning. En se basant sur les comp√©tences acquises pr√©c√©demment. Dans cette partie, vous apprendrez √† entrainer des mod√®les sur des images, du texte, la voix et plus. Le livre suivant est l’un des meilleurs sinon le meilleur que j’ai eu √† lire sur le Deep Learning. Dans la premi√®re partie du livre, vous pourrez rafraichir les notions en Machine Learning en ayant une meilleure compr√©hension des algorithmes utilis√©s. Dans le seconde partie, les bases du Deep learning et ses applications sont pr√©sent√©es avec une introduction √† Tensorflow 2.0.

Le code de ce livre est aussi disponible sur Github sous forme de jupyter notebooks dans le d√©p√īt suivant : https://github.com/ageron/handson-ml2

Handson Machine Learning with scikit-learn keras and Tensorflow

Conclusion#

Vous n’allez peut-√™tre pas finir tous les livres cit√©s dans cet article, c’est d’ailleurs la raison pour laquelle j’en ai s√©lectionn√© que 4. Mais vous aurez pris assez de choses pour r√©aliser d’interessants projets de Machine Learning et m√™me pr√©tendre √† un poste de Data Scientist.

Je suis conscient que le format Livre n’est pas la meilleure mani√®re d’apprendre pour tout le monde. Certains pr√©f√®rent les vid√©os et c’est tout √† fait normal. C’est pourquoi je pr√©senterai sur ma chaine Youtube des vid√©os tutoriels sur Python, le Machine Learning, Deep Learning et plus encore. Si tout cela vous interesse, abonnez-vous pour recevoir des notifications pour les prochaines vid√©os.

© 2021 Kevin Degila