La meilleure université du monde, Harvard, offre des cours en ligne gratuit sur les domaines très recherchés que sont le Machine Learning, l’IA (Intelligence Artificielle) et la Data Science.
Cours en ligne d’Harvard sur le Machine Learning et l’IA avec Python
Dans ce cours, vous allez apprendre à utiliser les arbres de décision, l’algorithme fondamental pour comprendre l’apprentissage automatique et l’intelligence artificielle.
Ce que vous apprendrez
- Explorez les défis avancés de la science des données à travers des exemples de jeux de données, des arbres de décision, des forêts aléatoires et des modèles d’apprentissage automatique.
- Entraînez votre modèle à prédire la manière la plus efficace de résoudre un problème.
- Analysez les résultats d’apprentissage automatique, identifiez les biais dans les données et évitez le sous-apprentissage ou le surapprentissage.
- Acquérir les bases de l’utilisation des bibliothèques Python en apprentissage automatique et en intelligence artificielle, vous préparant ainsi à des études ultérieures en Python.
- Tirez parti de votre expérience en Python pour vous préparer à une carrière en science des données avancée.
Description du cours
Il est temps de choisir : plage ou montagne ? Choisir sa destination de vacances peut être simple : deux options, a ou b. Du point de vue de la prise de décision, le cerveau traite facilement ce type d’arbre de décision. Mais que se passe-t-il face à des décisions plus complexes et multidimensionnelles ? On pourrait dresser une liste exhaustive des avantages et des inconvénients, en classant les critères les plus importants par ordre d’importance. Cependant, cela peut s’avérer extrêmement chronophage. Pour analyser des milliers, voire des millions de données, votre organisation et vous-même devez adopter une approche plus sophistiquée.
La solution ? Exploiter la puissance de l’intelligence artificielle (IA) grâce à l’apprentissage automatique pour optimiser vos processus décisionnels. L’apprentissage automatique avec Python permet non seulement d’organiser les données, mais aussi d’apprendre aux machines à analyser et à tirer des enseignements d’ensembles de données hétérogènes : formuler des hypothèses, faire des prédictions et améliorer les décisions.
Dans le cours « Apprentissage automatique et intelligence artificielle avec Python », vous explorerez l’algorithme le plus fondamental pour comprendre l’apprentissage automatique : les arbres de décision. Le développement de vos compétences de base en apprentissage automatique vous permettra d’approfondir vos connaissances avec le bagging et les forêts aléatoires, puis avec des algorithmes plus complexes comme le gradient boosting.
À partir de cas concrets et d’exemples de données, vous examinerez les processus, définirez vos attentes, analyserez les résultats et mesurerez l’efficacité des techniques de la machine.
Tout au long de ce cours, vous assisterez à l’évolution des modèles d’apprentissage automatique, intégrant des données et des critères supplémentaires – testant vos prédictions et analysant les résultats au fur et à mesure afin d’éviter le surentraînement de vos données, d’atténuer le surapprentissage et de prévenir les résultats biaisés.
Mettez vos données à profit grâce à l’apprentissage automatique avec Python.
Détails de la formation
Durée : 6 semaines
Engagement en termes de temps : 4 à 5 heures par semaine
Rythme : À votre rythme
Crédit : Audit gratuit.
Cours en ligne d’Harvard sur la Data Science : Régression linéaire
Apprenez à utiliser R pour implémenter la régression linéaire, l’une des approches de modélisation statistique les plus courantes en science des données.
Durée : 15 octobre 2025 – 17 juin 2026
Détails de la formation
Durée : 8 semaines
Engagement en termes de temps : 1 à 2 heures par semaine
Rythme : À votre rythme
Crédit : Audit gratuit.
Ce que vous apprendrez
- Comment la régression linéaire a été initialement développée par Galton
- Qu’est-ce qui est source de confusion et comment le détecter ?
- Comment examiner les relations entre variables en implémentant une régression linéaire dans
Description du cours
La régression linéaire est couramment utilisée pour quantifier la relation entre deux variables ou plus. Elle permet également de corriger les biais de confusion. Ce cours, qui fait partie de notre programme de certificat professionnel en science des données, explique comment mettre en œuvre la régression linéaire et corriger les biais de confusion en pratique à l’aide du logiciel R.
En science des données, on s’intéresse fréquemment à la relation entre deux variables ou plus. L’étude de cas présentée dans ce cours porte sur l’approche basée sur les données utilisée pour construire les équipes de baseball, décrite dans le livre « Moneyball ». Nous tenterons de déterminer, par régression linéaire, quelles variables mesurées permettent de prédire au mieux les points marqués au baseball.
Nous examinerons également les facteurs de confusion, c’est-à-dire les situations où des variables parasites influencent la relation entre deux ou plusieurs autres variables, ce qui peut engendrer des associations fallacieuses. La régression linéaire est une technique puissante pour éliminer ces facteurs de confusion, mais elle n’est pas miraculeuse. Il est essentiel de savoir quand l’utiliser, et ce cours vous apprendra dans quels cas appliquer cette technique.