Ce cours de niveau intermédiaire permet aux apprenants d'appliquer, d'analyser et d'évaluer des modèles d'apprentissage automatique en utilisant le cadre de calcul distribué d'Apache PySpark. Conçu pour les professionnels des données familiers avec Python et les concepts de base de l'apprentissage automatique, le cours explore la mise en œuvre réelle des techniques de régression et de classification, ainsi que le clustering non supervisé. Dans le module 1, les apprenants construiront des modèles de régression linéaire et généralisée, appliqueront des régresseurs d'ensemble tels que les Forêts d'arbres, et évalueront la performance prédictive à l'aide de mesures telles que RMSE et R-carré. Le module se termine par un examen approfondi de la régression logistique pour les tâches de classification binaire. Le module 2 s'appuie sur ces fondations pour couvrir la classification multi-classes en utilisant la régression logistique multinomiale et les arbres décisionnels. Les apprenants évalueront également des modèles ensembliste comme les Forêts d'arbres décisionnels pour une classification robuste, et exploreront le clustering K-moyennes pour les problèmes d'apprentissage non supervisé. Chaque concept est renforcé par des démonstrations guidées de code PySpark, des flux de travail prédictifs et des évaluations pratiques utilisant de grands ensembles de données. À la fin du cours, les apprenants seront en mesure de concevoir, d'exécuter et d'évaluer de manière critique des modèles d'apprentissage automatique dans PySpark pour des solutions d'analytique des données évolutives.


PySpark : Appliquer et évaluer des modèles prédictifs de ML
Ce cours fait partie de Spécialisation Spark et Python pour le Big data avec PySpark

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Construire et évaluer des modèles de régression dans PySpark en utilisant des méthodes linéaires, GLM et d'ensemble.
Appliquer la régression logistique, les arbres décisionnels et les Forêts d'arbres décisionnels pour la classification.
Mettre en œuvre le clustering K-moyennes et évaluer les flux de travail ML évolutifs avec PySpark.
Compétences que vous acquerrez
- Catégorie : Apprentissage automatique appliqué
- Catégorie : Apprentissage non supervisé
- Catégorie : Algorithmes de classification
- Catégorie : Pipelines de données
- Catégorie : Évaluation de modèles
- Catégorie : Apache Spark
- Catégorie : Analyse prédictive
- Catégorie : Analyse de régression
- Catégorie : Algorithmes d'apprentissage automatique
- Catégorie : Arbre de décision
- Catégorie : Régression logistique
- Catégorie : Modélisation prédictive
- Catégorie : PySpark
- Catégorie : Algorithme de forêt aléatoire
Détails à connaître

Ajouter à votre profil LinkedIn
août 2025
7 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
Ce module présente aux apprenants les techniques fondamentales et avancées de modélisation de la régression à l'aide de la MLlib de PySpark. Les apprenants commencent par les flux de travail de régression linéaire de base, y compris la préparation des données, l'assemblage des caractéristiques et la prédiction. Ils progressent ensuite vers des modèles plus complexes tels que la Régression linéaire généralisée et les techniques d'ensemble comme la Régression Forêts d'arbres décisionnels. Le module se termine par des modèles de régression logistique conçus pour la classification binaire, permettant aux apprenants de construire et d'évaluer des pipelines d'apprentissage automatique évolutifs pour l'analytique prédictive dans des environnements distribués.
Inclus
11 vidéos4 devoirs
Ce module dote les apprenants de la capacité à construire, former et évaluer des modèles de classification et de clustering à l'aide de la bibliothèque d'apprentissage automatique de PySpark. Il couvre les applications pratiques de la régression logistique multinomiale pour les problèmes multi-classes, les classificateurs Arbre décisionnel pour les prédictions basées sur des règles, les méthodes d'ensemble comme les Forêts d'arbres décisionnels pour une meilleure généralisation, et les techniques de clustering non supervisées utilisant l'algorithme K-moyennes. Grâce à des démonstrations pratiques, les apprenants acquièrent des compétences dans la préparation des données, la configuration des modèles, l'interprétation des prédictions et l'évaluation des performances des modèles dans des environnements distribués à grande échelle.
Inclus
5 vidéos3 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Analyse des Données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuitEdureka
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

