EDUCBA
PySpark : Appliquer et évaluer des modèles prédictifs de ML
EDUCBA

PySpark : Appliquer et évaluer des modèles prédictifs de ML

EDUCBA

Instructeur : EDUCBA

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Construire et évaluer des modèles de régression dans PySpark en utilisant des méthodes linéaires, GLM et d'ensemble.

  • Appliquer la régression logistique, les arbres décisionnels et les Forêts d'arbres décisionnels pour la classification.

  • Mettre en œuvre le clustering K-moyennes et évaluer les flux de travail ML évolutifs avec PySpark.

Compétences que vous acquerrez

  • Catégorie : Apprentissage automatique appliqué
  • Catégorie : Apprentissage non supervisé
  • Catégorie : Algorithmes de classification
  • Catégorie : Pipelines de données
  • Catégorie : Évaluation de modèles
  • Catégorie : Apache Spark
  • Catégorie : Analyse prédictive
  • Catégorie : Analyse de régression
  • Catégorie : Algorithmes d'apprentissage automatique
  • Catégorie : Arbre de décision
  • Catégorie : Régression logistique
  • Catégorie : Modélisation prédictive
  • Catégorie : PySpark
  • Catégorie : Algorithme de forêt aléatoire

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

août 2025

Évaluations

7 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Spark et Python pour le Big data avec PySpark
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours

Ce module présente aux apprenants les techniques fondamentales et avancées de modélisation de la régression à l'aide de la MLlib de PySpark. Les apprenants commencent par les flux de travail de régression linéaire de base, y compris la préparation des données, l'assemblage des caractéristiques et la prédiction. Ils progressent ensuite vers des modèles plus complexes tels que la Régression linéaire généralisée et les techniques d'ensemble comme la Régression Forêts d'arbres décisionnels. Le module se termine par des modèles de régression logistique conçus pour la classification binaire, permettant aux apprenants de construire et d'évaluer des pipelines d'apprentissage automatique évolutifs pour l'analytique prédictive dans des environnements distribués.

Inclus

11 vidéos4 devoirs

Ce module dote les apprenants de la capacité à construire, former et évaluer des modèles de classification et de clustering à l'aide de la bibliothèque d'apprentissage automatique de PySpark. Il couvre les applications pratiques de la régression logistique multinomiale pour les problèmes multi-classes, les classificateurs Arbre décisionnel pour les prédictions basées sur des règles, les méthodes d'ensemble comme les Forêts d'arbres décisionnels pour une meilleure généralisation, et les techniques de clustering non supervisées utilisant l'algorithme K-moyennes. Grâce à des démonstrations pratiques, les apprenants acquièrent des compétences dans la préparation des données, la configuration des modèles, l'interprétation des prédictions et l'évaluation des performances des modèles dans des environnements distribués à grande échelle.

Inclus

5 vidéos3 devoirs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

EDUCBA
EDUCBA
560 Cours167 410 apprenants

Offert par

EDUCBA

En savoir plus sur Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions