Ce cours de niveau intermédiaire permet aux apprenants d'appliquer, d'analyser et d'évaluer des modèles d'apprentissage automatique en utilisant le cadre de calcul distribué d'Apache PySpark. Conçu pour les professionnels des données familiers avec Python et les concepts de base de l'apprentissage automatique, le cours explore la mise en œuvre réelle des techniques de régression et de classification, ainsi que le clustering non supervisé. Dans le module 1, les apprenants construiront des modèles de régression linéaire et généralisée, appliqueront des régresseurs d'ensemble tels que les Forêts d'arbres, et évalueront la performance prédictive à l'aide de mesures telles que RMSE et R-carré. Le module se termine par un examen approfondi de la régression logistique pour les tâches de classification binaire. Le module 2 s'appuie sur ces fondations pour couvrir la classification multi-classes en utilisant la régression logistique multinomiale et les arbres décisionnels. Les apprenants évalueront également des modèles ensembliste comme les Forêts d'arbres décisionnels pour une classification robuste, et exploreront le clustering K-moyennes pour les problèmes d'apprentissage non supervisé. Chaque concept est renforcé par des démonstrations guidées de code PySpark, des flux de travail prédictifs et des évaluations pratiques utilisant de grands ensembles de données. À la fin du cours, les apprenants seront en mesure de concevoir, d'exécuter et d'évaluer de manière critique des modèles d'apprentissage automatique dans PySpark pour des solutions d'analytique des données évolutives.

PySpark : Appliquer et évaluer des modèles prédictifs de ML

PySpark : Appliquer et évaluer des modèles prédictifs de ML
Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Construire et évaluer des modèles de régression dans PySpark en utilisant des méthodes linéaires, GLM et d'ensemble.
Appliquer la régression logistique, les arbres décisionnels et les Forêts d'arbres décisionnels pour la classification.
Mettre en œuvre le clustering K-moyennes et évaluer les flux de travail ML évolutifs avec PySpark.
Compétences que vous acquerrez
- Catégorie : Logistic Regression
- Catégorie : Regression Analysis
- Catégorie : Decision Tree Learning
- Catégorie : Predictive Analytics
- Catégorie : Machine Learning Algorithms
- Catégorie : Applied Machine Learning
- Catégorie : Predictive Modeling
- Catégorie : Data Pipelines
- Catégorie : Model Evaluation
- Catégorie : Random Forest Algorithm
- Catégorie : Unsupervised Learning
Outils que vous découvrirez
- Catégorie : Apache Spark
- Catégorie : PySpark
- Catégorie : Classification Algorithms
Détails à connaître

Ajouter à votre profil LinkedIn
7 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

En savoir plus sur Analyse des Données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,





