Dans ce cours d'une heure basé sur un projet, vous apprendrez à construire un modèle de régression linéaire à l'aide de Pyspark ML pour prédire l'admission des étudiants à l'université. Nous utiliserons le jeu de données d'admission aux études supérieures 2 de Kaggle. Notre objectif est d'utiliser un Algorithme d'Apprentissage Automatique de Régression linéaire simple de la bibliothèque d'apprentissage automatique Pyspark pour prédire les chances d'être admis. Nous allons réaliser l'ensemble du projet sur l'environnement Google Colab avec l'installation de Pyspark. Vous aurez besoin d'un compte Gmail gratuit pour réaliser ce projet. Veuillez noter que les données et le modèle utilisés dans ce projet ne peuvent pas être utilisés dans la vie réelle. A la fin de ce projet, vous serez capable de construire un modèle de régression linéaire en utilisant Pyspark ML pour prédire les chances d'admission. Vous serez également capable de configurer et de travailler avec Pyspark dans l'environnement Google Colab. En outre, vous serez également en mesure de nettoyer et de préparer les données pour l'analyse.Vous devez être familier avec le langage de programmation Python et vous devez avoir une compréhension théorique de l'algorithme de Régression linéaire.

Prédiction de l'admission aux études supérieures avec Pyspark ML

Prédiction de l'admission aux études supérieures avec Pyspark ML

Instructeur : Priya Jha
1 702 déjà inscrits
Inclus avec
(34 avis)
Ce que vous apprendrez
Apprendre à construire le modèle de régression linéaire en utilisant Pyspark ML pour prédire l'admission
Apprendre à configurer Pyspark et à travailler avec les dataframes de Pyspark dans l'environnement Colab
Apprendre à nettoyer et à préparer les données pour l'analyse.
Compétences que vous pratiquerez
- Catégorie : Analyse des données
- Catégorie : Analyse de régression
- Catégorie : Prétraitement des données
- Catégorie : Modélisation prédictive
- Catégorie : Traitement des données
- Catégorie : Nettoyage des données
- Catégorie : Big Data
- Catégorie : Manipulation de données
- Catégorie : Apprentissage automatique appliqué
- Catégorie : Apprentissage automatique
Outils que vous utiliserez
- Catégorie : PySpark
- Catégorie : Apache Spark
Détails à connaître

Ajouter à votre profil LinkedIn
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel
- Renforcez votre confiance en utilisant les outils et technologies les plus récents

À propos de ce Projet Guidé
Apprendrez étape par étape
Votre enseignant(e) vous guidera étape par étape, grâce à une vidéo en écran partagé sur votre espace de travail :
Introduction et installation des dépendances
Cloner et explorer l'ensemble de données
Nettoyage des données
Analyse de corrélation et Sélection de caractéristiques
Construire le modèle de régression linéaire
Évaluer et tester le modèle
4 images de projet
Méthode d’apprentissage
Apprentissage pratique basé sur les compétences
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles.
Conseils d’experts
Suivez les vidéos pré-enregistrées d’experts à l’aide d’une interface unique, divisée en deux.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un espace de travail cloud préconfiguré.
Disponible uniquement sur ordinateur de bureau
Ce Projet Guidé est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
79,41 %
- 4 stars
11,76 %
- 3 stars
5,88 %
- 2 stars
2,94 %
- 1 star
0 %
Affichage de 3 sur 34
Révisé le 9 août 2022
Great walkthrough w good explanations of the concepts used.
Révisé le 25 août 2021
Straightforward tutorial of how to use pyspark for a simple machine learning task.








