Dans ce cours d'une heure basé sur un projet, vous apprendrez à construire un modèle de régression logistique en utilisant Pyspark MLLIB pour classer les patients comme diabétiques ou non diabétiques. Nous utiliserons le populaire Ensemble de données sur le diabète des Indiens Pima. Notre objectif est d'utiliser un classificateur de régression logistique simple de la bibliothèque d'apprentissage automatique pyspark pour la classification du diabète. Nous réaliserons l'ensemble du projet sur l'environnement Google Colab avec l'installation de Pyspark.Vous aurez besoin d'un compte Gmail gratuit pour réaliser ce projet. Vous aurez besoin d'un compte Gmail gratuit pour réaliser ce projet. Veuillez noter que le jeu de données et le modèle de ce projet ne peuvent pas être utilisés dans la vie réelle. A la fin de ce projet, vous serez capable de construire un classificateur de régression logistique en utilisant Pyspark MLlib pour classer les patients diabétiques et non diabétiques. Vous serez également capable de configurer et de travailler avec Pyspark dans l'environnement Google colab. En outre, vous serez en mesure de nettoyer et de préparer les données pour l'analyse. Vous devez être familier avec le langage de programmation Python et vous devez avoir une compréhension théorique de l'algorithme de Régression logistique. Vous aurez besoin d'un compte Gmail gratuit pour mener à bien ce projet. Remarque : ce cours fonctionne mieux pour les apprenants qui sont basés dans la région de l'Amérique du Nord. Nous travaillons actuellement à offrir la même expérience dans d'autres régions.

Débloquez l'accès à plus de 10 000 cours avec Coursera Plus. Essai gratuit de 7 jours.

(22 avis)
Ce que vous apprendrez
Apprendre à construire et à entraîner un classificateur de régression logistique en utilisant Pyspark MLLIB
Apprendre à configurer Pyspark sur l'environnement Google Colab
Apprendre à travailler avec Pyspark Dataframe
Compétences que vous pratiquerez
- Catégorie : Modélisation prédictive
- Catégorie : PySpark
- Catégorie : Apache Spark
- Catégorie : Science des données
- Catégorie : Apprentissage automatique appliqué
- Catégorie : Programmation en Python
- Catégorie : Traitement des données
- Catégorie : Nettoyage des données
- Catégorie : Google Cloud Platform
- Catégorie : Apprentissage automatique
- Catégorie : Arbre de classification et de régression (CART)
- Catégorie : Manipulation de données
Détails à connaître

Ajouter à votre profil LinkedIn
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel
- Renforcez votre confiance en utilisant les outils et technologies les plus récents

À propos de ce Projet Guidé
Apprendrez étape par étape
Votre enseignant(e) vous guidera étape par étape, grâce à une vidéo en écran partagé sur votre espace de travail :
Introduction et installation des dépendances
Cloner et explorer l'ensemble de données
Nettoyage et préparation des données
Analyse de corrélation et Sélection de caractéristiques
Diviser l'ensemble de données et construire le modèle de régression logistique
Évaluation de modèles et sauvegarde
Modélisation des données sur un nouvel ensemble de données non étiquetées
4 images de projet
Méthode d’apprentissage
Apprentissage pratique basé sur les compétences
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles.
Conseils d’experts
Suivez les vidéos pré-enregistrées d’experts à l’aide d’une interface unique, divisée en deux.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un espace de travail cloud préconfiguré.
Disponible uniquement sur ordinateur de bureau
Ce Projet Guidé est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?




Avis des étudiants
22 avis
- 5 stars
72,72 %
- 4 stars
13,63 %
- 3 stars
13,63 %
- 2 stars
0 %
- 1 star
0 %
Affichage de 3 sur 22
Révisé le 2 nov. 2022
Solid introduction to pyspark MLLib but left much would have liked to see more model evaluation and comparison to at least another model.
Révisé le 16 oct. 2021
Thank You for making course so simple to learn how to develop prediction model
Révisé le 21 août 2024
Understand the concept easily and practice it at the same time.
Vous aimerez peut-être aussi
Statut : Essai gratuit
Statut : Essai gratuit

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
En achetant un Projet Guidé, vous obtenez tout ce dont vous avez besoin pour terminer ce Projet Guidé, y compris l'accès à un espace de travail de bureau cloud, via votre navigateur web, qui contient les fichiers et les logiciels dont vous avez besoin pour commencer, ainsi que les instructions vidéo étape par étape d'un expert en la matière.
Comme votre espace de travail contient un bureau cloud dimensionné pour un ordinateur portable ou de bureau, les Projets Guidés ne sont pas disponibles sur votre appareil mobile.
Les enseignants des Projets Guidés sont des experts en la matière qui ont de l'expérience dans les compétences, les outils ou le domaine de leur projet et qui sont passionnés par le partage de leurs connaissances avec des millions d'étudiants dans le monde.




