Ce cours dote les apprenants des compétences nécessaires pour appliquer et analyser des techniques avancées de traitement des données à l'aide de PySpark, l'API Python pour Apache Spark. Conçu pour les professionnels des données ayant des connaissances fondamentales de Python et de PySpark, le cours explore des cas d'utilisation du monde réel, notamment la segmentation de la clientèle, l'exploration de texte et la modélisation stochastique. Les apprenants commenceront par appliquer l'analyse RFM (Recency, Frequency, Monetary) et le regroupement K-Means pour segmenter les clients sur la base de modèles comportementaux. Le cours passe ensuite à l'extraction de données textuelles à partir d'images et de PDF en cours d'utilisation de la Reconnaissance Optique de Caractères (OCR) et des opérations DataFrame de PySpark. Enfin, les apprenants construiront et interpréteront des simulations Monte-Carlo pour modéliser la probabilité et l'incertitude dans des scénarios basés sur des données. Tout au long du cours, les étudiants participeront à des exercices pratiques, à des démonstrations en temps réel et à des quiz pratiques qui renforcent à la fois la compréhension conceptuelle et la compétence technique. À la fin de ce cours, les apprenants seront en mesure de développer des flux de données évolutifs et efficaces en utilisant PySpark pour l'informatique décisionnelle, l'analytique et la modélisation de simulations.


PySpark : Appliquer et analyser des traitements de données avancés
Ce cours fait partie de Spécialisation Spark et Python pour le Big data avec PySpark

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Appliquer l'analyse RFM et le regroupement K-moyennes pour la segmentation de la clientèle.
Extraire et analyser des données textuelles en cours d'utilisation d'OCR avec PySpark DataFrames.
Construire et interpréter des simulations de Monte-Carlo pour la modélisation de l'incertitude.
Compétences que vous acquerrez
- Catégorie : Analyse d'images
- Catégorie : Analyse des risques
- Catégorie : Traitement des données
- Catégorie : Big Data
- Catégorie : PySpark
- Catégorie : Analyse marketing
- Catégorie : Exploration de texte
- Catégorie : Simulation et logiciels de simulation
- Catégorie : Connaissance du client
- Catégorie : Transformation de données
- Catégorie : Modélisation statistique
- Catégorie : Data mining
- Catégorie : Apache Spark
- Catégorie : Modélisation prédictive
- Catégorie : Manipulation de données
- Catégorie : Données non structurées
- Catégorie : Analyse de la clientèle
- Catégorie : Analyse avancée
Détails à connaître

Ajouter à votre profil LinkedIn
août 2025
4 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a un module dans ce cours
Ce module présente aux apprenants les techniques avancées d'analytique des données en cours d'utilisation de PySpark, en se concentrant sur la segmentation de la clientèle, l'extraction de texte et la modélisation probabiliste. Les apprenants exploreront les mises en œuvre pratiques de l'analyse RFM, du clustering K-Moyennes, de la reconnaissance optique de caractères (OCR), de l'extraction de texte PDF et des simulations de Monte-Carlo. Grâce à des démonstrations pratiques et à des cas d'utilisation réels, les étudiants appliqueront les outils et les bibliothèques PySpark pour construire des solutions évolutives et axées sur les données dans des domaines tels que le marketing, l'exploration de texte et l'analyse des données.
Inclus
9 vidéos4 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Analyse des Données
Statut : PrévisualisationEdureka
Statut : Essai gratuit
Statut : Essai gratuitEdureka
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

