Johns Hopkins University
Analyse de données en cours d'utilisation des outils Hadoop

Débloquez l'accès à plus de 10 000 cours avec Coursera Plus. Essai gratuit de 7 jours.

Johns Hopkins University

Analyse de données en cours d'utilisation des outils Hadoop

Karthik Shyamsunder

Instructeur : Karthik Shyamsunder

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Apprenez à mettre en place et à configurer Hive, Pig, HBase et Spark pour une analyse et un traitement efficaces des Big data au sein de l'écosystème Hadoop.

  • Maîtriser les requêtes de type SQL de Hive pour l'extraction, la gestion et l'optimisation des données en utilisant des partitions et des jointures pour améliorer les performances des requêtes.

  • Comprendre le Pig Latin pour scripter des transformations de données, y compris l'utilisation d'opérateurs tels que la jointure et le débogage pour traiter efficacement de grands ensembles de données.

  • Acquérir une expertise des bases de données NoSQL avec HBase pour les opérations de lecture/écriture en temps réel, et utiliser le modèle de programmation de base de Spark pour le traitement rapide des données.

Compétences que vous acquerrez

  • Catégorie : Gestion des données
  • Catégorie : SQL
  • Catégorie : Transformation de données
  • Catégorie : Apache Hadoop
  • Catégorie : Big Data
  • Catégorie : Langage de requête
  • Catégorie : Apache Spark
  • Catégorie : NoSQL
  • Catégorie : Traitement des données
  • Catégorie : Langages de script
  • Catégorie : Apache Hive
  • Catégorie : Manipulation de données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

15 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Traitement des Big data en cours d'utilisation Hadoop
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 5 modules dans ce cours

Ce cours offre une vue d'ensemble des outils clés de l'écosystème Hadoop, notamment Hive, Pig, HBase et Apache Spark. Vous apprendrez à mettre en place et à configurer ces technologies pour le traitement, la gestion et l'analyse des données. Le cours couvre l'exécution des requêtes de Hive, le langage de requête de Pig et les capacités NoSQL de HBase. Vous acquerrez également une expérience pratique avec le modèle de programmation de base de Spark pour un traitement efficace des Big data. À la fin, vous serez équipé pour tirer parti de ces outils pour une analyse et une gestion optimisées des données.

Inclus

2 lectures

Dans ce module, nous aborderons la programmation MapReduce à l'aide d'un langage de plus haut niveau appelé Hive qui traduit les requêtes de type SQL de Hive en MapReduce.

Inclus

9 vidéos7 lectures4 devoirs

Dans ce module, nous aborderons la programmation MapReduce à l'aide d'un langage de plus haut niveau appelé Pig qui traduit les requêtes Pig Latin en MapReduce.

Inclus

9 vidéos7 lectures4 devoirs

Dans ce module, nous commencerons par une introduction aux bases de données NoSQL, puis nous plongerons dans HBase, une base de données NoSQL construite au-dessus d'Hadoop qui permet un accès aléatoire en lecture/écriture en temps réel à vos Big data.

Inclus

8 vidéos3 lectures3 devoirs

Dans ce module, nous allons couvrir le moteur et le framework Spark et montrer comment il s'intègre sur la plateforme Hadoop.

Inclus

8 vidéos5 lectures4 devoirs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Karthik Shyamsunder
Johns Hopkins University
4 Cours1 133 apprenants

Offert par

En savoir plus sur Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions