Ce cours fournit un guide complet pour maîtriser l'ingénierie des données, où vous apprendrez à construire des pipelines de données robustes, à plonger dans les processus ETL (Extraction, Transformation, Chargement) et à gérer de grands ensembles de données à l'aide d'Hadoop. Vous acquerrez une expertise dans l'extraction de données à partir de diverses sources, leur transformation dans un format utilisable et leur chargement dans des entrepôts de données ou des plateformes big data. Grâce à une expérience pratique de Hadoop, le framework standard de l'industrie pour le traitement des ensembles de données massives, vous apprendrez à gérer et à traiter efficacement les ensembles de données massives. Que vous soyez un débutant ou un professionnel expérimenté, ce cours vous dote des compétences nécessaires pour concevoir, mettre en œuvre et gérer les pipelines de données, ce qui fait de vous un atout précieux dans toute organisation axée sur les données. Ce cours est idéal pour les ingénieurs de données en herbe, les développeurs de logiciels intéressés par le traitement des données et les professionnels de l'informatique qui cherchent à étendre leur expertise à l'ingénierie des données. Il convient également aux analystes commerciaux et autres professionnels qui cherchent une compréhension fondamentale des technologies de traitement des données pour améliorer les capacités de prise de décision et améliorer leurs rôles dans les environnements axés sur les données. Que vous commenciez votre voyage dans l'ingénierie des données ou que vous cherchiez à renforcer vos compétences existantes, ce cours vous fournira les connaissances et les outils dont vous avez besoin pour réussir. Pour tirer le meilleur parti de ce cours, vous devez avoir une compréhension de base des concepts de programmation et une certaine familiarité avec les systèmes de base de données. Une connaissance de base de la programmation Python et de SQL sera utile, ainsi qu'une compréhension des systèmes de bases de données relationnelles. Aucune expérience préalable avec Hadoop n'est requise, mais un vif intérêt pour le big data et l'analytique des données améliorera grandement votre expérience d'apprentissage. À la fin de ce cours, vous serez en mesure d'analyser l'architecture et les composants des pipelines de données et de comprendre leur impact sur le flux de données et l'efficacité du traitement. Vous apprendrez à mettre en œuvre des processus ETL robustes, évolutifs et faciles à maintenir, et vous serez équipé pour relever les défis du Big data en utilisant les outils de l'écosystème Hadoop, tels que HDFS, MapReduce, Hive, Pig et Spark. Ce cours vous préparera à concevoir, mettre en œuvre et gérer des solutions de données qui peuvent générer des idées significatives et soutenir la prise de décision stratégique dans n'importe quelle organisation.



Ingénieur de données : Pipelines, ETL, Hadoop
Ce cours fait partie de Spécialisation Construire des pipelines de données plus intelligents : SQL, Spark, Kafka & GenAI


Instructeurs : Soheil Haddadi
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Analyser l'architecture et les composants des pipelines de données pour comprendre leur impact sur le flux de données et l'efficacité du traitement.
Mettre en œuvre des processus ETL robustes, pour assurer l'évolutivité et la maintenabilité.
Analyser les défis du big data et présenter les outils de l'écosystème Hadoop (HDFS, MapReduce, Hive, Pig et Spark) pour les tâches de traitement des données.
Compétences que vous acquerrez
- Catégorie : Big Data
- Catégorie : Entreposage de données
- Catégorie : Transformation de données
- Catégorie : Évolutivité
- Catégorie : Qualité des données
- Catégorie : Traitement des données
- Catégorie : Prise de décision stratégique
- Catégorie : Pipelines de données
- Catégorie : Extraction, transformation, chargement (ETL)
- Catégorie : Intégration de données
- Catégorie : Apache Hadoop
- Catégorie : Analyse des Données
- Catégorie : Gestion des données
- Catégorie : Business Analytics
- Catégorie : Apache Hive
- Catégorie : Stratégie en matière de données
- Catégorie : Apache Spark
- Catégorie : Migration de données
Détails à connaître

Ajouter à votre profil LinkedIn
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a un module dans ce cours
Ce cours fournit un guide complet pour maîtriser l'ingénierie des données, où vous apprendrez à construire des pipelines de données robustes, à plonger dans les processus ETL (Extraction, Transformation, Chargement) et à gérer de grands ensembles de données à l'aide d'Hadoop. Vous acquerrez une expertise dans l'extraction de données à partir de diverses sources, leur transformation dans un format utilisable et leur chargement dans des entrepôts de données ou des plates-formes de big data.
Inclus
12 vidéos4 lectures4 devoirs1 sujet de discussion
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Offert par
En savoir plus sur Analyse des Données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.





