Ce cours couvrira divers sujets de l'ingénierie des données à l'appui des systèmes d'aide à la décision, de l'analytique des données, de l'exploration des données, de l'apprentissage automatique et de l'intelligence artificielle. Vous étudierez l'architecture des entrepôts de données sur site, la modélisation dimensionnelle des entrepôts de données, l'intégration Extract-Transform-Load (ETL) des systèmes sources à l'entrepôt de données, les systèmes de traitement analytique en ligne (OLAP) et le monde en évolution de la qualité et de la gouvernance des données. Il vous offre la possibilité de concevoir, développer et maintenir des pipelines de données basés sur le cloud. Les plateformes sur site et basées sur le cloud seront utilisées pour illustrer et mettre en œuvre des techniques d'ingénierie des données à l'aide d'entrepôts de données opérationnels et analytiques.

Débloquez l'accès à plus de 10 000 cours avec Coursera Plus. Essai gratuit de 7 jours.


Compétences que vous acquerrez
- Catégorie : Entreposage de données
- Catégorie : Architecture des données
- Catégorie : Intégration de données
- Catégorie : Data mining
- Catégorie : Data Mart
- Catégorie : Bases de données relationnelles
- Catégorie : Informatique décisionnelle
- Catégorie : Analyse des Données
- Catégorie : Modélisation des données
- Catégorie : Conception de la base de données
- Catégorie : Extraction, transformation, chargement (ETL)
- Catégorie : Qualité des données
- Catégorie : SQL
- Catégorie : Gouvernance de données
- Catégorie : Schéma en étoile
Détails à connaître

Ajouter à votre profil LinkedIn
août 2025
13 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 7 modules dans ce cours
Ce module présente l'Entreposage de données et l'Informatique décisionnelle, en mettant l'accent sur leur rôle dans l'amélioration de la prise de décision au sein de l'organisation. Les entrepôts de données transforment les données brutes en informations exploitables à l'aide de processus tels que l'ETL (Extraction, Transformation et Chargement), soutenus par des outils tels que l'OLAP pour l'interrogation et l'exploration des données. Alors que les bases de données opérationnelles (OLTP) sont adaptées aux transactions quotidiennes, les bases de données OLAP sont optimisées pour les analyses complexes.
Inclus
3 vidéos6 lectures1 devoir
Ce module s'appuie sur les bases de la conception de bases de données du module précédent, en se concentrant sur la modélisation des bases de données relationnelles, la normalisation et le langage SQL. Les lectures vous guideront dans la traduction d'un diagramme conceptuel EER en un modèle relationnel, en assurant l'adhésion aux principes de normalisation et en visant la Troisième Forme Normale (3NF). Nous mettrons également l'accent sur la compréhension des clés primaires et des clés étrangères pour maintenir l'intégrité des données et établir les relations entre les tables. Vous aurez également l'occasion de créer et de critiquer des modèles relationnels. Nous explorerons ensuite les bases du langage SQL, couvrant la syntaxe (SELECT, INSERT, UPDATE, DELETE), les techniques d'interrogation (WHERE, ORDER BY, JOIN), et les opérations impliquant des fonctions et des agrégats (COUNT, SUM, AVG, MIN, MAX), qui sont fondamentales dans l'interrogation et la gestion des bases de données.
Inclus
3 lectures2 devoirs1 élément d'application
Ce module propose une introduction aux concepts d'entrepôt de données. Les entrepôts de données sont basés sur un modèle multidimensionnel. Nous examinerons de près le modèle multidimensionnel et sa représentation sous forme de cubes de données (également connus sous le nom d'hypercubes). Nous examinerons comment les différents aspects des données sont classés en faits, mesures et dimensions. Les dimensions telles que le produit, le temps et le client sont organisées de manière hiérarchique au sein d'un cube, ce qui permet d'analyser les données à différents niveaux de détail. Les mesures telles que la quantité et le montant des ventes sont stockées dans ces cubes, et les analystes peuvent naviguer à travers différents niveaux de détail en utilisant les techniques de "rolling up" et de "drilling down". Nous explorerons également des concepts clés tels que la granularité, le schéma de dimension et les hiérarchies de membres, qui sont essentiels pour comprendre comment les données sont structurées et analysées dans les modèles multidimensionnels. Enfin, nous apprendrons à utiliser des techniques telles que la disjonction, l'exhaustivité et l'exactitude pour garantir l'exactitude et l'intégrité des données lors de l'agrégation des données dans les cubes de données, ce que l'on appelle collectivement la résumabilité.
Inclus
2 vidéos5 lectures2 devoirs1 élément d'application
Dans ce module, nous allons explorer la modélisation conceptuelle avec des modèles multidimensionnels, visualisés à l'aide de MultiDim. Cette approche nous aide à organiser les données en faits et dimensions et à comprendre les relations entre eux, ce qui est essentiel pour concevoir des entrepôts de données. Nous explorerons plus en détail des sujets tels que les dimensions (par exemple, la date, le client) et les mesures (par exemple, la quantité, les ventes totales). Nous étudierons également la différence entre les événements primaires et les événements secondaires et apprendrons comment ils sont utilisés. Enfin, nous examinerons une autre catégorisation des mesures en flux : les mesures de niveau et les mesures unitaires.
Inclus
2 vidéos4 lectures3 devoirs
Dans ce module, nous allons nous plonger dans la modélisation conceptuelle des hiérarchies au sein des entrepôts de données, en explorant leurs définitions, leurs caractéristiques et leur importance. Les hiérarchies équilibrées ont une structure uniforme où chaque enfant a un parent et où toutes les branches ont la même longueur, ce qui rend l'analyse des données cohérente et efficace. En revanche, les hiérarchies déséquilibrées présentent des longueurs de branches variables et des niveaux d'agrégation manquants, ce qui permet de modéliser avec souplesse des scénarios réels tels que les catégories de produits et les hiérarchies géographiques. Vous découvrirez également les hiérarchies généralisées, qui impliquent des relations "is-a" entre les super-types et les sous-types, permettant une représentation détaillée des données mais exigeant une gestion minutieuse de l'agrégation et de la spécialisation. Nous explorerons également des hiérarchies alternatives, présentant différentes façons d'organiser la même dimension, telles que les vues calendaires et fiscales du temps. Enfin, nous étudierons les hiérarchies parallèles, indépendantes et dépendantes, en tant qu'outils d'analyse des données à partir de perspectives multiples, représentant des structures organisationnelles complexes. La compréhension de ces types de hiérarchie est cruciale pour une gestion et une analyse efficaces des données dans l'Entrepôt de données.
Inclus
4 vidéos3 lectures2 devoirs
Dans ce module, vous explorerez la modélisation logique dans l'Entrepôt de données, qui est le processus de conception d'une représentation structurée et abstraite des données à stocker, en mettant l'accent sur la façon dont les données sont organisées, liées et optimisées pour une interrogation et une analyse efficaces. En vous appuyant sur ce que vous avez appris dans les modules précédents, vous passerez à l'étape suivante de la conception d'un entrepôt de données : la traduction d'un modèle conceptuel en un modèle logique à mettre en œuvre. Le module se concentrera sur la représentation relationnelle des entrepôts de données, y compris l'étude de diverses implémentations de schémas : étoile, flocon de neige, flocon étoilé et constellation. Vous examinerez également les règles de mise en correspondance d'un modèle conceptuel multidimensionnel avec un modèle relationnel, en soulignant le rôle et l'importance des différents types de clés dans ce processus. Nous aborderons également les stratégies de maintien de la cohérence dans un entrepôt de données. Enfin, vous découvrirez comment pré-remplir certaines dimensions, comme le temps, afin de rationaliser les opérations et d'améliorer les performances des requêtes.
Inclus
6 vidéos11 lectures2 devoirs1 élément d'application
La modélisation d'un entrepôt de données est un processus complexe qui nécessite de passer de modèles conceptuels de haut niveau à des modèles logiques détaillés. Cette transition est essentielle car elle permet de combler le fossé entre la compréhension des besoins de l'entreprise et leur traduction dans un cadre technique qui prend efficacement en charge ces besoins. Dans ce module, vous développerez le processus de modélisation logique abordé dans le module précédent, en vous concentrant plus particulièrement sur la conception de modèles dimensionnels et sur les subtilités de la modélisation hiérarchique. Au fur et à mesure que vous approfondirez vos connaissances, vous découvrirez la modélisation logique pour des concepts avancés tels que les dimensions de plusieurs à plusieurs, les liens entre les faits et les faits à granularités multiples. Nous explorerons également le concept des dimensions à changement lent (SCD), qui sont essentielles pour la gestion des données historiques dans votre entrepôt. Vous apprendrez à mettre en œuvre différents types de SCD pour suivre et gérer avec précision les changements dans les données de dimension au fil du temps. Enfin, nous aborderons SQL pour OLAP, en nous concentrant sur des concepts avancés tels que l'agrégation et les fonctions de fenêtre, et vous apprendrez à utiliser SQL pour interroger et analyser les entrepôts de données.
Inclus
5 vidéos11 lectures1 devoir
Instructeur

Offert par
En savoir plus sur Analyse des Données
Statut : PrévisualisationNortheastern University
Statut : Essai gratuitUniversity of Colorado System
Statut : PrévisualisationNortheastern University
Statut : Essai gratuitUniversity of California, Irvine
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

