Northeastern University
Entreposage et Intégrité des données Partie 1

Débloquez l'accès à plus de 10 000 cours avec Coursera Plus. Essai gratuit de 7 jours.

Northeastern University

Entreposage et Intégrité des données Partie 1

Venkat Krishnamurthy

Instructeur : Venkat Krishnamurthy

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Compétences que vous acquerrez

  • Catégorie : Entreposage de données
  • Catégorie : Architecture des données
  • Catégorie : Intégration de données
  • Catégorie : Data mining
  • Catégorie : Data Mart
  • Catégorie : Bases de données relationnelles
  • Catégorie : Informatique décisionnelle
  • Catégorie : Analyse des Données
  • Catégorie : Modélisation des données
  • Catégorie : Conception de la base de données
  • Catégorie : Extraction, transformation, chargement (ETL)
  • Catégorie : Qualité des données
  • Catégorie : SQL
  • Catégorie : Gouvernance de données
  • Catégorie : Schéma en étoile

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

août 2025

Évaluations

13 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 7 modules dans ce cours

Ce module présente l'Entreposage de données et l'Informatique décisionnelle, en mettant l'accent sur leur rôle dans l'amélioration de la prise de décision au sein de l'organisation. Les entrepôts de données transforment les données brutes en informations exploitables à l'aide de processus tels que l'ETL (Extraction, Transformation et Chargement), soutenus par des outils tels que l'OLAP pour l'interrogation et l'exploration des données. Alors que les bases de données opérationnelles (OLTP) sont adaptées aux transactions quotidiennes, les bases de données OLAP sont optimisées pour les analyses complexes.

Inclus

3 vidéos6 lectures1 devoir

Ce module s'appuie sur les bases de la conception de bases de données du module précédent, en se concentrant sur la modélisation des bases de données relationnelles, la normalisation et le langage SQL. Les lectures vous guideront dans la traduction d'un diagramme conceptuel EER en un modèle relationnel, en assurant l'adhésion aux principes de normalisation et en visant la Troisième Forme Normale (3NF). Nous mettrons également l'accent sur la compréhension des clés primaires et des clés étrangères pour maintenir l'intégrité des données et établir les relations entre les tables. Vous aurez également l'occasion de créer et de critiquer des modèles relationnels. Nous explorerons ensuite les bases du langage SQL, couvrant la syntaxe (SELECT, INSERT, UPDATE, DELETE), les techniques d'interrogation (WHERE, ORDER BY, JOIN), et les opérations impliquant des fonctions et des agrégats (COUNT, SUM, AVG, MIN, MAX), qui sont fondamentales dans l'interrogation et la gestion des bases de données.

Inclus

3 lectures2 devoirs1 élément d'application

Ce module propose une introduction aux concepts d'entrepôt de données. Les entrepôts de données sont basés sur un modèle multidimensionnel. Nous examinerons de près le modèle multidimensionnel et sa représentation sous forme de cubes de données (également connus sous le nom d'hypercubes). Nous examinerons comment les différents aspects des données sont classés en faits, mesures et dimensions. Les dimensions telles que le produit, le temps et le client sont organisées de manière hiérarchique au sein d'un cube, ce qui permet d'analyser les données à différents niveaux de détail. Les mesures telles que la quantité et le montant des ventes sont stockées dans ces cubes, et les analystes peuvent naviguer à travers différents niveaux de détail en utilisant les techniques de "rolling up" et de "drilling down". Nous explorerons également des concepts clés tels que la granularité, le schéma de dimension et les hiérarchies de membres, qui sont essentiels pour comprendre comment les données sont structurées et analysées dans les modèles multidimensionnels. Enfin, nous apprendrons à utiliser des techniques telles que la disjonction, l'exhaustivité et l'exactitude pour garantir l'exactitude et l'intégrité des données lors de l'agrégation des données dans les cubes de données, ce que l'on appelle collectivement la résumabilité.

Inclus

2 vidéos5 lectures2 devoirs1 élément d'application

Dans ce module, nous allons explorer la modélisation conceptuelle avec des modèles multidimensionnels, visualisés à l'aide de MultiDim. Cette approche nous aide à organiser les données en faits et dimensions et à comprendre les relations entre eux, ce qui est essentiel pour concevoir des entrepôts de données. Nous explorerons plus en détail des sujets tels que les dimensions (par exemple, la date, le client) et les mesures (par exemple, la quantité, les ventes totales). Nous étudierons également la différence entre les événements primaires et les événements secondaires et apprendrons comment ils sont utilisés. Enfin, nous examinerons une autre catégorisation des mesures en flux : les mesures de niveau et les mesures unitaires.

Inclus

2 vidéos4 lectures3 devoirs

Dans ce module, nous allons nous plonger dans la modélisation conceptuelle des hiérarchies au sein des entrepôts de données, en explorant leurs définitions, leurs caractéristiques et leur importance. Les hiérarchies équilibrées ont une structure uniforme où chaque enfant a un parent et où toutes les branches ont la même longueur, ce qui rend l'analyse des données cohérente et efficace. En revanche, les hiérarchies déséquilibrées présentent des longueurs de branches variables et des niveaux d'agrégation manquants, ce qui permet de modéliser avec souplesse des scénarios réels tels que les catégories de produits et les hiérarchies géographiques. Vous découvrirez également les hiérarchies généralisées, qui impliquent des relations "is-a" entre les super-types et les sous-types, permettant une représentation détaillée des données mais exigeant une gestion minutieuse de l'agrégation et de la spécialisation. Nous explorerons également des hiérarchies alternatives, présentant différentes façons d'organiser la même dimension, telles que les vues calendaires et fiscales du temps. Enfin, nous étudierons les hiérarchies parallèles, indépendantes et dépendantes, en tant qu'outils d'analyse des données à partir de perspectives multiples, représentant des structures organisationnelles complexes. La compréhension de ces types de hiérarchie est cruciale pour une gestion et une analyse efficaces des données dans l'Entrepôt de données.

Inclus

4 vidéos3 lectures2 devoirs

Dans ce module, vous explorerez la modélisation logique dans l'Entrepôt de données, qui est le processus de conception d'une représentation structurée et abstraite des données à stocker, en mettant l'accent sur la façon dont les données sont organisées, liées et optimisées pour une interrogation et une analyse efficaces. En vous appuyant sur ce que vous avez appris dans les modules précédents, vous passerez à l'étape suivante de la conception d'un entrepôt de données : la traduction d'un modèle conceptuel en un modèle logique à mettre en œuvre. Le module se concentrera sur la représentation relationnelle des entrepôts de données, y compris l'étude de diverses implémentations de schémas : étoile, flocon de neige, flocon étoilé et constellation. Vous examinerez également les règles de mise en correspondance d'un modèle conceptuel multidimensionnel avec un modèle relationnel, en soulignant le rôle et l'importance des différents types de clés dans ce processus. Nous aborderons également les stratégies de maintien de la cohérence dans un entrepôt de données. Enfin, vous découvrirez comment pré-remplir certaines dimensions, comme le temps, afin de rationaliser les opérations et d'améliorer les performances des requêtes.

Inclus

6 vidéos11 lectures2 devoirs1 élément d'application

La modélisation d'un entrepôt de données est un processus complexe qui nécessite de passer de modèles conceptuels de haut niveau à des modèles logiques détaillés. Cette transition est essentielle car elle permet de combler le fossé entre la compréhension des besoins de l'entreprise et leur traduction dans un cadre technique qui prend efficacement en charge ces besoins. Dans ce module, vous développerez le processus de modélisation logique abordé dans le module précédent, en vous concentrant plus particulièrement sur la conception de modèles dimensionnels et sur les subtilités de la modélisation hiérarchique. Au fur et à mesure que vous approfondirez vos connaissances, vous découvrirez la modélisation logique pour des concepts avancés tels que les dimensions de plusieurs à plusieurs, les liens entre les faits et les faits à granularités multiples. Nous explorerons également le concept des dimensions à changement lent (SCD), qui sont essentielles pour la gestion des données historiques dans votre entrepôt. Vous apprendrez à mettre en œuvre différents types de SCD pour suivre et gérer avec précision les changements dans les données de dimension au fil du temps. Enfin, nous aborderons SQL pour OLAP, en nous concentrant sur des concepts avancés tels que l'agrégation et les fonctions de fenêtre, et vous apprendrez à utiliser SQL pour interroger et analyser les entrepôts de données.

Inclus

5 vidéos11 lectures1 devoir

Instructeur

Venkat Krishnamurthy
Northeastern University
3 Cours451 apprenants

Offert par

En savoir plus sur Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions