0% ont trouvé ce document utile (0 vote)

670 vues14 pages

Modélisation Multidimensionnelle et Cubes

Ce chapitre introduit les concepts de base de la modélisation multidimensionnelle comme les cubes de données, les dimensions, les faits et les hiérarchies. Il présente également les opérations possibles sur les cubes ainsi que les schémas de conception logique comme l'étoile, le flocon et la constellation.

Transféré par

SYNCLAIR CANTELOUR

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

670 vues14 pages

Modélisation Multidimensionnelle et Cubes

Transféré par

SYNCLAIR CANTELOUR

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 3 : Modélisation multidimensionnelle

Objectifs spécifiques
 Comprendre les concepts du modèle de données
multidimensionnel
 Introduire les opérateurs sur des cubes
multidimensionnels
 Introduire les schémas de Conception logique

3.1. Concept de base de la modélisation multidimensionnelle

La modélisation multidimensionnelle consiste à considérer un sujet analysé comme un
point dans un espace à plusieurs dimensions. Les données sont organisées de manière à
mettre en évidence le sujet analysé et les différentes perspectives de l'analyse.

Cette conception est basé sur un modèle multi-dimensionnel des données qui voit les
données sous la forme d’un data cube (cube de données)

3.1.1 La notion de dimension

Un Data cube : permet de modéliser et visualiser les données selon différentes dimensions ;
les dimensions constituent donc les points de vue depuis lesquels les données peuvent être
observées

Chaque dimension est représentée par une table

• Ex : Localisation (ville, département, pays, région),

Produit (article, type,catégorie),

Date (jour, semaine, mois, trimestre, année)

3.1.2. La notion de fait

Le thème central est représenté par une table de faits. Cette table de faits contient les
valeurs des mesures et des clés vers les tables de dimensions
- La valeur d’une mesure est le résultat d’une opération d’agrégation des données

• Ex : montant_ventes, quantité_vendue

– Les clés des tables de dimension sont en général construites automatiquement

3.1.3 La notion de cuboïde

L’ensemble des valeurs d’une mesure pour une combinaison de valeur des dimensions
constitue un cuboïde

Exemple :

Entrepôt de données des ventes électroniques d’une société.

• Montants des ventes sur l’année par type d’article, par ville et par mois

• Une valeur est associée à chaque combinaison type – ville – mois

→Dimensions : Produit (type), Localisation (ville) et Date (mois)

3.1.4 Notion de Cube de

données Un Cube est un treillis
de cuboïdes.

Exemple :
3.1.5 Notion de dimensions multi-niveaux
Pour chaque dimension, on définit différents niveaux d’abstraction / spécialisation

Lors du processus OLAP, les données sont généralement analysées en partant d'un faible
niveau de détail vers des données plus détaillées pour "forer vers le bas". Pour définir ces
différents niveaux de détail, chaque dimension est munie d'une (ou plusieurs) hiérarchie(s)
de paramètres.

La hiérarchie représentée par les tables de dimensions :

-sert lors des analyses pour restreindre ou accroître les niveaux de détail de l'analyse

organise les paramètres d'une dimension conformément à leur niveau de détail. Ces

paramètres seront donc ordonnés par une relation hiérarchique "est_plus_fin"

On définit donc la granularité d’une dimension comme étant le nombre de niveaux

d’abstraction
Exemple :

3.1.6 Hiérarchies de concepts d’une dimension

Un Concept est une valeur correspondant à un niveau d’abstraction

Exemple : dimension Localisation

3.2. Opérations sur le data cube

Considérons l’exemple cuboïde suivant ; nous pouvons y effectuer plusieurs Opérations de
manipulation interactive des cuboïdes
3.2.1 Opération Slice
Elle consiste en une sélection sur une dimension du cube –

Ex : 3ème trimestre sur la dimension Date pour visualiser

les ventes par Localisation et Produit durant ce trimestre

3.2.2 L’opération Dice
Elle consiste en la définition d’un sous-cube par sélection sur deux (ou plus)dimensions –
Ex : critère (Localisation = Paris v Rome) et (Date = 1er trimestre v 2èmetrimestre) et
(Produit = Informatique v Téléphonie)

3.2.3 L’opération Pivot

Elle permet une présentation alternative du cube

– Transformation en une série de plans 2D

– Renversement du cube sur un ou plus axes pour une vision alternative • Ex :

renversement sur l’axe Date

3.2.4 L’opération Roll-up
Elle permet une généralisation du cube ; elle consiste à :

– Supprimer une dimension ou

– Remonter dans une hiérarchie de concepts d’une

dimension

• Ex : remonter du niveau

Trimestre au niveau

Semestre pour Date

3.2.5 L’opération Drill-down
Elle a pour rôle la spécialisation du cube. Elle consiste à

– Ajouter une dimension • Ex : dimension TypeClient

– Descendre dans une hiérarchie de concepts

• Ex : descendre du niveau Catégorie au niveau Type pour Produit

3.3. Conception d’un entrepôt de données
3.3.1 Approches de Conception
❖ Il existe trois types d’approches : Approche haut-bas, bas-haut ou une
combinaison des deux :

– Haut-bas : débuter par le planning et la conception du modèle (mature)

– Bas-haut : débuter par des essais et des prototypes (rapide)

❖ Du point de vue de l’ingénierie du logiciel ceci consiste à appliquer les modèles

de cycle de vie suivants :

– Cascade : analyse structurée et systématique lors de chaque étape avant de passer à la

– Spirale : génération rapide de systèmes fonctionnels croissants; modifications rapides et

adaptation du modèle facile

❖ Le Processus de conception d’un entrepôt de données inclut les étapes suivantes

– Choix du processus à modéliser, ex : commandes, ventes, livraison

– Choix du grain (niveau de détail des données) pour le processus

– Choix des dimensions pour chaque table de faits

- Choix des mesures stockées dans les tables de faits

3.3.2 Schéma Conceptuel d’un entrepôt de données

La conception d’un entrepôt de données un modèle au niveau logique qui soit concis et
orienté sujet différent donc du modèle entités-relations. Trois types de schéma existent :

[Link] Schéma en étoile

Caractéristiques du schéma en étoile :

• structure simple utilisant le modèle entité-relation

• une entité centrale : la table des faits :

• objets de l'analyse

• taille très importante

• nombreux champs

• des entités périphériques : les tables de dimensions :

• dimensions de l'analyse

• taille peu importante

• peu de champs
Exemple 1 : Ventes de médicaments dans des pharmacies
Schéma en étoile modélisant les analyses des quantités et des montants des médicaments
dans les pharmacies selon 3 dimensions : le temps, la catégorie et la situation géographique

• Table de faits : Vente

• Tables de dimension : Temps, Catégorie, Géographie

Exemple 2 : Ventes d"articles dans un supermarché

Associé à l’exemple 2 :

un fait

• il a été acheté 3 exemplaires à 1 euro

• du produit pid3

• par le client cid1

• à la date did3

• dans le magasin mid2

• dans le chariot cid8

• correspondant à la promotion prid1

un élément de la dimension location :

• store id mid2

• store name rondpoint

• city blois

• region centre

• country France

[Link] Schéma en flocon

Un modèle en flocon est une évolution du schéma en étoile avec :

• une décomposition des dimensions du modèle en étoile en sous hiérarchies.

• le fait est conservé et les dimensions sont éclatées conformément à sa hiérarchie

des paramètres

• cela conduit à une normalisation des tables de dimensions : structure hiérarchique

des dimensions et un niveau inférieur identifie un niveau supérieur

Les avantages de cette modélisation sont:

• formaliser une hiérarchie au sein d'une dimension.

• maintenance des tables de dimensions simplifiée

• réduction de la redondance
Les inconvénient de cette modélisation :

• induit une dénormalisation des dimensions générant une plus grande complexité en
termes de lisibilité et de gestion.

• navigation coûteuse
Exemple : Ventes de médicament dans des pharmacies
Chaque dimension du schéma en étoile précédent est dénormalisée, formant ainsi une sorte
de flocon

[Link] Schéma en constellation

Peut-être vu comme une collection d’étoiles (schéma en galaxie ou constellation de faits)

Un modèle en constellation :

• fusionne plusieurs modèles en étoile qui utilisent des dimensions communes.

• comprend en conséquence plusieurs faits et des dimensions communes ou non

Exemple : Ventes de médicament dans des pharmacies

• une constellation est constituée de 2 schémas en étoile :

- l'un correspond aux ventes effectuées dans les pharmacies et

- l'autre analyse les prescriptions des médecins

les dimensions Temps et Geographie sont partagées par les faits Prescriptions et
Vente.

Vous aimerez peut-être aussi

Modélisation de Datawarehouses commerciaux
100% (1)
Modélisation de Datawarehouses commerciaux
2 pages
Entrepôt de données et opérations OLAP
Pas encore d'évaluation
Entrepôt de données et opérations OLAP
2 pages
Opérations OLAP : Roll-up, Drill-down, Dice
100% (1)
Opérations OLAP : Roll-up, Drill-down, Dice
20 pages
Exercice sur Cube OLAP et SQL
100% (2)
Exercice sur Cube OLAP et SQL
4 pages
Définition et fonctionnement du datawarehouse
Pas encore d'évaluation
Définition et fonctionnement du datawarehouse
12 pages
Analyse des Ventes en Entrepôt de Données
75% (4)
Analyse des Ventes en Entrepôt de Données
2 pages
Entrepôts de données et OLAP en Big Data
100% (1)
Entrepôts de données et OLAP en Big Data
3 pages
Modélisation de Datawarehouses en TD
100% (1)
Modélisation de Datawarehouses en TD
3 pages
Entrepôt de données et OLAP en BI
100% (4)
Entrepôt de données et OLAP en BI
2 pages
Modélisation d'un entrepôt de données BI
Pas encore d'évaluation
Modélisation d'un entrepôt de données BI
8 pages
Exercice ETL en Data Warehouse
100% (3)
Exercice ETL en Data Warehouse
2 pages
Modélisation Datawarehouse 2011-2012
100% (2)
Modélisation Datawarehouse 2011-2012
5 pages
Modélisation d'un Data Warehouse
100% (1)
Modélisation d'un Data Warehouse
5 pages
Exercices sur l'Entrepôt de Données OLAP
100% (3)
Exercices sur l'Entrepôt de Données OLAP
3 pages
Analyse OLAP et Modélisation DWH
Pas encore d'évaluation
Analyse OLAP et Modélisation DWH
6 pages
Modèle en étoile pour les ventes
Pas encore d'évaluation
Modèle en étoile pour les ventes
2 pages
Approches des entrepôts de données ED
100% (1)
Approches des entrepôts de données ED
3 pages
Cours sur les Entrepôts de Données
100% (1)
Cours sur les Entrepôts de Données
46 pages
Modélisation en étoile des data warehouses
Pas encore d'évaluation
Modélisation en étoile des data warehouses
31 pages
Signification de TD en Business Intelligence
Pas encore d'évaluation
Signification de TD en Business Intelligence
3 pages
Modélisation d'un entrepôt de données BI
100% (1)
Modélisation d'un entrepôt de données BI
8 pages
Modèles en étoile en BI: Travaux dirigés
100% (1)
Modèles en étoile en BI: Travaux dirigés
6 pages
Introduction à SSIS et création de packages
Pas encore d'évaluation
Introduction à SSIS et création de packages
21 pages
Data Warehouse et Systèmes Multidimensionnels
80% (5)
Data Warehouse et Systèmes Multidimensionnels
22 pages
Contrôle Continu Data Mining MIT 2023
Pas encore d'évaluation
Contrôle Continu Data Mining MIT 2023
3 pages
Structure du Datawarehouse et DataMarts
Pas encore d'évaluation
Structure du Datawarehouse et DataMarts
2 pages
Modélisation d'un entrepôt de données
100% (3)
Modélisation d'un entrepôt de données
8 pages
Entrepôts de données et OLAP : Guide
Pas encore d'évaluation
Entrepôts de données et OLAP : Guide
64 pages
Intégration de données avec Talend
Pas encore d'évaluation
Intégration de données avec Talend
11 pages
Création d'un Cube OLAP avec Pentaho
Pas encore d'évaluation
Création d'un Cube OLAP avec Pentaho
36 pages
Introduction aux entrepôts de données
Pas encore d'évaluation
Introduction aux entrepôts de données
66 pages
TP sur Pig et Hive dans Hadoop
100% (1)
TP sur Pig et Hive dans Hadoop
3 pages
Concepts clés du Data Warehouse
Pas encore d'évaluation
Concepts clés du Data Warehouse
17 pages
Analyse des Sommations de Ventes
100% (1)
Analyse des Sommations de Ventes
8 pages
Modèle de données et entrepôts analytiques
100% (1)
Modèle de données et entrepôts analytiques
8 pages
Cours sur les Entrepôts de Données
Pas encore d'évaluation
Cours sur les Entrepôts de Données
83 pages
Exercices corrigés en informatique décisionnelle
100% (1)
Exercices corrigés en informatique décisionnelle
2 pages
Examen de Business Intelligence 2022
100% (2)
Examen de Business Intelligence 2022
3 pages
Réponses à l'épreuve de BI
100% (2)
Réponses à l'épreuve de BI
4 pages
Installation de Pentaho sur Mac et Windows
Pas encore d'évaluation
Installation de Pentaho sur Mac et Windows
6 pages
Entrepôt de données et opérations OLAP
Pas encore d'évaluation
Entrepôt de données et opérations OLAP
2 pages
Requêtes MDX pour Data Warehouse
100% (1)
Requêtes MDX pour Data Warehouse
46 pages
Modélisation Dimensionnelle en BI
Pas encore d'évaluation
Modélisation Dimensionnelle en BI
10 pages
Requêtes MDX pour Entrepôts de Données
100% (2)
Requêtes MDX pour Entrepôts de Données
6 pages
Entrepôt de données : Analyse des ventes et RH
100% (2)
Entrepôt de données : Analyse des ventes et RH
4 pages
Introduction à la technologie OLAP
Pas encore d'évaluation
Introduction à la technologie OLAP
43 pages
Modèles d'Entrepôts de Données en Exercice
100% (2)
Modèles d'Entrepôts de Données en Exercice
7 pages
QCM sur l'Informatique Décisionnelle
100% (3)
QCM sur l'Informatique Décisionnelle
38 pages
Modélisation multidimensionnelle des données
Pas encore d'évaluation
Modélisation multidimensionnelle des données
109 pages
Modélisation Multidimensionnelle en BI
Pas encore d'évaluation
Modélisation Multidimensionnelle en BI
16 pages
Chapitre 4 New
Pas encore d'évaluation
Chapitre 4 New
41 pages
Modélisation Dimensionnelle et Schémas
Pas encore d'évaluation
Modélisation Dimensionnelle et Schémas
65 pages
Modélisation d'un entrepôt de données
Pas encore d'évaluation
Modélisation d'un entrepôt de données
10 pages
Modélisation Multidimensionnelle des Données
Pas encore d'évaluation
Modélisation Multidimensionnelle des Données
52 pages
Conception d'un Entrepôt de Données 2024-2025
Pas encore d'évaluation
Conception d'un Entrepôt de Données 2024-2025
33 pages
Guide complet sur le Datawarehouse
Pas encore d'évaluation
Guide complet sur le Datawarehouse
6 pages
Modélisation Dimensionnelle des DW
Pas encore d'évaluation
Modélisation Dimensionnelle des DW
59 pages
Exercices sur l'entrepôt de données BI
100% (1)
Exercices sur l'entrepôt de données BI
9 pages
Modélisation Multidimensionnelle en BI
Pas encore d'évaluation
Modélisation Multidimensionnelle en BI
72 pages
2 Représentation Des Données Multidimensionnelles Version 2
Pas encore d'évaluation
2 Représentation Des Données Multidimensionnelles Version 2
33 pages
Rattrapage Sécurité Matérielle et Logicielle
Pas encore d'évaluation
Rattrapage Sécurité Matérielle et Logicielle
7 pages
Microsoft ® Encarta ® 2007. © 1993-2006 Microsoft Corporation. Reservados Todos Los Derechos
Pas encore d'évaluation
Microsoft ® Encarta ® 2007. © 1993-2006 Microsoft Corporation. Reservados Todos Los Derechos
6 pages
Modélisation de processus en Tunisie
Pas encore d'évaluation
Modélisation de processus en Tunisie
63 pages
API Graphique Racket : Concepts Clés
Pas encore d'évaluation
API Graphique Racket : Concepts Clés
8 pages
Analyse des bornes arrêt-minute à Troyes
Pas encore d'évaluation
Analyse des bornes arrêt-minute à Troyes
1 page
Compter fichiers et répertoires en shell
100% (1)
Compter fichiers et répertoires en shell
6 pages
Contrôle d'écrans géants à distance
Pas encore d'évaluation
Contrôle d'écrans géants à distance
10 pages
Introduction à Spring Boot en Java
100% (2)
Introduction à Spring Boot en Java
40 pages
Modélisation UML et Java en TD4
Pas encore d'évaluation
Modélisation UML et Java en TD4
12 pages
Simulation ANSYS d'un tuyau en flexion
Pas encore d'évaluation
Simulation ANSYS d'un tuyau en flexion
20 pages
Proposition Technique BAADY TECH
Pas encore d'évaluation
Proposition Technique BAADY TECH
81 pages
Introduction à Active Directory
Pas encore d'évaluation
Introduction à Active Directory
5 pages
(Document) 7 Formules Alimentaires Et La Prophylax - 251105 - 132828
Pas encore d'évaluation
(Document) 7 Formules Alimentaires Et La Prophylax - 251105 - 132828
11 pages
Consultant Formateur C.A.O. & D.A.O.
Pas encore d'évaluation
Consultant Formateur C.A.O. & D.A.O.
1 page
Formation Covadis Projet Par Profil Type PDF
100% (1)
Formation Covadis Projet Par Profil Type PDF
133 pages
Introduction aux VLANs et leurs avantages
Pas encore d'évaluation
Introduction aux VLANs et leurs avantages
13 pages
Introduction à la programmation Python
Pas encore d'évaluation
Introduction à la programmation Python
38 pages
Configurer VMware pour pinger AD Debian
Pas encore d'évaluation
Configurer VMware pour pinger AD Debian
4 pages
Configuration UART avec STM32CubeMX
Pas encore d'évaluation
Configuration UART avec STM32CubeMX
6 pages
Introduction à l'informatique BTS
Pas encore d'évaluation
Introduction à l'informatique BTS
81 pages
Matrices et Python : Initiation NumPy
Pas encore d'évaluation
Matrices et Python : Initiation NumPy
6 pages
Ingénierie des systèmes informatiques
Pas encore d'évaluation
Ingénierie des systèmes informatiques
21 pages
Licence Informatique L2 - Semestres 3 et 4
Pas encore d'évaluation
Licence Informatique L2 - Semestres 3 et 4
2 pages
Projet Final
Pas encore d'évaluation
Projet Final
4 pages
Utiliser le serveur web Siemens S7
Pas encore d'évaluation
Utiliser le serveur web Siemens S7
4 pages
Cours sur les Logiciels Systèmes et Applications
Pas encore d'évaluation
Cours sur les Logiciels Systèmes et Applications
3 pages
Master en Sécurité des Systèmes Informatiques
Pas encore d'évaluation
Master en Sécurité des Systèmes Informatiques
83 pages
Gestion de comptes bancaires en Python
Pas encore d'évaluation
Gestion de comptes bancaires en Python
5 pages
Introduction à OCL et ses contraintes
Pas encore d'évaluation
Introduction à OCL et ses contraintes
15 pages
Guide Profinet pour Variateurs VLT® TIA
Pas encore d'évaluation
Guide Profinet pour Variateurs VLT® TIA
35 pages