Mastère MPBI NESRINE ELLEUCH
Modélisation Multidimensionnelle
La modélisation habituelle sous forme de relations devient inappropriée pour supporter la prise
de décision et les analyses multidimensionnelles de type OLAP. En effet, les données à analyser
au niveau d'un entrepôt/magasin doivent refléter la vision d'une classe d'analystes [Kimball 1996]
[Marcel 1998]. Cette vision correspond à une structuration des données selon plusieurs axes
d'analyses (ou dimensions) pouvant représenter des notions variées telles que le temps, la
localisation géographique, le code identifiant des produits. On parle alors de modélisation et de
traitements multidimensionnels des données. Les analyses décisionnelles sont basées sur des
traitements OLAP directement reliés à la modélisation de l'information sous une forme
conceptuelle proche de la perception qu'en a l'analyste. Cette perception de l'information est
basée sur une vision multidimensionnelle des données.
Définition :
La modélisation multidimensionnelle consiste à considérer un sujet analysé comme un point
dans un espace à plusieurs dimensions. Les données sont organisées de manière à mettre en
évidence le sujet analysé et les différentes perspectives de l'analyse. Il s’agit d’une technique de
conception logique permettant de structurer les données de manière à les rendre intuitives aux
utilisateurs d'affaires et offrir une bonne performance aux requêtes.
Caractéristiques:
– Divise les données en faits et dimensions;
– Les faits (mesures) sont généralement des valeurs numériques provenant des processus
d'affaires;
– Les dimensions fournissent le contexte (qui, quoi, quand, où, pourquoi et comment) des
faits;
– Schéma en étoile: une table de faits entourée de plusieurs tables de dimension
(normalement entre 8 et 15).
I. Concepts de base
Conceptuellement, la modélisation multidimensionnelle a donné naissance aux concepts de
fait et de dimension [Kimball 1996].
a. Concept de fait
a. définition
Le sujet analysé est représenté par le concept de fait.
Définition :
Le fait modélise le sujet de l'analyse. Un fait est une mesure correspondant aux informations de
l'activité analysée.
Une table de fait correspond normalement à un seul processus d'affaires. Elle stocke des mesures
de performance générées par les événements du processus;
Par exemple: réception d'une commande, envoi d'une commande, etc.
Les faits "prennent leur valeur" au moment où l'évènement d'affaires survient (aspect temporel
important). Elle contient typiquement un très grand nombre de lignes (jusqu'à plusieurs milliards
de lignes). Souvent plus de 90% des données du modèle.
EXEMPLE : Considérons le fait de Ventes journalières pouvant être constitué des mesures
d'activités suivantes : quantité de produits vendus et montant total des ventes. Nous
représenterons le fait par un rectangle englobant les différentes mesures d'activité qu'il contient et
les clés étrangères représentant les liens vers les autres tables (dimension).
ISET RADES 2020/2021
1
Mastère MPBI NESRINE ELLEUCH
FactVentesJournalières
Date Key (FK)
Produit Key (FK)
Magasin Key (FK)
Quantité Vendue
Montant total des Ventes en Dollar
Figure N°1 : Exemple de table fait
b. Composition
Les tables de fait comprennent deux types de colonnes: Clé étrangères vers des tables de
dimension et les valeurs numériques souvent additives (mesures).
Une ligne dans une table de fait correspond à une valeur mesurée. Une mesure est une ligne dans
la table de faits. Toutes les mesures dans la table de fait doivent être de même grain.
Les mesures sont de trois types :
Mesures additives: Peuvent être agrégées selon n'importe quelle dimension. Ex: montant
de vente, quantité commandée, etc.
Mesures semi‐additives: peuvent être agrégées selon certaines dimensions seulement. Ex:
solde de compte agrégeable selon les clients, pas le temps.
Mesures non‐additives: valeurs numériques ne pouvant être agrégées selon aucune
dimension. Ex: coût unitaire d'un produit.
c. Clés
Toutes les tables de fait possèdent au moins deux clés étrangères (Foreign Key). La clé primaire
de la table de fait est une clé composite construite à partir des autres clés étrangères. Dans un
SID, toute table qui possède une relation plusieurs à plusieurs est une table de fait.
d. Types de tables de fait
On distingue généralement différents types de tables de fait : de transaction, périodique et
récapitulative.
Table de fait de transaction : C'est le type le plus commun et le plus fondamental,
l'ensemble de l’entrepôt repose sur les tables de fait de transaction.
Principe : comme son nom l'indique elle repose sur la transaction du système
opérationnel. Dans ce cas il faut définir les clés des dimensions de chacune des
transactions opérationnelles et extraire les mesures qui intéressent la conception. Il n’y a
pas d'opération de mise à jour sur une table de fait de transaction (sauf erreur de
chargement). La table de fait de transaction représente le niveau le plus détaillé que peut
proposer l’entrepôt sur le processus en question, c'est pourquoi le choix de la granularité
de celle-ci est si importante.
Table de fait périodique : elle est généralement construite à partir d'une table de fait de
transaction. Elle représente soit l'image d'une table de fait de transaction à un moment T
(journée, mois, etc); soit la synthèse d'une table de fait de transaction à travers
l'agrégation des mesures sur ses dimensions.
Tout comme sur les tables de faits de transaction, hormis une erreur de chargement, les
tables de fait périodiques ne doivent pas être soumises à des opérations de mise à jour, la
production de ce type de tables consiste à agréger et à charger les données.
Table de fait récapitulatif : Très utile et complémentaire aux autres types de tables de
fait, les tables de fait récapitulatives sont aussi plus complexes et plus difficiles à
maintenir. La table de fait récapitulative n'est pas fondée sur la transaction ou sur l'axe
ISET RADES 2020/2021
2
Mastère MPBI NESRINE ELLEUCH
temps mais sur l'analyse détaillée d'une dimension. Exemple : l'activité d'un site de
production. Dans les autres types de table de fait la référence d'un site de production était
un axe d'analyse possible mais le but premier était l'analyse du processus à travers ses
différentes mesures. Dans les tables de fait récapitulatives les rôles s'inversent, on
souhaite analyser une dimension à travers différents processus. La table de fait
récapitulative va donc contenir différentes mesures liées à différents processus pour une
même occurrence de dimension.
Prenons l’exemple des ventes :
Les faits transactionnels identifient chacun des tickets de caisse,
Les faits d’instantanés périodiques identifient les ventes journalières,
hebdomadaires, mensuelles, …
Les faits d’instantanés récapitulatifs identifient les ventes sur un mois glissant,
depuis le début du mois, …
e. Règles de création de tables de fait
l'unicité d'une ligne d'une table de fait doit toujours pouvoir être garantie par la
concaténation de ses champs dimensions.
une table de fait contient toujours la dimension temps. TOUTES les mesures doivent
comprendre un historique pour vous permettre de produire des tendances. Un entrepôt
de données quel qu'il soit doit comprendre la dimension temps.
les mesures stockées dans une table de fait sont (presque) toujours de types numériques et
additifs. Cela implique les règles suivantes : les ratios sont toujours stockés à travers deux
champs distincts (numérateur et dénominateur).
les données d'une table de fait sont figées. Une table de fait stocke une situation passée et
révolue (sauf table de fait récapitulative). Il ne doit pas y avoir d'opération de mise à jour
sur la table une fois le chargement effectué et que ses données sont à disposition des
utilisateurs (sauf correction).
une table de fait ne doit pas contenir de ligne artificielle valorisée à zéro. Exemple, si
votre système opérationnel ne contient pas d'information sur la vente du produit « REF-
0001 » vendu dans l'agence « ABC » ne la mettez pas. Ne créez pas la ligne « REF-001 |
ABC | ... | 0 » sous peine d'explosion du volume de données ;
une table de fait ne comprend que les clés des dimensions, sous forme de clé étrangère
(numérique de préférence et dénuée de sens pour faciliter la maintenance
le volume d'une table de fait dépend (en partie) du nombre de dimensions AINSI QUE
de la structure de celle-ci (profondeur, nombre d'occurrences).
b. Estimation de la taille de la table de fait
a. Estimation de la taille de la table de fait initiale
Formule= Nombre de lignes * Taille d’une ligne
Exemple : Supermarché
a. Dimensions
b. Temps : 4 ans * 365 jours = 1460 jours
c. Magasin : 300
d. Produit : 200000 références GENCOD (10% vendus chaque jour)
e. Promotion : un article est dans une seule condition de promotion par jour et par
magasin
f. Fait :
ISET RADES 2020/2021
3
Mastère MPBI NESRINE ELLEUCH
g. 1460 * 300 * 20000 * 1 = 8,76 milliards d’enregistrements
h. Nb de champs de clé = 4
i. Nb de champs de fait = 4
j. Table des Faits = 8,76.109 * 8 champs * 4 octets = 280 Go
Exemple : Suivi d’appels téléphoniques
a. Temps : 3 ans * 365 jours = 1095 jours
b. Nombre d’appel par jour = 100 000 000
c. Nb de champs de clé = 5
d. Nb de champs de fait = 3
e. Table des Faits = 1095.108 * 8 champs * 4 octets = 3,49 To
c. Estimation de la taille totale
a. Estimation de la taille initiale de la table de fait.
Nombre de lignes * Taille d’une ligne
b. Estimation de la taille des index et des tables de dimension :
40% de la taille de la table de fait.
c. Estimation de l’évolution de la taille de fait : combien de ligne par
mois ajoutée pendant trois ans.
Nombre de lignes ajoutées * Taille d’une ligne
d. Si le SGBD assure une compression, calculer la taille finale après
compression.
Par exemple, SQL Server assure une fonction de compression de 3 :1.
Donc, pour 46 GB, la taille compressée serait de 15,5 GB.
d. Concept de dimension
a. Définition
Le sujet analysé, c'est à dire le fait, est analysé suivant différentes perspectives. Ces perspectives
correspondent à une catégorie utilisée pour caractériser les mesures d'activité analysées; on parle
de dimensions.
Définition :
Une dimension modélise une perspective de l'analyse. Une dimension se compose de
paramètres ou membres correspondant aux informations faisant varier les mesures de l'activité.
Les dimensions servent à enregistrer les valeurs pour lesquelles sont analysées les mesures de
l'activité. Une dimension est généralement formée de paramètres (ou attributs) textuels et
discrets. Les paramètres textuels sont utilisés pour restreindre la portée des requêtes afin de
limiter la taille des réponses. Les paramètres sont discrets, c'est à dire que les valeurs possibles
sont bien déterminées et sont des descripteurs constants.
EXEMPLE : Poursuivons l'exemple précédent. Le fait peut être analysé suivant différentes
perspectives correspondant à trois dimensions : la dimension Temps, la dimension Géographie et
la dimension Catégorie.
Nous représenterons une dimension par un rectangle englobant les différents paramètres qu'elle
contient.
ISET RADES 2020/2021
4
Mastère MPBI NESRINE ELLEUCH
DimTemps DimGéographie DimCatégorie
Date Key (PK) Géographie Key Catégorie Key (PK)
Année (PK) TypeProd
Trimestre Région Gamme
Saison Département NomProd
Mois Ville Couleur
Jour
Figure N°2 : Exemple de dimensions
b. Composition
Les attributs des dimensions obéissent à plusieurs particularités :
Descriptif (ex: chaînes de caractères);
De qualité (ex: aucune valeur manquante, obsolète, erronée, etc.);
Valeurs discrètes (ex: jour, âge d'un client);
La clé primaire d'une table de dimension devrait toujours être une clé artificielle composée d'une
seule colonne (surrogate key);
c. Hiérarchie
Lors du processus OLAP, les données sont généralement analysées en partant d'un faible niveau
de détail vers des données plus détaillées pour "forer vers le bas". Pour définir ces différents niveaux
de détail, chaque dimension est munie d'une (ou plusieurs) hiérarchie(s) des paramètres. La
hiérarchie sert lors des analyses pour restreindre ou accroître les niveaux de détail de l'analyse.
Définition :
Une hiérarchie organise les paramètres d'une dimension selon une relation "est_plus_fin"
conformément à leur niveau de détail.
EXEMPLE : Les paramètres des dimensions sont organisés suivant une hiérarchie ; les
paramètres sont ordonnés par une relation "est_plus_fin" et notée P1 → P2. Par exemple, pour
la dimension Geographie :
Ville --> Departement -->Region
Ainsi chaque ville appartient à un département qui est situé dans une région.
d. Dimensions conformes:
Les dimensions conformes également appelées « master dimensions » ou « common reference dimensions »
sont des dimensions potentiellement partagées par des tables de faits modélisant des processus
d'affaires différents;
Elles offrent plusieurs avantages:
Cohérence: les différentes tables de faits sont filtrées et étiquetés de manière cohérente;
Intégration: permet à l'entrepôt de données d'opérer comme un seul bloc uni;
Productivité: favorise l'extension de l'entrepôt d'une itération de développement à l'autre.
e. Quelques types de dimensions:
Les dimensions à « jeux de rôle » : Ce modèle représente le fait d'implémenter une
seule dimension physique pouvant représenter plusieurs axes d'analyses pour les
utilisateurs ; typiquement la dimension « Temps ». En tant que concepteur vous pouvez
produire différentes vues de cette de table de dimension « Temps » afin de permettre aux
utilisateurs d'utiliser différents axes d'analyses (exemple : date d'achat, date de livraison...).
ISET RADES 2020/2021
5
Mastère MPBI NESRINE ELLEUCH
Vous ne gérez donc qu'une seule dimension physique tout en mettant à disposition de
vos utilisateurs plusieurs axes d'analyses.
Les dimensions dégénérées : Dans certains rapports, il s'avère parfois utile de proposer
un accès vers le détail ou d'ajouter des informations sur la transaction traitée. La
dimension dégénérée consiste en un champ dans votre table de fait qui fait référence à
l'identifiant de la transaction dans la base opérationnelle. Ce modèle très utile permet de
vérifier la véracité des chiffres fournis ainsi que la valeur des dimensions indiquées.
Exemple, un champ « référence du contrat » dans une table de fait de transaction vous
permettra de créer un lien vers votre système opérationnel afin d'accéder à ses propriétés.
Dimension à évolution lente (SCD) : •Les valeurs des enregistrements des dimensions
peuvent être amenés à évoluer. Par exemple, un produit va changer de nom, de rayon, de
numéro de version (par ex. logiciels)… Trois méthodes sont possibles pour gérer ces
évolutions :
o 1. Écrasement de la valeur par la nouvelle
Solution la plus simple : ni la table de faits ni la table de dimension ne
change dans leur structure ou leur organisation.
Désavantage : il y a perte de l’historique.
o 2. Ajout d’une ligne de dimension pour y intégrer la modification (même si elle ne
concerne qu’une sous partie des attributs).
La nouvelle ligne aura un nouvel ID unique et il est donc important de
prévoir une clé primaire différente de la clé primaire naturelle,
Elle permet de segmenter la table de faits en fonction de l’historique.
o 3. Ajout d’une colonne de dimension
Permet d’associer l’ancienne valeur de l’attribut directement avec la
nouvelle
Dans le cas de caractéristique de dimension à évolution rapide, il est
préférable de les isoler dans une dimension spécifique (ex. dimension
client).
f. Quelques règles de création des tables de dimension
Utilisez comme clé primaire une clé physique générique et dépourvue de sens de type «
auto-incrément » plutôt qu'une clé logique composée de plusieurs champs pour les tables
de dimensions ;
ISET RADES 2020/2021
6
Mastère MPBI NESRINE ELLEUCH
pour faciliter la production de rapports et le calcul d'agrégats, créez des dimensions
respectant une hiérarchie simple de type 1 vers n. Exemple :
- un domaine de produit contient une à plusieurs catégories de produits ; une catégorie
de produit contient une ou plusieurs références de produit,
- une région contient un ou plusieurs départements, un département contient un ou
plusieurs sites de production, un site de production contient 1 ou plusieurs services ;
C. Modèles en étoile, en flocon et en constellation
a. Modèle en étoile
A partir du fait et des dimensions, il est possible d'établir une structure de données simple qui
correspond au besoin de la modélisation multidimensionnelle. Cette structure est constituée du
fait central et des dimensions. Ce modèle représente visuellement une étoile, on parle de modèle
en étoile (star schema [Kimball 1996]).
EXEMPLE : La Figure 6 décrit le schéma en étoile modélisant les analyses des quantités et des
montants des médicaments dans les pharmacies selon trois dimensions : le temps, la catégorie et
la situation géographique.
Figure N°3 : Modélisation en étoile (simplifiée)
b. Modèle en flocon
Il existe d'autres techniques de modélisation multidimensionnelle, notamment la modélisation
en flocon (snowflake). Une modélisation en flocon consiste à décomposer les dimensions du
modèle en étoile en sous hiérarchies. La modélisation en flocon est donc une émanation de la
modélisation en étoile ; le fait est conservé et les dimensions sont éclatées conformément à sa
hiérarchie des paramètres.
L'avantage de cette modélisation est de formaliser une hiérarchie au sein d'une dimension. Par
contre, la modélisation en flocon induit une dénormalisation des dimensions générant une plus
grande complexité en termes de lisibilité et de gestion.
EXEMPLE : La Figure 4 illustre la modélisation en flocon ; nous décrivons le modèle en étoile
de la Figure 3 en dénormalisant chacune de ces dimensions, formant ainsi une sorte de flocon.
ISET RADES 2020/2021
7
Mastère MPBI NESRINE ELLEUCH
Figure N°4 : Modélisation en flocon de neige
c. Modèle en constellation
Une autre technique de modélisation, issue du modèle en étoile, est la modélisation en
constellation. Il s'agit de fusionner plusieurs modèles en étoile qui utilisent des dimensions
communes. Un modèle en constellation comprend donc plusieurs faits et des dimensions
communes ou non.
EXEMPLE : La Figure 8 illustre la modélisation en constellation ; nous décrivons une
constellation constituée de deux schémas en étoile : l'un correspond aux ventes effectuées dans
les pharmacies et l'autre analyse les prescriptions des médecins.
Figure N°5 : Modélisation en constellation
Les dimensions Temps et Géographie sont partagées par les faits Prescriptions et Vente.
II. Conception d’un DW selon Kimball
ISET RADES 2020/2021
8
Mastère MPBI NESRINE ELLEUCH
Un projet de développement de SID doit d’abord passer par la modélisation du modèle
multidimensionnel.
Il existe différentes méthodes de développement du modèle notamment la méthode de M.
Kortink et [Link], la méthode de [Link] et J. Lechtenborger et G. Vossen et celle de
Kimball1. La méthode de Kortnik et Moody aboutie au modèle dimensionnel en partant du
modèle d'entreprise relationnel s'il existe.
La méthode de [Link] et J. Lechtenborger et G. Vossen qui proposent un formalisme
graphique pour la conception conceptuelle d'entrepôt et donnent une liste à directives à utiliser.
Kimball propose un processus basé sur 4 étapes pour bien concevoir le modèle
multidimensionnel. Ce modèle peut être adapté aux cas simples et sera adopté pour la suite du
cours.
Cette méthode consiste en 4 étapes : Sélection du processus à modéliser ; Déclarer le grain du
processus à analyser ; Choisir les dimensions qui s’appliquent à chaque table de fait et Identifier
les mesures de la table de fait.
1. Sélection du processus à modéliser :
L’activité ou processus à modéliser peut intéresser plusieurs départements Les données de
l’entreprise serviront à modéliser l’activité d ventes qui sera utilisée par les départements ventes
et marketing. Ceci nous permet d’éviter la redondance de données (stockage, etc.) à utiliser et
d’utiliser des procédures ETL complexes inutilement.
Se base sur la matrice en bus de données et le diagramme
de priorisation; Doit impliquer les cadres supérieurs.
2. Déclarer le grain du processus à analyser
Déclarer le grain signifie spécifier exactement ce qu’une ligne de la table fait contient. Le grain
spécifie le niveau de détail associé aux mesures de la table de fait. Il permet de répondre aux
questions « comment décrire une ligne dans une table de fait ? » ou "à quoi correspond
une ligne de la table de faits ?";
Il dépend des réalités physiques des sources de données.
Exemples:
Une ligne de facture reçue du médecin.
Une ligne individuelle dans un ticket de caisse scanné.
Un relevé journalier de l’inventaire de chaque produit dans un entrepôt.
3. Choisir les dimensions qui s’appliquent à chaque table de fait
Les dimensions sont obtenues en répondant à la question : « comment décrire les données qui
résultent du processus métier ? ». il faut identifier un ensemble riche de dimensions qui
représentent toutes les descriptions possibles que peut prendre une valeur dans la table de fait.
Pour chaque dimension, on identifie les attribues discret et textuels pour chaque table de
dimension. Exemples : date, clients, produits, etc.
4. Identifier les mesures de la table de fait
Identifier les mesures peut être effectué en déterminant ce que nous mesurons. Elles représentent
typiquement les mesures de performance du processus analysé.
– Colonnes représentant des valeurs numériques de mesure.
III. Etudes de cas:
1
A. GHELLAB. «CONCEPTION D'UNE BASE DE DONNEES DECISIONNELLE». Mémoire de Mastère.
2010.
ISET RADES 2020/2021
9
Mastère MPBI NESRINE ELLEUCH
1. EXERCICE 1
On désire analyser l'activité des représentants d'une entreprise de vente d'imprimantes. Le chef
d'entreprise veut savoir ce qui se passe pour ses vendeurs. Les employés font-ils leur travail,
quelle est la zone de couverture des vendeurs, où sont les endroits où les vendeurs sont le moins
efficaces, quelle est la moyenne de ventes des représentants, etc., etc. L'entreprise possède un
système de gestion de ressources humaines, un système de gestion des ventes et des feuilles de
routes avec des informations concernant les vendeurs : kilomètres parcourus, litres d'essence
utilisée, frais de voyage, ventes, promesses de ventes, etc.
T.A.F.
a. Adaptez la méthode Kimball pour analyser ce cas.
b. Identifiez la structure de la table de fait et les mesures associée ainsi que les dimensions et leurs
attributs relatifs.-
c. Proposez un modèle en étoile pour ce cas.
2. EXERCICE 2
Une grande entreprise à succursales multiples veut rassembler toutes les nuits dans un entrepôt
de données des informations sur les ventes du jour afin de dresser des tableaux de bord sur les
ventes.
L’entreprise dispose d’un système d’information complexe, constitué des éléments suivants :
des applications et bases de données éparses et hétérogènes sur les produits qu’elle vend,
des applications et BD, également variées, sur les clients, - idem sur les personnels de
l’entreprise.
Le SID à modéliser doit pouvoir fournir le chiffre d’affaires des ventes d’un produit, par date,
client, et vendeur, ainsi que toutes les sommations possibles de chiffre d’affaires.
Une vente correspond à un produit et un seul,
Les produits sont regroupés par famille de produits.
La vente est effectuée par l’un des vendeurs du service de vente spécialisé dans le produit.
La semaine de vente est le numéro de semaine dans l’année.
T.A.F.
1. Identifier les tables de fait et les dimensions de l’analyse.
2. Proposez une modélisation en étoile pour ce cas.
3. EXERCICE 3
Une entreprise de fabrication de vaisselle jetable souhaite mettre en place un
système d’information décisionnel sous la forme d’un data mart pour
observer son activité de ventes au niveau des différents lieux de distributions
de ses articles et cela dans plusieurs villes. Ces lieux de distributions sont
renseignés par leur enseigne, leur type (en fonction de leur surface), leur
adresse (code postal et ville), leur département, leur région. Les ventes sont
renseignées selon une période qui se décline en mois, en trimestre et année.
Les ventes sont observées par le nombre d’articles selon le type, et le chiffre
d’affaire.
1. Définir le processus à analyser et spécifier les mesures associées (1 pts)
2. Quelles sont les dimensions et leurs attributs ;
3. Proposez un modèle en étoile pour cet entrepôt.
4. Sachant que la taille des clés est de 4 octets, celles des mesures est de 8 octets
ISET RADES 2020/2021
10
Mastère MPBI NESRINE ELLEUCH
a. Donnez une estimation de la taille d’une ligne.
b. Il existe 1000 article, 10 enseignes et les données recueillies par la
société s’étalent sur 5 ans.
1. Estimez la taille maximale de la table de fait.
2. Estimez la taille de l’entrepôt de données.
4. EXERCICE 4
Une agence de voyage aimerait pouvoir analyser ses données afin de planifier de
meilleures campagnes de promotion auprès de ses clients. Plus particulièrement,
elle aimerait analyser le nombre et le montant des ventes ainsi que le profit en
fonction :
De la destination: hôtel, ville, pays, région, catégorie de région (ex: bord de
mer, montagnes, etc.), catégorie de destination (ex: familial ou non),
catégorie hôtel (ex: 1-4 étoiles) ;
De la date d'achat: jour de l'année, jour de la semaine, mois, année, saison
touristique (ex: basse ou haute saison);
De la date de départ: jour de l'année, jour de la semaine, mois, année, saison
touristique (ex: basse ou haute saison);
Du forfait: nombre de personnes, nombre de nuits, type de forfait (ex: tout
inclus, repas inclus, etc.), type de chambre (ex: standard, suite, penthouse,
etc.) ;
Du client: groupe d'âge, sexe, adresse, type d'acheteur (ex: nouveau,
récurrent, etc.) ;
Du canal de vente: catégorie (ex: magasin, internet, etc.) ;
De la promotion: catégorie (ex: 2 pour 1, rabais 10%, rabais 25%, etc.),
début et fin de validité ;
Du mode de paiement: catégorie (ex: crédit, comptant, etc.) ;
1. Proposez un schéma en étoile permettant de faire ces analyses. Identifiez
clairement les clés primaires et étrangères des tables de faits et de dimension;
2. Identifiez 2 hiérarchies ;
ISET RADES 2020/2021
11
Mastère MPBI NESRINE ELLEUCH
Bibliographie
Didier DONSEZ. « Conception de Bases Décisionnelles ». Université Joseph Fourier
(Grenoble 1). [En ligne]. Lien : [Link]
[Link]/PPerso/membres/donsez/cours/[Link]
Carlos Da Costa. « Mettre en place un entrepôt de données multidimensionnel ».
[En ligne]. Lien : [Link]
[Link]/tutoriels/DWH_multidimensionnel/?page=Auteur
D. Ploix. « Conception EDD ». Evry - M2 MIAGE
ISET RADES 2020/2021
12