0% ont trouvé ce document utile (0 vote)
21 vues53 pages

Système d'Information Décisionnel 2024/2025

Le document présente un plan de cours sur le Système d'Information Décisionnel, abordant des sujets tels que les data warehouses, la modélisation dimensionnelle et l'ETL. Il décrit également les différences entre les données opérationnelles et décisionnelles, ainsi que les outils d'analyse comme OLAP et Data Mining. Enfin, il met en avant l'importance des systèmes d'information décisionnels pour améliorer la prise de décision au sein des organisations.

Transféré par

fatimazahraeelyagouby
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
21 vues53 pages

Système d'Information Décisionnel 2024/2025

Le document présente un plan de cours sur le Système d'Information Décisionnel, abordant des sujets tels que les data warehouses, la modélisation dimensionnelle et l'ETL. Il décrit également les différences entre les données opérationnelles et décisionnelles, ainsi que les outils d'analyse comme OLAP et Data Mining. Enfin, il met en avant l'importance des systèmes d'information décisionnels pour améliorer la prise de décision au sein des organisations.

Transféré par

fatimazahraeelyagouby
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Moulay Ismail Année universitaire : 2024/2025

FPE Prof [Link]


Errachidia

Système d’Information Décisionnel


Plan du cours

1. Introduction au domaine du décisionnel et aux data warehouses


2. Introduction à la modélisation dimensionnelle
3. Introduction à l'ETL (Extract, Transform, Load) et application
avec Oracle
4. Exploitation mono-dimensionnelle d'un data warehouse en SQL
5. Éléments avancés pour la modélisation des data warehouses
6. Exploitation multi-hiérarchique et multi-dimensionnelle d'un data
warehouse
7. Datamarts orientés analyse
INTRODUCTION

“ La Problématique de l’Entreprise ”, ce titre amène naturellement à définir la position de


l’entreprise par rapport au sujet “ le Data warehouse, le Data mining ” et définir en quoi
celle-ci est concernée. Plus précisément, montrer comment ces techniques d’informatique
décisionnelle sont une réponse au problème de prise de décision de l’organisation au vu de
son contexte, de ses contraintes, de ses objectifs poursuivis sur les plans sécurité,
développement et rentabilité.

Nous proposons de répondre à cette problématique en décrivant :

➢ un modèle “ du système décisionnel de l’entreprise ”,


➢ et le contenu informatif de ce système décisionnel..

Type d’organisation Objectif de Développement Contrainte Solution


Société Gagner x% de part de Marché Taux de rémunération du capital => Recherche de Solution
de y% fixé par les actionnaires

Administration Répondre à l'augmentation de la Travailler à Budget Constant => Recherche de Solution


demande

Association à but non Augmenter la qualité d'un service Résultat de l'exercice = 0 => Recherche de Solution
lucratif
INTRODUCTION

Le “ STI ” ou “ Système de Traitement de l’Information ” désigne le contexte général du


traitement de l'information et de la résolution de problème.

L’introduction de ce contexte général s’inscrit dans des recherches sur les liens entre la
théorie de l’information, la théorie de la gestion des organisations, la théorie de la décision et
de la gestion.
Système de Traitement de l’Information ” est le sigle qui désigne le contexte général du
traitement de l'information et de la résolution de problème.

Ce STI peut être vu comme un modèle à deux archétypes :


le cerveau et les ordinateurs.

Emetteurs /
Mémoires Processeurs
Récepteurs

Environnement

le Système de Traitement de l’Information


INTRODUCTION

Structure du Système décisionnel


INTRODUCTION
SYSTÈME INTERACTIF D’AIDE A LA DECISION

Un SIAD est un Système Informatique de traitement de l’information et de résolution de


problème pratiquant la recherche heuristique.

Un SIAD est un système qui augmente la qualité des processus de décision plutôt que
leur productivité.

La notion “ d'aide à la décision ” s'interprète comme une aide à la recherche des


solutions satisfaisantes en utilisant un système de recherche heuristique.
INTRODUCTION

Différences entre données du système de production et données décisionnelles

Données opérationnelles Données décisionnelles


Orientées application, détaillées, précises au moment Orientée activité (thème, sujet), condensées,
de l’accès représentes des données historiques
Mise à jour interactive possible de la part des Pas de mise à jour interactive de la part des
utilisateurs utilisateurs
Accédées de façon unitaires par une personne à la fois Utilisées par l’ensemble des analystes, gérées par
sous-ensemble
Cohérence atomique Cohérence globale
Haute disponibilité en continu Exigence différente, haute disponibilité ponctuelle
Uniques (pas de redondance en théorie) Peuvent être redondantes
Structure statique, contenu variable Structure flexible
Petite quantité de données utilisées par un traitement Grande quantité de données utilisée par les
traitements
Réalisation des opérations au jour le jour Cycle de vie différent
Utilisées de façon répétitive Utilisée de façon aléatoire
Informatique décisionnelle
Définition

Selon Wikipédia, "L’informatique décisionnelle (en anglais : BI pour Business


Intelligence) est l’informatique à l’usage des décideurs et des dirigeants des entreprises.
Elle désigne les moyens, les outils et les méthodes qui permettent de collecter,
consolider, modéliser et restituer les données, matérielles ou immatérielles, d’une
entreprise en vue d’offrir une aide à la décision et de permettre à un décideur d’avoir une
vue d’ensemble de l’activité traitée."
Systèmes d’information

Le système d'information d'une organisation (Université, institution, club, groupe structuré


...) regroupe tout ce qui à quelque niveau que se soit traite ou stocke des informations
relatives à l'organisation concernée.

Le système d'information comprend des informations relatives: aux flux : liste des étudiants,
les notes, les éléments pédagogiques...
à l'univers extérieur: stage, relation extérieure...
à l'organisation de l'université;
aux contraintes légales: lois, règlements, paramètres financiers... etc.

Les inconvénients d’un système d'information pour un utilisateur final:

➢ Schéma très/trop complet:


Contient des tables inutiles pour l’analyse

➢ Pas d’interface graphique capable de rendre utilisable


le modèle E/A (Entité/Association).

➢ Inadapté pour l’analyse


Systèmes d’information décisionnel

Un (SID) est un système qui permet aux décideurs d’une institution de disposer
d’informations pertinentes et d’outils d’analyse puissants pour les aider à prendre les
bonnes décisions au bon moment. Le suivi d’une politique d’établissement peut se faire
par le partage de tableaux de bord et autres indicateurs.

Système d'Information Décisionnel. Désigne les moyens, les outils et les méthodes qui
permettent de collecter, consolider, modéliser et restituer les données d'une université en
vue d'offrir une aide à la décision.

Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles
et historisées, organisées pour le support d'un processus d'aide à la décision. L’Entrepôt
de données est entièrement construit selon une approche dimensionnelle, c'est-à-dire qui
fait appel aux techniques qui favorisent l'analyse multidimensionnelle des données.
Architecture d'un système décisionnel
Architecture d'un système décisionnel

Data Warehouse ou l'entrepôt de données

Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles
et historisées, organisées pour le support d'un processus d'aide à la décision.

Différences entre le système de production et le data warehouse :

Critère Système de production Data Warehouse

Niveau de détail des informations Très détaillé Synthétique, parfois détaillé


utilisateurs

Utilisateurs Une ou quelques fonctions de l’entreprise Plusieurs fonctions de l’entreprise

Données figées Non – évolution en temps réel Oui – archivage


Historique Non Oui
Opérations sur les données Ajout/mise à jour/ consultation Consultation uniquement
Architecture d'un système décisionnel

Data warehouse - points de vue pour les utilisateurs


Architecture d'un système décisionnel

Data Mart

Un datamart est un magasin de données. Comme le datawarehouse c'est un entrepôt de


données, mais spécialisé pour un métier ou un sujet donné.

Le Data Mart est une base de données moins coûteuse que le Data Warehouse, et plus
légère puisque destinée à quelques utilisateurs d’un département. Il séduit plus que le
Data Warehouse les candidats au décisionnel.

Data Warehouse Data Mart


Cible utilisateur Toute l’entreprise Département
Implication du service Elevée Faible ou moyen
informatique
Base de données d’entreprise SQL type serveur SQL milieu de gamme, bases
multidimensionnelles
Modèles de données A l’échelle de l’entreprise Département
Champ applicatif Multi sujets, neutre Quelques sujets, spécifique
Sources de données Multiples Quelques unes
Stockage Base de données Plusieurs bases distribuées
Taille Centaine de GO et plus Une à 2 dizaines de GO
Temps de mise en place 9 à 18 mois pour les 3 étapes 6 à 12 mois (installation en plusieurs
étapes)
Architecture d'un système décisionnel

Base de Données multidimensionnelles (OLAP)

Les outils OLAP (On Line Analytical Process) reposent sur une base de données
multidimensionnelle, destinée à exploiter rapidement les dimensions d'une population de
données.

Online Analytical Processing (OLAP), désigne les bases de données multidimensionnelles


(aussi appelées cubes ou hypercubes) destinées à l'analyse. On parle ici de bases de
données multidimensionnelles car pour pouvoir analyser des données représentant
l'activité d'une université, il faut pouvoir les modéliser suivant des axes. Ainsi, pour
prendre un exemple, la régions par filières les donné se décline en trois axes au
minimum.
Architecture d'un système décisionnel

Hyper cube et OLAP

Online Analytical Processing (OLAP), désigne les bases de données multidimensionnelles


(aussi appelées cubes ou hypercubes) destinées à l'analyse. On parle ici de bases de
données multidimensionnelles car pour pouvoir analyser des données représentant
l'activité d'une entreprise, il faut pouvoir les modéliser suivant des axes. Ainsi, pour
prendre l'exemple le plus courant, la note par l'étudiant donné se décline en trois axes au
minimum : étudiant, module, et année.

2017
2016
2015
Architecture d'un système décisionnel

Hyper cube et OLAP


Filière Region

MIPC
Medalt
BCG

MIP Errachidia

Ouarzazate

Effectif réussi en
2015/16
MIP en
2013/14 Errachidia pour
2014/15 2015/16
Année
Architecture d'un système décisionnel

LES OUTILS MOLAP (Multidimensional OLAP)

MOLAP est conçue exclusivement pour l'analyse multidimensionnelle, avec un mode de


stockage optimisé par rapport aux chemins d'accès prédéfinis. Ainsi, toute valeur d'indicateur
associée à l'axe temps sera pré-calculée au chargement pour toutes ses valeurs
hebdomadaires, mensuelles, etc.

Data Warehouse Moteur MOLAP Aide à la décision

Données Traitements Présentation

Stockage des Rapports


données détaillées (et Multi-Dimensionnel
agrégées)
Architecture d’un produit Molap
Architecture d'un système décisionnel
LES OUTILS ROLAP (Relational OLAP)

Les outils ROLAP superposent au dessus des SGBD/R bidimensionnels un modèle qui
représente les données dans un format multidimensionnel. ils permettent de transformer
l’analyse multidimensionnelle demandée par l’utilisateur en requêtes SQL

Data Warehouse Moteur ROLAP Aide à la décision

Données Traitements Présentation

Stockage des Génération de plans Rapports


données détaillées (et d'exécution SQL Multi-Dimensionnel
agrégées) et afin d'obtenir des
des méta-données fonctionnalités OLAP.

Architecture d’un produit Rolap


Architecture d'un système décisionnel

principaux outils MOLAP et ROLAP

EDITEUR PRODUIT

ARBOR SOFTWARE ESSBASE


ORACLE EXPRESS
MOLAP
DIMENSIONAL INSIGHT CROSS TARGET

INFORMIX METACUBE
MICROSTRATEGY DSS AGENT
ROLAP
PLATINUM TECHNOLOGY INFOBEACON
Architecture d'un système décisionnel
Reporting

Un éditeur de rapports traditionnel permet à un utilisateur de produire uniquement un


document statique, tandis que les applications de reporting qui supportent la technologie
OLAP produisent des rapports interactifs.

Data Mining

DATA MINING comme une démarche ayant pour objet de découvrir des relations et des
faits, à la fois nouveaux et significatifs, sur de grands ensembles de données.

Data Mining l'ensemble des techniques qui permettent de transformer les données en
connaissances.
L’outil Data Mining permet de rechercher les causes des résultats donnés par l ’analyse
multidimensionnelle, de vérifier des hypothèses, et de découvrir des corrélations entre les
données.
Architecture d'un système décisionnel
Modélisation
Annee_Uni Resultat_ELP

Cod_Anu Cod_ELP
Cod_Sem Not_ELP
Lib_Anu

Résultat_
Semestre Cod_ELP Académie
Cod_anu
Cod_Sem Cod_Acd
Cod_Ind
Sems Lib_Acd
Cod_Acd
Cod_Dip Lic_Acd
Effectif_réussi
Individu

Cod_Ind
Cod_ind_bac
Diplôme

Cod_Dip
Lib_Dip
Lic_Dip
Ind_Bac BAC
Cod_Ind_bac Cod_Bac
Cod_Bac Lib_Bac
Cod_Dep Daa_deb_vld_ba
Cod_Etb c
Modélisation
Nous pouvons maintenant dire que la mesure effective réussie est dimensionnée par Année,
filière, région, type du bac.
Filière Région
Compta
Medalt
Droit

Econ Errachidia

Ouarzazate

Filière
Annéeee Effectif réussi
Compta en Econ en
2015/2016
2013/14 2015/16 Errachidia
Droit
pour 2015/16
2014/15
Econ 2014/2015 Année

2013/14

Effectif réussi
en Econ en
bac Eco pour
Bac SE Bac Eco 2014/2015
Bac M
Bac
Modélisation

L’Alimentation des données

ETL (Extract, Transform, Load) qui permet de concevoir et exécuter des opérations de
manipulation et de transformation de données.
Un processus ETL se décompose en cinq phases :
1. Définition des métadonnées source : description des bases de données
opérationnelles.
2. Définition des métadonnées cible : description des futures bases du Data
Warehouse.
3. Validation de la qualité des données
4. Création du processus qui permet de charger la cible en utilisant les données
sources.
5. Ordonnancement
Modélisation

Le Cube
Analyse
L'effectif réussi en étude hispanique par type du BAC en 2003, 2004 et 2005

Type du BAC Année Effectif Réussi

Lettres 2003 1

Lettres Modernes 2003 126

Sciences Expérimentales 2003 2

Bac Technique 2004 3

Lettres 2004 63

Lettres Modernes 2004 35

Bac Technique 2005 1

Lettres 2005 91

Lettres Modernes 2005 36


Analyse
les moyennes générales des étudiants réussis par type du BAC

Moyenne
Type du BAC Année
générale
Lettres 2003 10.7
Lettres Modernes 2003 11.25
Sciences Expérimentales 2003 10.61
Moyenne
Bac Technique 2004 10.52 générale
Lettres 2004 11.61
Lettres Modernes 2004 11.47
Bac Technique 2005 11.7
Lettres 2005 10.98
Lettres Modernes 2005 11.33

Type du BAC
Outils de Business Intelligence

Suite Microsoft BI, Microsoft Power BI, Pentaho Data Integration, Qlik Sense & Qlik View,
Jasper Reports, Mondrian, Tableau software, jasperserver-pro

Les progiciels (ex : SAS, SPSS Clementinel, Pentaho, SpogoIB, JasperSoft, Xreporter
…) dans ce domaine ont aussi réalisé une percée importante et ajoutent des analyses.
Outils de Business Intelligence

Quelques solutions disponibles Open source

Pentaho est une solution d’informatique décisionnelle open source entièrement


développée en Java. Elle porte sur toute la chaîne décisionnelle et utilise différents outils
et composants :

Pour la collecte et l’intégration : les outils d’ETL Kettle ou Mondarian,


Pour la diffusion : un serveur d’application JBoss ou TOMCAT,
Pour la présentation : JFreeReport, BIRT ou encore JasperReport
Pour le Data Mining : weka
Outils de Business Intelligence

Spago BI
Spago BI permet la génération d’états, simples ou paramétrés en utilisant les générateurs Jasper
Reports et BIRT.
Il permet également l'analyse de données avec Jpivot/Mondrian.
SpagoBI intègre un composant d’aide à la création de requêtes SQL (Query By Example) qui
permet à l’utilisateur de sélectionner graphiquement les données à extraire de l’entrepôt de
données puis d’effectuer des tris, groupements, sélections et d’exporter le résultat.
L’interface graphique utilise un ensemble de portlets pour afficher graphiques, états et
indicateurs à l’intérieur du portail. Certains indicateurs et graphiques sont capables d’actualiser
leur données sans intervention de l’utilisateur.
Les données sont stockées dans un référentiel utilisant la norme JCR (Java Content Repository)
ce qui le rend librement interchangeable.
Outils de Business Intelligence
Outils de Business Intelligence

Logiciel Open source (Pentaho) :


Outils de Business Intelligence

Logiciel commercial (SAS)

Système SAS est sans doute le logiciel de traitement de données le plus complet et, sinon le
plus répandu, du moins celui qui traite quotidiennement le plus gros volume de données.

Architecture technique de la plateforme décisionnelle SAS


Université Moulay Ismail Année universitaire : 2024/2025
FPE Prof [Link]
Errachidia

Système d’Information Décisionnel

Chap II
Conception d'un système décisionnel
Un projet de système décisionnel se structure selon quatre grands axes :
1. Étude des besoins et de l'existant
➢ Étude des besoins utilisateurs
➢ Étude des données existantes
2. Modélisation et conception
➢ Modélisation dimensionnelle
➢ Architecture technique
➢ Spécification des outils d'exploitation
3. Implémentation du data warehouse
➢ Implémentation du DW et des DM
➢ Mise en place de l'ETL(Extraction Transformation Loading)
4. Implémentation des outils d'exploitation
➢ Implémentation des outils de reporting
➢ Implémentation des outils d'exploration
➢ Implémentation des outils de prédiction
Quelques exemples d'application

➢ Analyse du comportement de consommateurs ou de citoyens, en fonction de leurs


caractéristiques (sexe, age...), de critères socio-économiques (profession...),
géographiques...
➢ Analyse de ventes en fonction de l'implantation géographique de magasins (densité,
caractéristiques des régions...), de l'organisation de magasins (rayonnage, marketing,
RH...)
➢ Analyse des structures de paniers (quel produit est vendu en même temps que quel
autre à quelles conditions ?)
➢ Prédiction de ventes en fonctions de données conjoncturelles, gestion des stocks, des
approvisionnements
➢ Contrôle qualité et analyse de défaut des chaînes de production en fonction des centres
de production, des organisations, des fournisseurs...
Data warehousing

Un data warehouse (DW) est une base de données construite par copie et DW
réorganisation de multiples sources (dont principalement le système transactionnel de
l'entreprise), afin de servir de source de données à des applications décisionnelles :
➢ il agrège de nombreuses données de l'entreprise (intégration) ;
➢ il mémorise les données dans le temps (historisation) ;
➢ il les organise pour faciliter les requêtes de prise de décision (optimisation).

Synonymes : entrepôt de données, base de données décisionnelle

L'objectif du data warehouse est de permettre des requêtes sur de grands ensembles des
données, la plupart du temps sous forme d'agrégats (GROUP BY) afin d'en obtenir une
vision synthétique (propre à la prise de décision).
Data warehouse et data mart
Un data warehouse et un data mart se distinguent par le spectre qu'il recouvre :
➢ Le data warehouse recouvre l'ensemble des données et problématiques d'analyse visées
par l'entreprise.
➢ Le data mart recouvre une partie des données et problématiques liées à un métier ou un
sujet d'analyse en particulier
➢ Un data mart est fréquemment un sous-ensemble du data warehouse de l'entreprise,
obtenu par extraction et agrégation des données de celui-ci.
modèle en étoile
Le est une représentation fortement qui assure modèle en étoile dénormalisée un haut
niveau de performance des requêtes même sur de gros volumes de données.
modèle en étoile

• Une table de faits encadrées par N tables de dimensions

Produits
IDprod
Periodes Table de faits “ventes” description
couleur
IDper taille
année periode
fournisseur
trimestre produit
mois Magasins
magasin
jour
IDmag
unités_vendues nom
montant_ventes ville
département
taxes_ventes pays
Modèle en flocon
Le modèle en flocon est aussi un modèle dénormalisé, mais un peu moins que le modèle
en étoile : il conserve un certain niveau de décomposition pour chaque dimension.
Modèle en flocon

• Raffinement du schéma étoile avec des tables normalisées par


dimensions

Produits Fournisseurs
IDprod IDfour
description description
couleur type
taille Adresse
Ventes IDfour

• Avantages
– Évite les redondances
– Plusieurs tables de faits à dimensions partagées
Extraction Transformation Loading
L'ETL (Extraction Transformation Loading) est le processus de copie des données Extraction
Transformation Loading depuis les tables des systèmes transactionnels vers les tables du
modèle en étoile du data warehouse.
Exemple de modèle dimensionnel en étoile
Les outils du décisionnel
Principaux types d'outils d'une architecture décisionnel

ETL: Ils permettent de concevoir et d'organiser les processus de migration du système


transactionnel vers le système décisionnel.
Reporting: Ils permettent :
➢ la création graphique de rapport
➢ l'accès aux sources de données via des API dédiées
Exploration: Ils permettent de manipuler interactivement des cubes multidimensionnels
(choix des dimensions à croiser et des types d'agrégations à effectuer)
Analyse:Ils permettent l'analyse statistique de données.
Exemples d'outils Open Source
Outil d'ETL Talend
Outil de reporting Birt
Outil d'exploration de données JPivot
Outil d'analyse statistique Weka
SGBD orientés décisionnel

Il est possible d'utiliser une base relationnelle classique pour implémenter un entrepôt de
données modélisé en étoile.
Il existe également des technologies dédiées (qui peuvent s'appuyer sur des bases
relationnelles ou sur des structures de données dédiées).
Le mouvement NoSQL réintègre progressivement des problématiques décisionnelles,
reconfigurant petit à petit les approches technologiques liées à ce domaine.
Logiciels d’ETL
Interfaces graphiques pour le non-spécialiste
➢ Anatella2
➢ DataStudio (Data)
➢ Feature Manipulation Engine (FME)
➢ Hurence avec un ETL natif Hadoop
➢ IBM InfoSphere DataStage
➢ Informatica PowerCenter
➢ MapReport
➢ Microsoft SQL Server Integration Services (SSIS)
➢ OpenText Genio
➢ Oracle Data Integrator (Sunopsis)
➢ Oxio Data Intelligence solution ETL
➢ SAP Data Services
➢ SAS Data Integration Studio
➢ Stambia
➢ STATISTICA ETL (StatSoft)
➢ Pentaho Data Integration
➢ BusinessObjects, Data Integrator, [Link]
➢ Oracle Corporation, Warehouse builder,
[Link]
➢ IBM, Websphere Datastage , [Link]
18
Exemple des DataSets

[Link]
[Link]
[Link]

Vous aimerez peut-être aussi