0% ont trouvé ce document utile (0 vote)

21 vues14 pages

Introduction aux Bases de Données NoSQL

Le document présente les bases de données NoSQL, qui sont conçues pour gérer des volumes massifs de données non structurées et distribuées, en surmontant les limites des bases de données relationnelles. Il décrit les caractéristiques, avantages et inconvénients des bases NoSQL, ainsi que les typologies telles que clé/valeur, orientées documents, colonnes et graphes. Enfin, il aborde des concepts avancés comme le sharding et les Replica Sets dans MongoDB pour assurer la scalabilité et la haute disponibilité des données.

Transféré par

zitouniyassine30

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

21 vues14 pages

Introduction aux Bases de Données NoSQL

Transféré par

zitouniyassine30

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction aux Bases de Données NoSQL

Introduction
NoSQL signifie "Not Only SQL" et désigne des bases de données non
relationnelles adaptées aux besoins modernes de gestion de données.
• Origine : Popularisé en 2009 lors d’un séminaire sur les bases innovantes
n'utilisant pas exclusivement SQL.
• Objectifs : Répondre aux limites des bases relationnelles face aux données
massives, non structurées, et distribuées.
• Limites des Bases de Données Relationnelles (BDR)
• Scalabilité :
o Difficulté à évoluer horizontalement dans un environnement distribué.
o Nécessite une scalabilité verticale coûteuse.
• Point unique de défaillance : Centralisation des données sur un serveur
unique, augmentant les risques.
• Performance limitée :
o Moins efficace pour gérer des volumes massifs de données.
o Dépendance aux jointures et indices.
• Rigidité : Modèle de données fixe et contraint par un schéma prédéfini.
• Contrainte ACID : Les propriétés ACID sont difficiles à maintenir dans des
environnements distribués.

• Propriétés ACID des Bases Relationnelles

• Les Bases de Données NoSQL
• Définition : Conçues pour des applications nécessitant des volumes massifs,
une grande disponibilité et une gestion flexible des données.
• Caractéristiques :
o Architecture distribuée.
o Modèle sans schéma, flexible pour des données variées.
o Haute disponibilité grâce aux propriétés BASE (Basically Available, Soft-
state, Eventual consistency).
• Avantages :
o Tolérance aux pannes.
o Scalabilité horizontale facile.
o Adaptées aux données non structurées et aux besoins analytiques.
• Inconvénients :
o Manque de standardisation (pas de langage universel comme SQL).
o Plus de travail au niveau du code.
o Technologie encore jeune, avec des outils parfois limités.
• Théorème CAP et Propriétés BASE
• Théorème CAP : Dans un système distribué, il est impossible de garantir
simultanément :
o Cohérence (Consistency) : Tous les nœuds du système montrent les
mêmes données.
o Disponibilité (Availability) : Chaque requête reçoit une réponse, même
en cas de panne.
o Tolérance aux partitions (Partition Tolerance) : Le système continue à
fonctionner même si des partitions réseau se produisent.
• Propriétés BASE :
o Basically Available : Garantie de disponibilité même en cas de panne.
o Soft-state : L’état du système peut changer avec le temps.
o Eventual Consistency : La cohérence est atteinte après un certain
délai.

• Typologies des Bases NoSQL

1. Clé/Valeur :
o Stockage simple de paires clé-valeur.
o Avantages : Rapidité et simplicité.
o Exemples : DynamoDB, Redis.
2. Orientées Documents :
o Les documents contiennent des structures typées (JSON, XML).
o Avantages : Récupération facile de données semi-structurées.
o Exemples : MongoDB, CouchDB.
3. Orientées Colonnes :
o Ressemblent aux bases relationnelles mais avec colonnes
dynamiques.
o Avantages : Adaptées aux analyses massives et CMS.
o Exemples : Cassandra, HBase.
4. Orientées Graphes :
o Basées sur des relations entre les données sous forme de graphes.
o Avantages : Idéal pour les réseaux sociaux et moteurs de
recommandation.
o Exemples : Neo4J, OrientDB.
Comparaison NoSQL vs BDR

Conclusion
• Les bases relationnelles et NoSQL ne s'excluent pas mutuellement, mais se
complètent.
• Les BDR restent dominantes pour les transactions nécessitant une forte
cohérence (ACID).
• Les bases NoSQL sont idéales pour le Big Data, les données non structurées
et les systèmes distribués nécessitant une haute disponibilité.
• Le choix dépend des besoins spécifiques : type de données, volumes,
performances et scalabilité.
Chapitre 2 : Introduction à la Base de Données Orientée Documents MongoDB

Structure de données – document

Données avec un schéma flexible
▪ Stockées sur le disque sous forme de documents BSON

✔ Documents BSON (Binary JSON) : représentation binaire sérialisées d’un

document JSON

✔ Supporte plus de types de données que JSON (documents, tableaux, tableaux de

documents,…)
▪ Taille max d’un document : 16 Mo
Pour les documents plus volumineux, l’API GridFS divise les données en fragments
(chunks) de taille uniforme, stockés comme des documents distincts.
▪ Les documents sont organisés en collections
Exemples de documents :
Terminologie :

Modélisation - quelques règles simples

Modélisation - quelques règles simples
Ne pas oubliez d’en tenir compte
▪ Besoin de l’ensemble des données à chaque requête

 Une seule collection

▪ Besoin d’avoir seulement une partie de données

 Plusieurs collections et des références

▪ Exemple : les posts d’un blog et leurs commentaires

✔ 2 besoins : affichage liste des posts + affichage post avec commentaires

✔ Modélisation avec 2 collections (posts, comments)

Sharding – principe
Pour gérer de grandes quantités de données et améliorer les performances,
MongoDB utilise le sharding, une méthode de scalabilité horizontale. Le sharding
consiste à diviser les données et à les répartir sur plusieurs machines, appelées
nœuds, qui forment un cluster.
Les données peuvent être distribuées :
• Arbitrairement, ou
• En fonction d’une clé de partitionnement (sharding_key), qui est un champ
commun à tous les documents.
Cela permet d’équilibrer la charge et de gérer efficacement des bases de données
volumineuses.
Sharding – Architecture d’un cluster

▪ Un sharded cluster est composé de 3 principaux éléments :

▪ Serveur de configuration
▪ Shards (ou nœuds)
▪ Routeur
❖ Serveur de configuration :
▪ Stocke les métadonnées et les paramètres de configuration du cluster
▪ Est en charge de la localisation des données, il sait quelles données se trouvent sur
quels shards
▪ Agit comme un équilibreur de charge (load balancer)
❖ Shard (ou nœud) :
▪ Contient un sous ensemble de données
▪ S’il est saturé, il suffit d’ajouter d’autres shards => scalabilité horizontale
❖ Routeur : mongos
▪ Une instance mongos permet de router les requêtes vers le shard approprié
▪ Elle agit comme routeur
▪ Elle joue le rôle d’interface entre l’application cliente et le sharded cluster : le
routeur communique avec le serveur de configuration pour connaître la répartition
des données et donc choisir le bon shard.

Sharding – Atouts d’un cluster

Le sharding dans MongoDB présente plusieurs avantages :
• Répartition de charge (load balancing) : Les données sont distribuées sur
plusieurs machines, évitant qu’un seul serveur ne soit surchargé.
• Temps de réponse plus rapides : Les requêtes sont traitées en parallèle sur
des ensembles de données plus petits.
• Ajout de serveurs sans interruption : La capacité du cluster peut être
augmentée sans perturber le service.
Cependant, un cluster basé uniquement sur le sharding n’est pas suffisamment disponibl
Si un serveur tombe en panne, le cluster entier peut être impacté.

Pour garantir la haute disponibilité et la tolérance aux pannes, il est nécessaire d’utilis
des mécanismes supplémentaires comme la réplication (Replica Set), où chaque shard e
sauvegardé sur plusieurs nœuds. Cela assure que les données restent accessibles même e
cas de défaillance d’un serveur.
Replica set – Principe
Un Replica Set dans MongoDB est un mécanisme de réplication utilisé pour garantir
la haute disponibilité et éviter la perte de données. Voici les principes expliqués
simplement :
1. Fonctionnement d’un Replica Set :
o C’est un groupe de serveurs (instances) qui contiennent les mêmes
données.
o Il comprend un nœud primaire (pour gérer les opérations de
lecture/écriture) et plusieurs nœuds secondaires (copies de secours qui
répliquent les données du primaire).
2. Élection en cas de panne :

• Si le nœud primaire devient inactif (après 10 secondes sans réponse),

• l’un des nœuds secondaires est automatiquement élu comme nouveau nœud
primaire.
• Ce processus est rapide, automatique et transparent pour l’utilisateur (environ 1
minute).
• Si l’ancien nœud primaire revient, il synchronise ses données avec le nouveau
primaire. S’il a des données supplémentaires, il effectue un rollback pour se
mettre à jour.
3. Votes et Arbitre :
o Un Replica Set peut contenir jusqu’à 50 nœuds, mais seulement 7
peuvent voter.

o Pour élire un nouveau primaire, une majorité qualifiée de votes est

nécessaire.

o Exemple : Dans un ensemble de 3 nœuds, au moins 2 votes sont

nécessaires pour élire un primaire.

o Si la majorité n’est pas atteinte (ex. 2 nœuds tombent), les données

deviennent inaccessibles.
o Pour éviter cela, on peut ajouter un arbitre :

o Un arbitre ne contient pas de données, utilise peu de ressources et

participe uniquement aux votes pour garantir une majorité.
Le Replica Set garantit la disponibilité des données et la continuité du service en
cas de panne, grâce à un système de redondance, d’élections automatiques et
de votes sécurisés.

Architecture hautement disponible

On modifie l’architecture précédente (page 13) pour la rendre hautement disponible.
▪ Le serveur de configuration est transformé en un réplica set composé de 3
instances. Chaque shard est un réplica set formé de 2 instances et d’un arbitre.

❖ Exemple
Prenons un document Personne qui contient le nom, le prénom et l’âge d’une
personne. On choisit l’âge comme clé de sharding. MongoDB va définir
automatiquement des intervalles d’âges. Le premier shard contiendra toutes les
personnes de moins de 20 ans, le shard 2 toutes celles qui ont entre 20 et 40 ans, et
le dernier shard les personnes de plus de 40 ans. Quand un nouveau document sera
ajouté dans la base, il sera directement dirigé vers le shard qui lui correspond, ici la
personne a 32 ans, elle sera donc stockée sur le shard 2. C’est le routeur (mongos)
qui est chargé d’orienté le document.

Vous aimerez peut-être aussi

Introduction à MongoDB et ses fonctionnalités
Pas encore d'évaluation
Introduction à MongoDB et ses fonctionnalités
24 pages
Introduction à MongoDB et Big Data
Pas encore d'évaluation
Introduction à MongoDB et Big Data
37 pages
Introduction à MongoDB NoSQL
Pas encore d'évaluation
Introduction à MongoDB NoSQL
14 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
16 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
70 pages
Introduction aux Bases de Données NoSQL
Pas encore d'évaluation
Introduction aux Bases de Données NoSQL
5 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
19 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
36 pages
MongoDB : Guide des bases NoSQL
Pas encore d'évaluation
MongoDB : Guide des bases NoSQL
81 pages
Chapitre 10 - Le NoSQL Avec MongoDB - Le Sharding
Pas encore d'évaluation
Chapitre 10 - Le NoSQL Avec MongoDB - Le Sharding
20 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
19 pages
Bases de Données NoSQL et MongoDB
Pas encore d'évaluation
Bases de Données NoSQL et MongoDB
34 pages
Étude de cas sur MongoDB et ses avantages
Pas encore d'évaluation
Étude de cas sur MongoDB et ses avantages
6 pages
Principes et enjeux du NoSQL
Pas encore d'évaluation
Principes et enjeux du NoSQL
41 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
53 pages
Introduction à NoSQL et MongoDB
Pas encore d'évaluation
Introduction à NoSQL et MongoDB
60 pages
Avantages et cas d'utilisation des bases NoSQL
Pas encore d'évaluation
Avantages et cas d'utilisation des bases NoSQL
8 pages
Chapitre 3 - Mongo DB - Une Base de Données NoSql
Pas encore d'évaluation
Chapitre 3 - Mongo DB - Une Base de Données NoSql
40 pages
Introduction aux Bases de Données NoSQL
Pas encore d'évaluation
Introduction aux Bases de Données NoSQL
42 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
39 pages
Chapitre 8
Pas encore d'évaluation
Chapitre 8
9 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
33 pages
Module5 NoSQL Cours Detaille
Pas encore d'évaluation
Module5 NoSQL Cours Detaille
9 pages
Gérer efficacement une base de données NoSQL
Pas encore d'évaluation
Gérer efficacement une base de données NoSQL
34 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
15 pages
Architecture de MongoDB
Pas encore d'évaluation
Architecture de MongoDB
14 pages
MongoDB : Intégrité et Performance
Pas encore d'évaluation
MongoDB : Intégrité et Performance
16 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
33 pages
Gestion des fichiers et sharding MongoDB
Pas encore d'évaluation
Gestion des fichiers et sharding MongoDB
6 pages
Introduction à Cassandra et MongoDB NoSQL
Pas encore d'évaluation
Introduction à Cassandra et MongoDB NoSQL
21 pages
Formation MongoDB : Concepts et Pratiques
Pas encore d'évaluation
Formation MongoDB : Concepts et Pratiques
89 pages
Introduction à MongoDB et SGBD NoSQL
Pas encore d'évaluation
Introduction à MongoDB et SGBD NoSQL
23 pages
COURSNOSQL
Pas encore d'évaluation
COURSNOSQL
58 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
7 pages
Introduction aux bases de données NoSQL
100% (1)
Introduction aux bases de données NoSQL
163 pages
Big Data et Bases de Données NoSQL
Pas encore d'évaluation
Big Data et Bases de Données NoSQL
18 pages
Chapitre 2 - Le NoSQL Avec MongoDB
Pas encore d'évaluation
Chapitre 2 - Le NoSQL Avec MongoDB
21 pages
MongoDB : Indexation, Réplication et Sharding
Pas encore d'évaluation
MongoDB : Indexation, Réplication et Sharding
8 pages
Ch1 - BD Orientée Document
Pas encore d'évaluation
Ch1 - BD Orientée Document
78 pages
Comprendre les 5 V du Big Data
Pas encore d'évaluation
Comprendre les 5 V du Big Data
26 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
6 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
55 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
5 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
63 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
21 pages
Sharding et Réplication dans MongoDB
Pas encore d'évaluation
Sharding et Réplication dans MongoDB
13 pages
02 NoSQL Cours
Pas encore d'évaluation
02 NoSQL Cours
81 pages
Introduction à MongoDB et Modélisation JSON
Pas encore d'évaluation
Introduction à MongoDB et Modélisation JSON
31 pages
Introduction à MongoDB et JSON
Pas encore d'évaluation
Introduction à MongoDB et JSON
31 pages
Introduction aux Bases de Données NoSQL
Pas encore d'évaluation
Introduction aux Bases de Données NoSQL
37 pages
MongoDB et Big Data : Caractéristiques NoSQL
Pas encore d'évaluation
MongoDB et Big Data : Caractéristiques NoSQL
13 pages
Introduction aux Bases de Données NoSQL
Pas encore d'évaluation
Introduction aux Bases de Données NoSQL
3 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
16 pages
Comparatif des Bases de Données NoSQL
Pas encore d'évaluation
Comparatif des Bases de Données NoSQL
16 pages
Chapitre 9 - Le NoSQL Avec MongoDB - La Réplicationd
Pas encore d'évaluation
Chapitre 9 - Le NoSQL Avec MongoDB - La Réplicationd
17 pages
Support de La Formation MongoDB Administration - SS
0% (1)
Support de La Formation MongoDB Administration - SS
123 pages
Big Data et Bases NoSQL : Guide Complet
Pas encore d'évaluation
Big Data et Bases NoSQL : Guide Complet
38 pages
Calcul de puissances en Scratch
Pas encore d'évaluation
Calcul de puissances en Scratch
2 pages
Régulation des Services Publics au Cameroun
Pas encore d'évaluation
Régulation des Services Publics au Cameroun
347 pages
Devoir Histoire-Géo 4ème : Bénin 2024
Pas encore d'évaluation
Devoir Histoire-Géo 4ème : Bénin 2024
2 pages
Lecture et écriture des grands nombres
Pas encore d'évaluation
Lecture et écriture des grands nombres
3 pages
Liste de parfums 2025 à prix attractifs
Pas encore d'évaluation
Liste de parfums 2025 à prix attractifs
12 pages
Guide de création de listes d'emails lucratives
Pas encore d'évaluation
Guide de création de listes d'emails lucratives
75 pages
Cycle de charge d'une batterie lithium-ion
Pas encore d'évaluation
Cycle de charge d'une batterie lithium-ion
10 pages
Prélèvement d'urine sur sonde urinaire
Pas encore d'évaluation
Prélèvement d'urine sur sonde urinaire
2 pages
Impact de l'Homme sur l'Environnement
Pas encore d'évaluation
Impact de l'Homme sur l'Environnement
4 pages
Exercices sur les questions tag en français
Pas encore d'évaluation
Exercices sur les questions tag en français
14 pages
Outils d'Information pour Associations
Pas encore d'évaluation
Outils d'Information pour Associations
36 pages
Identité personnelle et collective en société
Pas encore d'évaluation
Identité personnelle et collective en société
8 pages
Révision du droit des brevets OAPI
Pas encore d'évaluation
Révision du droit des brevets OAPI
28 pages
Devoir de Sciences Physiques TL2 - Bignona
Pas encore d'évaluation
Devoir de Sciences Physiques TL2 - Bignona
2 pages
Brevet Blanc SVT : Trisomie et Évolution
Pas encore d'évaluation
Brevet Blanc SVT : Trisomie et Évolution
4 pages
Proventriculite virale chez les poulets en France
Pas encore d'évaluation
Proventriculite virale chez les poulets en France
4 pages
Exercices sur l'écriture fractionnaire
100% (1)
Exercices sur l'écriture fractionnaire
3 pages
Sommaire DreamWeaver
Pas encore d'évaluation
Sommaire DreamWeaver
2 pages
Réglage et Sécurité du Contrôleur NCE
Pas encore d'évaluation
Réglage et Sécurité du Contrôleur NCE
56 pages
Astuces et Codes pour le Jeu Égyptien
Pas encore d'évaluation
Astuces et Codes pour le Jeu Égyptien
3 pages
Frais de Scolarité UCAO Dakar 2023
Pas encore d'évaluation
Frais de Scolarité UCAO Dakar 2023
1 page
Vocabulaire des sports en français
100% (1)
Vocabulaire des sports en français
3 pages
Marches aléatoires et mouvement brownien
Pas encore d'évaluation
Marches aléatoires et mouvement brownien
5 pages
Rapport de stage au CIME 2022
Pas encore d'évaluation
Rapport de stage au CIME 2022
20 pages
Hygiène et Change du Nourrisson
Pas encore d'évaluation
Hygiène et Change du Nourrisson
21 pages
Présent progressif et futur en anglais
Pas encore d'évaluation
Présent progressif et futur en anglais
1 page
Solutions Innovantes pour Transformation Digitale
Pas encore d'évaluation
Solutions Innovantes pour Transformation Digitale
28 pages
Gestion de patrimoine et hypothèques UBS
Pas encore d'évaluation
Gestion de patrimoine et hypothèques UBS
9 pages
Rapport annuel COBAC 2010 CEMAC
Pas encore d'évaluation
Rapport annuel COBAC 2010 CEMAC
99 pages
L'Antilope Rusée : Un Conte Africain
Pas encore d'évaluation
L'Antilope Rusée : Un Conte Africain
2 pages