TP MapReduce : Compteur de Mots Hadoop

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

5 vues3 pages

TP MapReduce : Compteur de Mots Hadoop

Transféré par

ettaoussisoukaina7

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP MapReduce

Dans ce TP, nous manipulerons l’exemple « Word Count » ou « Compteur d’occurrence de mots
» vu en cours.

Préparation du TD

1. Démarrer la machine virtuelle.

2. Démarrer les services de Hadoop avec les commandes :

$ [Link]
$ [Link]

3. Vérifier le bon fonctionnement de Hadoop. Utiliser l'outil jps pour lister les processus Java
en cours d'exécution :
$ jps
3631 Jps
3336 NodeManager
3212 ResourceManager
3651 NameNode
2863 DataNode
3052 SecondaryNameNode

4. Vérifier que l'environnement de compilation est fonctionnel.

(Vérifier que Java est bien installé sur votre machine « java –version »).

5. Décompresser l'archive :
$ unzip tp_bigdata_mr.zip

Manipulation de l’exemple
Nous allons maintenant compiler le code d'exemple Java du cours (compteur d’occurrence de
mots).

1. Changer le répertoire courant :

$ cd tp_bigdata_mr

2. Compiler le programme Hadoop (le tout sur la même ligne) :

javac -classpath "/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/common/hadoop-common-
[Link]:/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-client-common-
[Link]:/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/common/lib/commons-cli-
[Link]:/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/mapreduce/[Link]" WCount*java
La compilation va générer trois fichiers .class: un pour chacune de nos classes (driver, map et
reduce).

3. On va désormais packager le programme d'exemple au sein d'un fichier .jar. Créer

l'arborescence liée au nom du package avec la commande :
$ mkdir wordcount
Et déplacer, par la suite, les fichiers compilés au sein de cette arborescence : $ mv *.class
wordcount

4. Générer le .jar :

$ jar -cvf [Link] -C . wordcount

5. En préparation de l'exécution de notre programme Hadoop, nous allons maintenant déplacer le

texte du poème sur HDFS. Exécuter la commande :
$ hadoop fs -put [Link] /
et vérifier sa présence avec la commande : $ hadoop fs -ls /

6. Enfin, exécuter notre programme Hadoop avec la commande :

$ hadoop jar [Link] [Link] /[Link] /results

La commande devrait prendre tout au plus quelques secondes à s'exécuter.

Si tout s'est passé correctement, un message « [Link]: map 100% reduce 100% »
devrait s'afficher.

7. Vérifier la présence des fichiers de résultats dans le répertoire /results avec la commande :
$ hadoop fs -ls /results

(un fichier _SUCCESS devrait être présent, ainsi qu'un fichier part-r-00000).
8. Enfin, afficher les résultats finaux avec la commande :
$ hadoop fs -cat /results/part-r-00000

Le mot « qui » devrait être le plus présent au sein de la poème (25 occurrences).
Consultez la figure 1 ci-dessous.

Vous aimerez peut-être aussi

TP Big Data : Compteur de Mots Hadoop
Pas encore d'évaluation
TP Big Data : Compteur de Mots Hadoop
8 pages
Installation et exécution de Hadoop
Pas encore d'évaluation
Installation et exécution de Hadoop
4 pages
Exécution d'un Compteur de Mots Hadoop
Pas encore d'évaluation
Exécution d'un Compteur de Mots Hadoop
12 pages
Tutoriel Hadoop MapReduce en Français
Pas encore d'évaluation
Tutoriel Hadoop MapReduce en Français
4 pages
Programme WordCount avec MapReduce
Pas encore d'évaluation
Programme WordCount avec MapReduce
4 pages
Compte de mots avec MapReduce en Java
Pas encore d'évaluation
Compte de mots avec MapReduce en Java
7 pages
Atelier MapReduce : Traitement de données HDFS
Pas encore d'évaluation
Atelier MapReduce : Traitement de données HDFS
3 pages
Configuration et Exécution de Hadoop
Pas encore d'évaluation
Configuration et Exécution de Hadoop
2 pages
Introduction à Hadoop et MapReduce
100% (1)
Introduction à Hadoop et MapReduce
5 pages
Fascicule TP3 PART II - MAPREDUCE - 4GI
Pas encore d'évaluation
Fascicule TP3 PART II - MAPREDUCE - 4GI
2 pages
Atelier MapReduce-Diff
Pas encore d'évaluation
Atelier MapReduce-Diff
6 pages
WordCount avec Hadoop MapReduce
Pas encore d'évaluation
WordCount avec Hadoop MapReduce
3 pages
Compte de Mots avec Hadoop
Pas encore d'évaluation
Compte de Mots avec Hadoop
5 pages
TP2 MR
Pas encore d'évaluation
TP2 MR
5 pages
Commandes Shell et WordCount Hadoop
Pas encore d'évaluation
Commandes Shell et WordCount Hadoop
1 page
TP Mapreduce
Pas encore d'évaluation
TP Mapreduce
6 pages
Introduction à Map-Reduce et TP Hadoop
Pas encore d'évaluation
Introduction à Map-Reduce et TP Hadoop
7 pages
Modèle MapReduce : TP WordCount
Pas encore d'évaluation
Modèle MapReduce : TP WordCount
25 pages
Compteur de mots avec MapReduce en Java
Pas encore d'évaluation
Compteur de mots avec MapReduce en Java
22 pages
Guide Hadoop : Commandes HDFS et MapReduce
Pas encore d'évaluation
Guide Hadoop : Commandes HDFS et MapReduce
32 pages
Application MapReduce WordCount sur Cloudera
Pas encore d'évaluation
Application MapReduce WordCount sur Cloudera
9 pages
Introduction au Job MapReduce WordCount
Pas encore d'évaluation
Introduction au Job MapReduce WordCount
8 pages
Exécution de MapReduce avec Hadoop
Pas encore d'évaluation
Exécution de MapReduce avec Hadoop
5 pages
Introduction au Framework MapReduce
Pas encore d'évaluation
Introduction au Framework MapReduce
7 pages
TP Hadoop : Méthodologie Big Data
Pas encore d'évaluation
TP Hadoop : Méthodologie Big Data
17 pages
Guide Hadoop MapReduce WordCount
Pas encore d'évaluation
Guide Hadoop MapReduce WordCount
4 pages
Tutoriel Java WordCount avec Hadoop
Pas encore d'évaluation
Tutoriel Java WordCount avec Hadoop
11 pages
MapReduce sur Hadoop : Guide Pratique
Pas encore d'évaluation
MapReduce sur Hadoop : Guide Pratique
5 pages
MapReduce : Exemples de Code Hadoop
Pas encore d'évaluation
MapReduce : Exemples de Code Hadoop
10 pages
TP2 : WordCount avec Hadoop et Python
Pas encore d'évaluation
TP2 : WordCount avec Hadoop et Python
4 pages
Compte rendu TP Big Data: Hadoop et MapReduce
Pas encore d'évaluation
Compte rendu TP Big Data: Hadoop et MapReduce
6 pages
Compte Rendu TP Big Data: Hadoop
Pas encore d'évaluation
Compte Rendu TP Big Data: Hadoop
6 pages
MapReduce avec Hadoop : Guide Pratique
Pas encore d'évaluation
MapReduce avec Hadoop : Guide Pratique
12 pages
Programmation Hadoop : TP Anagrammes
Pas encore d'évaluation
Programmation Hadoop : TP Anagrammes
6 pages
Modèle MapReduce pour le Big Data
Pas encore d'évaluation
Modèle MapReduce pour le Big Data
25 pages
Manipulation de Hadoop : HDFS et MapReduce
Pas encore d'évaluation
Manipulation de Hadoop : HDFS et MapReduce
5 pages
MapReduce WordCount en Python
Pas encore d'évaluation
MapReduce WordCount en Python
12 pages
Introduction à Hadoop MapReduce
Pas encore d'évaluation
Introduction à Hadoop MapReduce
4 pages
Mise en place d'un cluster Hadoop avec Docker
Pas encore d'évaluation
Mise en place d'un cluster Hadoop avec Docker
12 pages
MapReduce avec Python sur Hadoop
Pas encore d'évaluation
MapReduce avec Python sur Hadoop
5 pages
Introduction à Hadoop MapReduce et WordCount
Pas encore d'évaluation
Introduction à Hadoop MapReduce et WordCount
8 pages
Programmation Hadoop en Java
100% (1)
Programmation Hadoop en Java
11 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
10 pages
Exécution de MapReduce avec Hadoop YARN
Pas encore d'évaluation
Exécution de MapReduce avec Hadoop YARN
7 pages
TP3 MapReduce avec Hadoop et Eclipse
Pas encore d'évaluation
TP3 MapReduce avec Hadoop et Eclipse
3 pages
Traitement Batch avec Hadoop et MapReduce
Pas encore d'évaluation
Traitement Batch avec Hadoop et MapReduce
11 pages
TP Big Data : Projet WordCount Java
Pas encore d'évaluation
TP Big Data : Projet WordCount Java
10 pages
MapReduce en Python pour Big Data
Pas encore d'évaluation
MapReduce en Python pour Big Data
3 pages
Introduction à Hadoop et Map-Reduce
Pas encore d'évaluation
Introduction à Hadoop et Map-Reduce
8 pages
Introduction au MapReduce et WordCount
Pas encore d'évaluation
Introduction au MapReduce et WordCount
3 pages
Traitement Batch avec Hadoop et MapReduce
Pas encore d'évaluation
Traitement Batch avec Hadoop et MapReduce
10 pages
Exercices MapReduce avec Hadoop
88% (8)
Exercices MapReduce avec Hadoop
3 pages
Tutoriel MapReduce avec Hadoop
Pas encore d'évaluation
Tutoriel MapReduce avec Hadoop
5 pages
Installer et utiliser Hadoop en TD
Pas encore d'évaluation
Installer et utiliser Hadoop en TD
6 pages
MapReduce : WordCount et Ventes Magasin
Pas encore d'évaluation
MapReduce : WordCount et Ventes Magasin
9 pages
Atelier sur Hadoop et Docker
Pas encore d'évaluation
Atelier sur Hadoop et Docker
11 pages
Initiation à Hadoop et MapReduce en TP
100% (1)
Initiation à Hadoop et MapReduce en TP
9 pages
TP1 : Introduction à Hadoop et MapReduce
Pas encore d'évaluation
TP1 : Introduction à Hadoop et MapReduce
15 pages
Introduction à Hadoop et Map-Reduce
100% (1)
Introduction à Hadoop et Map-Reduce
9 pages
Introduction à l'algorithmique LIFAP1
Pas encore d'évaluation
Introduction à l'algorithmique LIFAP1
59 pages
Site Web Et Base de Données - HTML, CSS & JS - Ing3 - 2026
Pas encore d'évaluation
Site Web Et Base de Données - HTML, CSS & JS - Ing3 - 2026
61 pages
Langages de Manipulation de Données
Pas encore d'évaluation
Langages de Manipulation de Données
8 pages
Fondamentaux des tests logiciels et processus
Pas encore d'évaluation
Fondamentaux des tests logiciels et processus
25 pages
Développement d'applications avec Dart
Pas encore d'évaluation
Développement d'applications avec Dart
21 pages
Introduction aux SGBD et SQL
Pas encore d'évaluation
Introduction aux SGBD et SQL
17 pages
Examen HTML, CSS et JavaScript 2023
Pas encore d'évaluation
Examen HTML, CSS et JavaScript 2023
2 pages
Introduction à JDBC et types de pilotes
Pas encore d'évaluation
Introduction à JDBC et types de pilotes
17 pages
Architecture de Java RMI expliquée
Pas encore d'évaluation
Architecture de Java RMI expliquée
19 pages
Procédure de dépannage VCM Runtime
Pas encore d'évaluation
Procédure de dépannage VCM Runtime
4 pages
Différences entre Node.js et MySQL
Pas encore d'évaluation
Différences entre Node.js et MySQL
8 pages
Initiation au langage Python
Pas encore d'évaluation
Initiation au langage Python
7 pages
Appels Système et Processus sous Linux
Pas encore d'évaluation
Appels Système et Processus sous Linux
27 pages
Optimisation de la gestion chez B@IT Health
Pas encore d'évaluation
Optimisation de la gestion chez B@IT Health
33 pages
Boucles "for" et "while" en Python
Pas encore d'évaluation
Boucles "for" et "while" en Python
5 pages
Application de Gestion des Musiciens Chrétiens
Pas encore d'évaluation
Application de Gestion des Musiciens Chrétiens
38 pages
Bases de données objets avec Oracle
Pas encore d'évaluation
Bases de données objets avec Oracle
71 pages
Mini Projet Java : Connexion MySQL
Pas encore d'évaluation
Mini Projet Java : Connexion MySQL
9 pages
Activités de programmation avec Scratch 3.0
Pas encore d'évaluation
Activités de programmation avec Scratch 3.0
4 pages
Présentation Cours Python 2-113-140
Pas encore d'évaluation
Présentation Cours Python 2-113-140
28 pages
Programmation Modulaire en Pascal
Pas encore d'évaluation
Programmation Modulaire en Pascal
44 pages
Introduction au Jeu de la Vie en Caml
Pas encore d'évaluation
Introduction au Jeu de la Vie en Caml
6 pages
Examen sur le Génie Logiciel Agile
Pas encore d'évaluation
Examen sur le Génie Logiciel Agile
11 pages
Conteneurs STL en C++ : Guide Pratique
Pas encore d'évaluation
Conteneurs STL en C++ : Guide Pratique
36 pages
Solutions QCM Informatique II Hiver 2021
Pas encore d'évaluation
Solutions QCM Informatique II Hiver 2021
21 pages
Comprendre les Interfaces en Java
Pas encore d'évaluation
Comprendre les Interfaces en Java
9 pages
Programmation Événementielle 2018-2019
Pas encore d'évaluation
Programmation Événementielle 2018-2019
81 pages
Exercices C++ : Manipulation de tableaux
Pas encore d'évaluation
Exercices C++ : Manipulation de tableaux
13 pages
7 Principes du Génie Logiciel
Pas encore d'évaluation
7 Principes du Génie Logiciel
50 pages
Programmes C++ sur les boucles for et while
Pas encore d'évaluation
Programmes C++ sur les boucles for et while
5 pages