0% ont trouvé ce document utile (0 vote)
5 vues3 pages

TP MapReduce : Compteur de Mots Hadoop

Transféré par

ettaoussisoukaina7
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
5 vues3 pages

TP MapReduce : Compteur de Mots Hadoop

Transféré par

ettaoussisoukaina7
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP MapReduce

Dans ce TP, nous manipulerons l’exemple « Word Count » ou « Compteur d’occurrence de mots
» vu en cours.

Préparation du TD

1. Démarrer la machine virtuelle.

2. Démarrer les services de Hadoop avec les commandes :


$ [Link]
$ [Link]

3. Vérifier le bon fonctionnement de Hadoop. Utiliser l'outil jps pour lister les processus Java
en cours d'exécution :
$ jps
3631 Jps
3336 NodeManager
3212 ResourceManager
3651 NameNode
2863 DataNode
3052 SecondaryNameNode

4. Vérifier que l'environnement de compilation est fonctionnel.


(Vérifier que Java est bien installé sur votre machine « java –version »).

5. Décompresser l'archive :
$ unzip tp_bigdata_mr.zip

Manipulation de l’exemple
Nous allons maintenant compiler le code d'exemple Java du cours (compteur d’occurrence de
mots).

1. Changer le répertoire courant :


$ cd tp_bigdata_mr

2. Compiler le programme Hadoop (le tout sur la même ligne) :


javac -classpath "/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/common/hadoop-common-
[Link]:/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-client-common-
[Link]:/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/common/lib/commons-cli-
[Link]:/home/ghazouani/Desktop/Hadoop/hadoop-
2.7.3/share/hadoop/mapreduce/[Link]" WCount*java
La compilation va générer trois fichiers .class: un pour chacune de nos classes (driver, map et
reduce).

3. On va désormais packager le programme d'exemple au sein d'un fichier .jar. Créer


l'arborescence liée au nom du package avec la commande :
$ mkdir wordcount
Et déplacer, par la suite, les fichiers compilés au sein de cette arborescence : $ mv *.class
wordcount

4. Générer le .jar :

$ jar -cvf [Link] -C . wordcount

5. En préparation de l'exécution de notre programme Hadoop, nous allons maintenant déplacer le


texte du poème sur HDFS. Exécuter la commande :
$ hadoop fs -put [Link] /
et vérifier sa présence avec la commande : $ hadoop fs -ls /

6. Enfin, exécuter notre programme Hadoop avec la commande :

$ hadoop jar [Link] [Link] /[Link] /results

La commande devrait prendre tout au plus quelques secondes à s'exécuter.


Si tout s'est passé correctement, un message « [Link]: map 100% reduce 100% »
devrait s'afficher.

7. Vérifier la présence des fichiers de résultats dans le répertoire /results avec la commande :
$ hadoop fs -ls /results

(un fichier _SUCCESS devrait être présent, ainsi qu'un fichier part-r-00000).
8. Enfin, afficher les résultats finaux avec la commande :
$ hadoop fs -cat /results/part-r-00000

Le mot « qui » devrait être le plus présent au sein de la poème (25 occurrences).
Consultez la figure 1 ci-dessous.

Vous aimerez peut-être aussi