Codage des caractères : ASCII à Unicode

Le document traite de la standardisation du codage des caractères alphabétiques, en présentant les normes ASCII, ISO-8859 et Unicode. ASCII, créé en 1960, utilise 7 bits pour coder 128 caractères, tandis qu'ISO-8859 étend cela à 8 bits avec plusieurs versions, dont Latin-1 pour les langues d'Europe de l'Ouest. Unicode, avec des formats comme UTF-8, UTF-16 et UTF-32, vise à inclure tous les caractères des langues du monde, avec UTF-8 étant le plus utilisé sur le web.

Transféré par

henokberuh

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

23 vues3 pages

Codage des caractères : ASCII à Unicode

Transféré par

henokberuh

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Page 1 sur 3

Coder des caractères alphabétiques

Un besoin de standardiser :

Représenter des caractères alphabétiques en binaire est, a priori, une aﬀaire bien plus simple : il
suﬃt de se mettre d’accord sur une norme qui assigne un caractère spécifique à une chaîne de
bits donnée.

En pratique, la tâche s’avère plus compliquée que cela, notamment à cause de la question du
nombre de bits utilisés par caractère : plus ce nombre est élevé, plus il est possible de
représenter des caractères diﬀérents, mais plus chaque caractère prend de la place en mémoire,
ou dans une télécommunication.

Jusque dans les années 1960, chaque matériel informatique possédait son propre format, et les
appareils informatiques étaient souvent fournis avec des programmes et des tables de
correspondance permettant de traduire les formats d’un appareil à un autre.
Un eﬀort de standardisation a été fait à partir des années 1960, mais, comme nous allons le voir,
plusieurs formats diﬀérents existent encore à l’heure actuelle, chacun possédant des avantages
et des inconvénients sur les autres.

ASCII

Définition :

Avant 1960 de nombreux systèmes de codage de caractères existaient, ils étaient souvent
incompatibles entre eux. En 1960, l'organisation internationale de normalisation (ISO) décide de
mettre un peu d'ordre dans ce bazar en créant la norme ASCII (American Standard Code for
Information Interchange). À chaque caractère est associé un nombre binaire sur 8 bits (1 octet).
En faite, seuls 7 bits sont utilisés pour coder un caractère, le 8e bit n'est pas utilisé pour le
codage des caractères. Avec 7 bits il est possible de coder jusqu'à 128 caractères ce qui est
largement suﬃsant pour un texte écrit en langue anglaise (pas d'accents et autres lettres
particulières).
Page 2 sur 3

ISO-8859

Définition :

Le format ISO-8859 commence à être utilisé dans les années 80. Il s’agit d’une extension de
l’ASCII sur 8 bits au lieu de 7 (il y a donc deux fois plus de caractères disponibles, soit 128
nouveaux caractères).

Important :

Le format ISO-8859 existe en plusieurs versions, chacune d’entre elles possédant un ensemble
diﬀérent de caractères supplémentaires par rapport à l’ASCII. Ces diﬀérentes versions ne sont
qu’en partie compatibles les unes avec les autres.

Définitions :

Le plus utilisé (et le plus utile pour écrire en français) est sans doute le format Latin-1, ou
ISO-8859-1, qui introduit les caractères les plus couramment utilisés dans les langues d’Europe
de l’Ouest.

Unicode

Unicode a été créé pour réunir dans un seul format l’ensemble des caractères utilisables dans
toutes les langues du monde.

Le format d’Unicode le plus célèbre est UTF-8. Il utilise un nombre de bits par caractère qui
dépend du caractère : les caractères courants, ceux de l’ASCII, sont codés sur 8 bits (un octet),
certains caractères plus rares sont codés sur 4 octets. UTF-16 et UTF-32 sont deux autres
formats célèbres. Ils sont bien plus lourds, mais contiennent bien plus de caractères.

Exemple :

Par exemple, dans UTF-32, tous les caractères sont codés sur 4 octets. Un texte ne comportant
que des caractères ASCII sera donc quatre fois plus lourd en UTF-32 qu’en UTF-8, mais par
contre, le format UTF-32 comporte vraiment beaucoup de caractères (les caractères occidentaux,
cyrilliques, chinois, japonais... même les hiéroglyphes égyptiens).

Des usages différenciés

La norme ASCII est la plus utilisée pour la programmation informatique. En eﬀet, les codes des
programmes informatiques sont souvent pensés pour privilégier la fiabilité et l’eﬃcacité au confort
de lecture, et la norme ASCII est la plus ancienne. De plus, toutes les autres normes sont
compatibles avec elle, et le code ASCII est celui qui prend le moins de place en mémoire.

La norme ISO-8859 est la plus utilisée pour les documents textes (.pdf, .txt, .doc, .odt). Pour les
documents textes, chaque document n’a besoin que de signaler dans les métadonnées le type de
format ISO-8859 utilisé dans le document, ce qui permet au lecteur d’utiliser la table de
caractères adéquate pour lire le texte.

La norme UTF-8 est la plus utilisée sur le World Wide Web (plus de 92 % des sites Web). Enfin,
sur Internet, la possibilité d’être lu et compris par le plus grand nombre est essentielle, et le
format UTF-8 permet de s’assurer que des personnes venant d’un peu partout autour du globe
pourront communiquer avec le même code dans les commentaires d’une page web ou sur un
réseau social.
Page 3 sur 3

Mise en activité
Ecrire des fonctions Python permettant de passer une chaine de caractères minuscule en
majuscule et vice-versa.
Faire des recherches sur les fonctions « chr » et « ord ».

Vous aimerez peut-être aussi

Encodage des caractères en informatique
Pas encore d'évaluation
Encodage des caractères en informatique
3 pages
Codage ASCII et UTF-8 en informatique
Pas encore d'évaluation
Codage ASCII et UTF-8 en informatique
5 pages
Normes de codage : ASCII, EBCDIC, Unicode
Pas encore d'évaluation
Normes de codage : ASCII, EBCDIC, Unicode
11 pages
Normes de codage des caractères ASCII à UTF-8
Pas encore d'évaluation
Normes de codage des caractères ASCII à UTF-8
6 pages
Comprendre ASCII, Unicode et EBCDIC
Pas encore d'évaluation
Comprendre ASCII, Unicode et EBCDIC
16 pages
Codage et représentation des caractères
Pas encore d'évaluation
Codage et représentation des caractères
26 pages
Types de codes d'information en SI
Pas encore d'évaluation
Types de codes d'information en SI
7 pages
Comprendre le code ASCII
Pas encore d'évaluation
Comprendre le code ASCII
3 pages
Encodage des caractères en UTF-8
Pas encore d'évaluation
Encodage des caractères en UTF-8
1 page
Codage des caractères en binaire
Pas encore d'évaluation
Codage des caractères en binaire
3 pages
Codage des caractères : ASCII à Unicode
Pas encore d'évaluation
Codage des caractères : ASCII à Unicode
11 pages
Codage des caractères en informatique
Pas encore d'évaluation
Codage des caractères en informatique
6 pages
Codage des caractères Unicode
Pas encore d'évaluation
Codage des caractères Unicode
3 pages
Représentation des données ASCII
Pas encore d'évaluation
Représentation des données ASCII
31 pages
Codage et systèmes de numérotation
Pas encore d'évaluation
Codage et systèmes de numérotation
12 pages
Comprendre le Code ASCII en Informatique
Pas encore d'évaluation
Comprendre le Code ASCII en Informatique
10 pages
Introduction au codage des caractères
Pas encore d'évaluation
Introduction au codage des caractères
7 pages
Comprendre les bits et octets en info
Pas encore d'évaluation
Comprendre les bits et octets en info
3 pages
Codes Gray, BCD, ASCII et Unicode expliqués
Pas encore d'évaluation
Codes Gray, BCD, ASCII et Unicode expliqués
2 pages
Encodage des caractères en informatique
Pas encore d'évaluation
Encodage des caractères en informatique
2 pages
Codage ASCII et Unicode en informatique
Pas encore d'évaluation
Codage ASCII et Unicode en informatique
11 pages
Encodage des caractères ASCII et ISO
100% (1)
Encodage des caractères ASCII et ISO
10 pages
Introduction au codage des données
Pas encore d'évaluation
Introduction au codage des données
24 pages
Comprendre l'ASCII : Histoire et Utilisation
Pas encore d'évaluation
Comprendre l'ASCII : Histoire et Utilisation
4 pages
Codes de Caractères : BCD, ASCII, Unicode
Pas encore d'évaluation
Codes de Caractères : BCD, ASCII, Unicode
22 pages
Décodage du code ASCII et UTF-8
Pas encore d'évaluation
Décodage du code ASCII et UTF-8
10 pages
Comprendre l'ASCII étendu
Pas encore d'évaluation
Comprendre l'ASCII étendu
36 pages
Comprendre le code ASCII
Pas encore d'évaluation
Comprendre le code ASCII
28 pages
La Representation Des Donnees Alphanumer
Pas encore d'évaluation
La Representation Des Donnees Alphanumer
7 pages
Comprendre les encodages en informatique
Pas encore d'évaluation
Comprendre les encodages en informatique
37 pages
Codage Chaines Caracteres
Pas encore d'évaluation
Codage Chaines Caracteres
4 pages
Codage ASCII et normes de texte
Pas encore d'évaluation
Codage ASCII et normes de texte
5 pages
Chap2 - Représentation Des Données-V3
Pas encore d'évaluation
Chap2 - Représentation Des Données-V3
13 pages
Comprendre l'architecture hardware
Pas encore d'évaluation
Comprendre l'architecture hardware
43 pages
Schémas de codage des caractères
Pas encore d'évaluation
Schémas de codage des caractères
4 pages
CG 1995 20 1 0
Pas encore d'évaluation
CG 1995 20 1 0
55 pages
Comprendre le Code ASCII et ses Tables
Pas encore d'évaluation
Comprendre le Code ASCII et ses Tables
8 pages
Comprendre l'ASCII et son fonctionnement
Pas encore d'évaluation
Comprendre l'ASCII et son fonctionnement
16 pages
Introduction au codage ASCII et Unicode
Pas encore d'évaluation
Introduction au codage ASCII et Unicode
7 pages
Normes et tableau du codage ASCII
Pas encore d'évaluation
Normes et tableau du codage ASCII
2 pages
Guide sur l'encodage Unicode en Python
Pas encore d'évaluation
Guide sur l'encodage Unicode en Python
13 pages
Représentation des caractères ASCII
Pas encore d'évaluation
Représentation des caractères ASCII
14 pages
Codage ASCII et Unicode en Informatique
Pas encore d'évaluation
Codage ASCII et Unicode en Informatique
5 pages
Encodage et table ASCII en Python
Pas encore d'évaluation
Encodage et table ASCII en Python
3 pages
Histoire de l'ASCII et son impact
Pas encore d'évaluation
Histoire de l'ASCII et son impact
20 pages
Comprendre le code ASCII en détail
Pas encore d'évaluation
Comprendre le code ASCII en détail
3 pages
Codage Et Compression D'un Texte
Pas encore d'évaluation
Codage Et Compression D'un Texte
12 pages
Comprendre le code ASCII en informatique
Pas encore d'évaluation
Comprendre le code ASCII en informatique
6 pages
Systèmes de codage : ASCII, EBCDIC, Unicode
Pas encore d'évaluation
Systèmes de codage : ASCII, EBCDIC, Unicode
10 pages
Guide sur Unicode en Python
Pas encore d'évaluation
Guide sur Unicode en Python
13 pages
Représentation des données en informatique
Pas encore d'évaluation
Représentation des données en informatique
69 pages
Outils de conversion de données textuelles
Pas encore d'évaluation
Outils de conversion de données textuelles
17 pages
Norme ISO/CEI 10646: Jeu de caractères
Pas encore d'évaluation
Norme ISO/CEI 10646: Jeu de caractères
6 pages
Étude sur le Code ASCII en Informatique
100% (1)
Étude sur le Code ASCII en Informatique
5 pages
Introduction au codage des caractères
Pas encore d'évaluation
Introduction au codage des caractères
16 pages
Types de codes : Unicode et ASCII
Pas encore d'évaluation
Types de codes : Unicode et ASCII
1 page
Introduction aux codes alphanumériques
Pas encore d'évaluation
Introduction aux codes alphanumériques
8 pages
Codage des Informations Non Numériques
Pas encore d'évaluation
Codage des Informations Non Numériques
4 pages
Histoire et Évolution du Numérique
Pas encore d'évaluation
Histoire et Évolution du Numérique
47 pages
Évaluation des Travaux Encadrés au Lycée
Pas encore d'évaluation
Évaluation des Travaux Encadrés au Lycée
1 page
Introduction à Python et ses bases
Pas encore d'évaluation
Introduction à Python et ses bases
7 pages
Les mensonges et le comique dans "Le Menteur"
Pas encore d'évaluation
Les mensonges et le comique dans "Le Menteur"
2 pages
Énergie solaire : réception et albédo
Pas encore d'évaluation
Énergie solaire : réception et albédo
3 pages
Carnet d'entraînement EPS : Suivi des séances
Pas encore d'évaluation
Carnet d'entraînement EPS : Suivi des séances
1 page
Défaillances du marché et externalités
Pas encore d'évaluation
Défaillances du marché et externalités
11 pages
Règles de ponctuation en français
Pas encore d'évaluation
Règles de ponctuation en français
1 page
Analyse des polynômes CCP 2016
Pas encore d'évaluation
Analyse des polynômes CCP 2016
9 pages
Exercices de codage de l'information
Pas encore d'évaluation
Exercices de codage de l'information
6 pages
Liste complète des polices de caractères
Pas encore d'évaluation
Liste complète des polices de caractères
3 pages
Normes et documents techniques essentiels
Pas encore d'évaluation
Normes et documents techniques essentiels
11 pages
Caracteres - Codes ASCII
Pas encore d'évaluation
Caracteres - Codes ASCII
4 pages
Opérateurs et valeurs booléennes
Pas encore d'évaluation
Opérateurs et valeurs booléennes
2 pages
TP1 Codage de Linformation Correction
Pas encore d'évaluation
TP1 Codage de Linformation Correction
9 pages
Pages imprimables de Telugu Bhakti
Pas encore d'évaluation
Pages imprimables de Telugu Bhakti
13 pages
Résumé des modules Python PDF
Pas encore d'évaluation
Résumé des modules Python PDF
18 pages
Ressources Transmath 6e - 2016
Pas encore d'évaluation
Ressources Transmath 6e - 2016
7 pages
Fusionner facilement des fichiers PDF
Pas encore d'évaluation
Fusionner facilement des fichiers PDF
2 pages
Tableau des codes ASCII complet
Pas encore d'évaluation
Tableau des codes ASCII complet
11 pages
Représentation des textes en machine
Pas encore d'évaluation
Représentation des textes en machine
2 pages
Codage et Compression des Informations
Pas encore d'évaluation
Codage et Compression des Informations
42 pages
Créer un Favicon avec WordPress
Pas encore d'évaluation
Créer un Favicon avec WordPress
157 pages
Primitives usuelles en mathématiques
Pas encore d'évaluation
Primitives usuelles en mathématiques
3 pages
Changement Algorithme Etsy 2019
Pas encore d'évaluation
Changement Algorithme Etsy 2019
18 pages
Analyse des Bigrammes dans RADIOS.txt
Pas encore d'évaluation
Analyse des Bigrammes dans RADIOS.txt
6 pages
Codage binaire et caractères ASCII
Pas encore d'évaluation
Codage binaire et caractères ASCII
9 pages
Informatique : Normes et conversions de bases
Pas encore d'évaluation
Informatique : Normes et conversions de bases
2 pages
Gérer les caractères accentués en Python
Pas encore d'évaluation
Gérer les caractères accentués en Python
4 pages
Exposé Code
Pas encore d'évaluation
Exposé Code
20 pages
Convertisseur IEEE 754 et Codage Binaire
Pas encore d'évaluation
Convertisseur IEEE 754 et Codage Binaire
173 pages