0% ont trouvé ce document utile (0 vote)
20 vues28 pages

Techniques de Compression Vidéo

Transféré par

boutabetaymen
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
20 vues28 pages

Techniques de Compression Vidéo

Transféré par

boutabetaymen
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Signal Vidéo et Techniques de Compression

I. Techniques de compression
1) Principes et objectifs
Aujourd’hui, La compression de donnée est un outil plus utile pour réduire la taille des
fichiers. Lorsque les images, les sons ou les vidéos sont compressés, les données sont
supprimées pour réduire la taille du fichier. Ceci est très utile lors de la diffusion et du
téléchargement de fichiers.
En général, la compression des données consiste à prendre un flux de symboles et à les
transformer en codes. La compression est effectuée par un programme qui utilise une formule
ou un algorithme pour déterminer comment réduire la taille des données pour guanier
l’espace de stockage.
La compression de données est également appelée codage source ou réduction de débit est le
processus de modification, d'encodage ou de conversion de la structure des bits de données
de manière à consommer moins d'espace sur le disque. Il permet de réduire la taille de
stockage d'une ou plusieurs instances ou éléments de données.
La compression des données est souvent appelée codage, où le codage est un terme très
général englobant toute représentation spéciale des données qui satisfait un besoin donné.
Comme la compression des fichiers, l'objectif de la compression des médias est de réduire la
taille du fichier et d'économiser de l'espace disque. Cependant, les algorithmes de compression
des médias sont spécifiques à certains types de médias, tels que les fichiers image, audio et
vidéo.

La plupart des fichiers vidéo sont également compressés. Formats vidéo populaires, tels
que la compression vidéo MPEG, DivX, AVI, WMV et MP4 à l'aide d'un codec spécifique.
Chaque codec utilise un algorithme personnalisé qui supprime les informations redondantes
de la vidéo. Par exemple, si l'arrière-plan d'une vidéo ne change pas pendant un certain temps,
un codec peut réduire la taille du fichier en ne redessinant pas l'arrière-plan de chaque image.
Un codec vidéo peut également intégrer une compression audio pour réduire la taille de la piste
audio. Puisque les vidéos encodées sont décodées pendant leur lecture, le codec utilisé pour
décoder la vidéo.

La compression vidéo a pour but de :


 Réduire le poids et ou le débit de séquence vidéos animées. Elle repose sur des
techniques variées. Dans un premier temps on considère une vidéo comme une simple

1
Signal Vidéo et Techniques de Compression

suite d’image fixes, puis en tenant compte de la redondance temporelle et on peut


mettre en œuvre de nouveaux outils pour réduire la quantité d’information.
 Réduire la gamme dynamique ou le nombre de valeurs du signal d’entrée par une
transformation appropriée
 Exploiter la redondance de données (ex. les flux audio et vidéo, incluant les passages
silencieux, le texte, etc.)
 Exploiter les particularités de la perception humaine
 Exploiter la corrélation entre données voisines dans un objet spatial ou temporel
 Taille des fichiers vidéo numérique très important excède les capacités de stockage et
de communication
La solution est la compression des images par la :
 Réduction de la résolution chromatique
 Réduction de la taille de l’image
 Réduction de la fréquence d’image
 Eliminer les informations inutiles et/ou redondantes

2) Concepts de compression
Il y a deux concepts de compression importants sont une compression à perte et sans perte :
1. Compression avec pertes :
Les techniques de compression à perte impliquent une certaine perte d'information, et les
données qui ont été compressées à l'aide de techniques à perte ne peuvent généralement pas
être récupérées ou reconstruites exactement. En contrepartie de l'acceptation de cette distorsion
dans la reconstruction, nous pouvons généralement obtenir des rapports de compression
beaucoup plus élevés que ce qui est possible avec une compression sans perte.

2. Compression sans perte :


Avec la compression sans perte, les données sont compressées sans perte de données.
Les techniques de compression sans perte, comme leur nom l’indiquent, ne comportent
aucune perte d'information. Si les données ont été compressées sans perte, les données
d'origine peuvent être récupérées exactement à partir des données compressées. La
compression sans perte est généralement utilisée pour les applications qui ne tolèrent aucune
différence entre les données originales et les données reconstruites.
 Exemples de méthodes sans perte :
 Codage en longueur

2
Signal Vidéo et Techniques de Compression

 Codage Huffman,
 Méthode Lempel-Ziv-Welche (LZW).

3) Techniques de compression de base


Les techniques de compression les plus élémentaires sont décrites ici:

1. Compression nulle :
Remplace une série d'espaces vides par un code de compression, suivi d'une valeur qui
représente le nombre d'espaces.
2. Compression de longueur ou RLE :
Le codage en longueur d'exécution est un système de compression populaire qui est
largement utilisé pour compresser les valeurs des attributs.
S'étend sur la technique de compression nulle en compressant toute série de quatre ou
plusieurs caractères répétitifs. Les caractères sont remplacés par un code de compression, l'un
des caractères, et une valeur qui représente le nombre de caractères à répéter.

3. Codage des mots clés :

Crée une table avec des valeurs qui représentent des ensembles de caractères communs.
Les mots fréquemment utilisés comme les paires de caractères ou les paires de caractères
comme sh ou th sont représentés avec des jetons utilisés pour stocker ou transmettre les
caractères.

4. Codage adaptable de Huffman et algorithmes de Lempel Ziv :


Ces techniques de compression utilisent un dictionnaire de symboles pour représenter des
motifs récurrents. Le dictionnaire est mis à jour dynamiquement pendant une compression à
mesure que de nouveaux modèles se produisent. Pour les transmissions de données, le
dictionnaire est transmis à un système récepteur pour savoir comment décoder les caractères.
Pour le stockage des fichiers, le dictionnaire est stocké avec le fichier compressé.
 Encodage Huffman :
L'encodage de Huffman est un code résout le problème de trouver un livre de codes optimal
pour une distribution arbitraire de probabilité de symboles.
Shannon a prouvé que l'entropie du message total donne le code le plus efficace, avec la
longueur moyenne minimale du code, pour l'envoi d'un message.
 Algorithme de Lempel Ziv :

3
Signal Vidéo et Techniques de Compression

LZW (Lempel-Ziv-Welch), est un algorithme de compression adaptatif qui n'assume


aucune connaissance des probabilités de symboles.
La compression LZW fonctionne en lisant une séquence de symboles, en regroupant les
symboles en cordes et en convertissant les chaînes en codes. Parce que les codes occupent
moins d'espace que les chaînes qu'ils remplacent, nous obtenons une compression. Les
fonctionnalités caractéristiques de LZW incluent.

Algorithme de codage
Etape 1 : Initialisez le dictionnaire pour contenir tous les blocs de longueur un (D = {a, b}).
Etape 2 : Recherchez le bloc le plus long W qui est apparu dans le dictionnaire.
Etape 3 : Encodez W par son index dans le dictionnaire.
Etape 4 : Ajoutez W suivi du premier symbole du prochain bloc au dictionnaire.
Etape 5 : Passez à l'étape 2.

4) Graphisme / Compression vidéo


Il existe un certain nombre de techniques de compression conçues pour stocker des images
graphiques dans un espace beaucoup plus petit. La compression d'image améliore également le
débit lorsque les fichiers d'images sont transmis d'un endroit à l'autre. Plusieurs techniques de
compression sont discutées ci-dessous.

1. DCT (transformée en cosinus discrète) :


La technique la plus populaire pour la compression d'image, au cours des dernières
années, était la transformée de cosinus discrète (DCT).
Dans le cas d'une image fixe, 8 × 8 blocs d'informations sont convertis en une onde qui
décrit le nombre de changements de couleur et l'ampleur des changements dans ces changements
de couleur.
L'opération fondamentale effectuée par DCT consiste à transformer la représentation du
domaine spatial d'une image en un domaine de fréquence spatiale (connu sous le nom de
domaine DCT).

La transformation DCT peut être considérée comme le processus de recherche pour


chaque forme d'onde, le poids correspondant DCT (k1, K2) de sorte que la somme de 64 formes
d'ondes mises à l'échelle par les pondérations DCT (k1, K2) correspond à la version reconstruite
de l'original 8 X 8 bloc.
Le compactage énergétique de DCT est parmi les plus élevés. Cela signifie que
l'information peut être compressée à un degré très élevé avec DCT, c'est pourquoi DCT est

4
Signal Vidéo et Techniques de Compression

couramment utilisé. Au même moment, DCT minimise également l'artefact de blocs présent dans
de nombreuses autres transformations en raison de la nature périodique favorable de DCT.
DCT, en principe, est un processus sans perte. Cependant, en raison des longueurs de
mots finis dans un microprocesseur, il y a une perte d'information due à l'arrondissement et le
tronçon des valeurs DCT calculées. Cette perte d'information est irréversible

2. Compression par fractales :


D’abord été promue par [Link], qui a fondé une société basée sur la technologie de
compression d'image par fractale mais qui n'a pas publié de détails sur son schéma. Le premier
schéma public a été attribué à [Link] et [Link] du Naval Ocean Systems Center à San Diego
qui ont utilisé le partitionnement et la classification réguliers des segments de courbes afin de
compresser les courbes fractales aléatoires en deux dimensions.
 Transforme d’ondelettes :
En mathématiques, La transformée en ondelettes est similaire à la transformée de Fourier
avec une fonction de mérite complètement différente. La principale différence est la suivante : la
transformée de Fourier décompose le signal en sinus et cosinus, c'est-à-dire les fonctions
localisées dans l'espace de Fourier ; Au contraire, la transformée en ondelettes utilise des
fonctions qui sont localisées à la fois dans l'espace réel et Fourier.
La Transformée d'ondelettes est une fonction utilisée pour diviser une fonction donnée ou
un signal en temps continu en différents composants d'échelle. Habituellement, on peut assigner
une gamme de fréquences à chaque composante d'échelle [10]
 Transforme d’ondelettes discrètes (DWT) :
La transformée en ondelettes discrète (DWT) est une implémentation de la transformée
en ondelettes à l'aide d'un ensemble discret des échelles d'ondelettes. En d'autres termes, cette
transformation décompose le signal en un ensemble d'ondelettes mutuellement orthogonal
 Principe de fonctionnement de la compression DWT Transformations par
ondelettes (méthode non destructive et réversible). Contrairement à la DCT, on
n’effectue plus de découpage en bloc. La transformée par ondelettes s’applique à
l’image en entier, l’effet de mosaïque reprochée à la DCT est donc éliminé.

5) Les formats

1. Format H.261
H261 est la norme internationale de compression vidéo la plus utilisée pour la
vidéoconférence. Cette norme ITU (était CCITT) décrit les méthodes de codage et de décodage
vidéo pour la composante d'image animée d'un service audiovisuel aux taux de p * 64 Kbps où
5
Signal Vidéo et Techniques de Compression

p se situe dans la plage de 1 à 30. Les cibles standard et est réellement adapté pour Applications
utilisant des réseaux à commutation de circuits comme canaux de transmission. Il supporte
uniquement les frames I-frame et P-frame.
 Format de codage :
 Type : indique si le macro-bloc est codé ou inter-codé
 Adresse : identifie l'emplacement du macro-bloc dans le cadre
 Valeur de quantification : la valeur de seuil utilisée pour quantifier tous les coefficients
DCT dans le macro-bloc.
 Vecteur de mouvement : vecteur codé
 Modèle de bloc codé : indique quel bloc dans le macro-bloc est présent
 Code de début d’image : indique le début d'une nouvelle image.
 Référence temporelle : un horodatage pour le décodeur pour synchroniser les
informations vidéo avec les informations audio.
 Type d’image : indique si la trame est codée en tant que cadre I ou P.
 Code de début GOB : est un marqueur de resynchronisation qui est utilisé pour la
resynchronisation en cas d'erreur.
 Le groupe de bloc (macro) (GOP) est une structure composée de macro-blocs 3x11.

2. Format H.263
H.263 a été conçu pour des applications de codage à très faible débit. H.263 utilise
la structure DCT à blocs compensés pour le codage.
H.263 est une norme de compression vidéo de téléconférence développée par l'UIT,
conçue pour des services de vidéo conversationnelle à faible débit.

H.263 a été défini par l'UIT-T pour l'utilisation dans une gamme d'applications
vidéo en temps réel sur les réseaux sans fil et les RTPC.
Les applications comprennent la téléphonie vidéo, la visioconférence, la
surveillance de la sécurité, les jeux interactifs, etc.
La norme H.263 dispose d'un certain nombre d'options de codage avancées par
rapport à H.261:
 Balayage progressif avec un taux de rafraîchissement de 15 ou 7,5 fps.
 Support I-, P-, B- et PB-frames.
 Les vecteurs de mouvement, si nécessaire, sont autorisés à pointer hors de la zone
du cadre.

6
Signal Vidéo et Techniques de Compression

 Des schémas tels que le suivi des erreurs, le décodage indépendant des segments
et la sélection de l'image de référence sont inclus dans la norme qui vise à
minimiser les effets des erreurs sur les GOB voisins.
 Le schéma de dissimulation d'erreur est incorporé dans le décodeur pour masquer
l'erreur du spectateur.

Figure 1 : codeur source du format H.263

3. Format H264/AVC
La norme de codage vidéo avancée H.264 / MPEG-4 (H.264 / AVC) est la norme
de codage vidéo la plus récente développée conjointement par le Groupe d'experts du
codage vidéo UIT-T (VCEG) et le groupe d'experts ISO / IEC Moving Picture (MPEG).
H.264, actuellement l'un des codecs vidéo fréquemment utilisés, est une
compression populaire pour la vidéo HD. Étant donné que H.264 peut atteindre des
vidéos de haute qualité dans des débits binaires relativement bas, il est couramment
utilisé dans les caméscopes AVCHD, HDTV, Blu-ray et HD DVD. MP4 (.mp4) est l'un
des formats vidéo codés H.264.

7
Signal Vidéo et Techniques de Compression

Figure : Diagramme de bloc de codeur H.264

4. Format H265/HEVC
La norme de codage vidéo haute efficacité (HEVC) est le plus récent projet vidéo
commun du Groupe d'experts du codage vidéo UIT-T (VCEG) et des organisations de
normalisation MPEG (ISO / IEC Moving Picture Experts Group), travaillant ensemble dans un
partenariat connu sous le nom de L'équipe collaborative conjointe sur le codage vidéo (JCT-VC)
. Il prend en charge les résolutions jusqu'à 8192 × 4320, y compris 8K UHD
HEVC a été développé dans le but de fournir deux fois l'efficacité de compression de la
norme précédente, H.264 / AVC. Bien que les résultats d'efficacité de la compression varient en
fonction du type de contenu et des paramètres du codeur, à des débits binaires de distribution
vidéo typiques du consommateur, HEVC est généralement capable de compresser la vidéo deux
fois plus efficacement qu’AVC.

À un niveau identique de qualité visuelle, HEVC permet de compresser la vidéo vers un


fichier qui est environ la moitié de la taille (ou la moitié du débit) d'AVC, ou lorsqu'il est
comprimé sur la même taille de fichier ou débit que AVC, HEVC offre une qualité visuelle
nettement meilleure.

8
Signal Vidéo et Techniques de Compression

Figure : Schéma de principe du codeur HEVC

5. Formats MPEG
The Motion Pictures Expert Group (MPEG) a été formé par l'ISO pour formuler un
ensemble de normes relatives à une gamme d'applications multimédia impliquant l'utilisation de
la vidéo avec le son.

9
Signal Vidéo et Techniques de Compression

 Le format MJPEG
C’est une adaptation du JPEG à l’image vidéo. Chaque image est traitée et compressée
Indépendamment des autres. On parle alors de compression intra-image. Les Images
compressées se Suivent alors à 25 ou 30 images par secondes pour rendre le mouvement de
la vidéo.

 Format MPEG-1 :

10
Signal Vidéo et Techniques de Compression

a) Origine

Le MPEG1 est un format de compression utilisé principalement pour le multimédia. Il


permet d’obtenir une qualité comparable à la VHS pour un débit très Faible de1,5 Mb/s
(audio+video). Ce débit est comparable à celui d’un signal Audio Stéréo non compressé. Il
permettait de faire tenir un film sur un CD, c’est le vidéo CD ancêtre du DVD.
Pour arriver à un débit aussi faible, la taille de l’image est réduite à un quart de la
résolution standard soit 360x288 pixels. Le MPEG1 fonctionne en 25 trames progressives, il
supprime une trame sur deux et réaffiche deux trames similaires par la suite. Ces restrictions sont
Définies par la norme SIF (Standard Image Format).
Les images ainsi réduites sont alors codées en tirant parti de la redondance spatiale(intra-image)
et de la redondance temporelle (inter-images).
b) Principe du MPEG-1
 L’élément, de base est un Bloc de 8x8 pixels.
 Les Blocs sont associés en Macroblock pour tenir compte du sous échantillonnage 4 :2 :0. Un
Macroblock correspond à 6 Blocs (4 Blocs Y + 2Blocs UV).
 Les Macroblocks forment des tranches (Slice) qui constituent les images.
 Les éléments sont traités de la même manière que dans l’algorithme JPEG à savoir DCT et
quantification.
 Les images sont assemblées en GOP (Group Of Picture) on tire alors partir de la Redondance
temporelle en utilisant des vecteurs de déplacement des macroblocks d’une image à l’autre à
l’intérieur d’un GOP.

11
Signal Vidéo et Techniques de Compression

Figure : Principes du MPEG-1


La norme de compression vidéo MPEG est une norme de compression vidéo en couches,
basée sur DCT qui se traduit par un flux vidéo compressé de qualité VHS qui a un débit
d'environ 1,5 Mbps à une résolution d'environ 352x240.
 Technique de compression vidéo similaire à celle de H.261.
 Balayage progressif avec un taux de rafraîchissement de 30Hz (pour NTSC) et 25Hz (pour
PAL)
 Support I-, P- et B-frames.
 Les images I doivent être utilisées pour les différentes fonctions d'accès aléatoire associées
aux magnétoscopes.
 Amélioration par rapport à H.261:
 Une nouvelle couche appelée tranche est ajoutée dans la structure du flux afin que le
décodeur puisse se resynchroniser plus rapidement en cas d'erreur.
 Supportent les B-frames.
 Plus grande fenêtre de recherche de vecteurs de mouvement et une résolution plus fine de
sa représentation.
 Les chiffres typiques des rapports de compression
 I-frames : 10 : 1
 P-frames : 20 : 1

12
Signal Vidéo et Techniques de Compression

 B-frames : 50 : 1

Figure : frame de séquence MPEG-1

 Format MPEG-2
Les défauts du MPEG-1 sont nombreux :
 Débit limité à 1,5 Mb/s
 Taille d’image réduite
 Echantillonnage
 Mauvaise gestion des images entrelacées

13
Signal Vidéo et Techniques de Compression

L’explosion des supports numériques dans les années 90 nécessitait de se pencher sur la
question. Les experts à l’origine des formats JPEG et MPEG-1 ont alors publié une évolution
majeure, le MPEG-2.
MPEG-2 est une extension du standard MPEG-1. Il est principalement un format
"broadcast" à des débits supérieurs. Il propose des outils algorithmiques pour encoder
efficacement la vidéo entrelacée, supporte une grande échelle de débits et permet l’encodage
audio sur round à multiples canaux.
Le format vidéo de post production numérique utilise 270 Mbit/s de débit pour coder les images.
Sachant qu'un canal satellite accepte autour de 45 Mbit/s (valeur la plus courante),
On voit rapidement qu'il va falloir faire suivre un sérieux régime à nos images.
Le standard MPEG-2 est capable d'encoder un signal télévision standard à un débit allant
de 3 à 15 Mbits/s (audio + vidéo + données auxiliaires) et un signal télévision haute définition
Avec un débit de 15 à 30 Mbits/s.
Les décodeurs MPEG-2 sont également capables de décoder les signaux MPEG-1.

Fondamentalement, le MPEG-2 peut être considéré comme un super-ensemble de la


norme de codage MPEG-1 et a été conçu pour être compatible en arrière vers MPEG-1
Chaque décodeur compatible MPEG-2 peut décoder un flux de bits MPEG-1 valide. Le
but original était une compression 10 fois meilleure que H.261
Les objectifs sont passés à :
 Courbes de bits flexibles pour différentes capacités de récepteur
 L'interactivité basée sur le contenu avec le flux de données.
 L'indépendance du réseau (utilisé pour Internet, sans fil, etc.).
14
Signal Vidéo et Techniques de Compression

 Représentations basées sur des objets.


a) L’exemple de la diffusion vidéo
Les stations de télévision européennes diffusent à une fréquence image de 25Hz. Chaque
Image est formée de deux trames "entrelacées", donnant une fréquence Trame de 50Hz. La
première Trame de chaque Image Contient Seulement les Lignes Impaires de l’image (la Première
du haut sera la 1). La seconde trame contient quant à elle les lignes paires (environ 20 ms après le
premier champ). Le signal télévision nord-américain est lui aussi "entrelacé", mais avec une
fréquence image d’un peu moins de 30 Hz (29,97 Hz).
On pourra utiliser des échantillonnages 4 :2 :2 ou 4 :2 :0 sur 8bits. La région active d'une
Image vidéo numérique standard est de 720 pixels X 576 lignes, à 25 images par secondes.
En utilisant 8 bits pour chaque pixel Y, U ou V, calculons les débits sans compression
pour Ces deux cas de figure :
 En 4:2:2 / 8bits > 720x576x25x8 + 360x576x25x(8+8) = 166 Mbits/s
 En 4:2:0 / 8 bits > 720x576x25x8!+ 360x288x25x(8+8) = 124 Mbits/s
MPEG-2 est capable de compresser le débit d'un signal vidéo standard 4:2:0 jusqu'à un
taux De 3Mbits/s soit un taux de compression de l’ordre de 45 environ. Plus le débit est bas, plus
la qualité du signal encodé devient compromise. Pour un signal de diffusion numérique terrestre
standard, comme pour Le DVD, un débit d'environ 6 Mbits/s est généralement accepté comme
un bon compromis entre La qualité d’image et les impératifs de bande passante du transmetteur
ou du support d’enregistrement (Câbles, Satellites, etc..).
b) Principe de réduction du débit
Le système de réduction du débit fonctionne en levant l'information redondante du Signal
avant la transmission, grâce au codeur et en la réinsérant grâce au décodeur. Deux Types de
redondances ont été ciblés pour y arriver :
 La redondance temporelle où un élément commun à plusieurs images consécutives n'est
transmis qu'avec la première image. Pour les autres images, on ne transporte que sa position
dans l'image. C'est le cas d'un plan fixe, où l'on voit une voiture qui va de gauche à droite. On
transmet une fois le décor et la voiture et, pour les images suivantes, on indique Seulement la
position de la voiture.
 L'autre redondance exploitée est la redondance spatiale. Si, dans la même image, il y a trois
Voitures identiques, elle n'est codée qu'une seule fois. En y ajoutant la position de chacune
Dans l’image, On Peut Reconstituer La scène. La valeur de chaque pixel n'est donc pas
indépendante, mais reliée à ses voisins, autant à l'intérieur de la même image que par rapport

15
Signal Vidéo et Techniques de Compression

aux images voisines. Jusqu'à un certain point, la valeur d'un pixel est prédictible en tenant
compte de ses voisins.
 Débit constant (CBR)
Dans ce Cas la compression est faite de telle manière que le débit en sortie est constant tout
Au long du programme. La transmission et la réception se font alors de manière synchronisée.
C’est la solution la plus simple, mais pas nécessairement la plus adaptée au contenu de la vidéo.
En effet certains passages pourraient se contenter d’un débit plus faible sans que le Rendu ne soit
altéré (image fixes), alors que d’autres passages nécessiterait un débit plus Elevé pour les d’écrire
convenablement. C’est le cas des scènes dont la redondance spatiale ou temporelle est très faible
(pluie, explosions...)
 Débit variable (VBR)
Le débit variable permet d’optimiser la répartition des informations en tenant compte du Contenu
à encoder. La vidéo est alors analysée puis le débit est automatiquement adapté en Fonction des
besoins. On fixe alors un débit moyen et deux limites inférieurs et supérieurs pour définir les
valeurs minimales et maximales du débit.

16
Signal Vidéo et Techniques de Compression

Figure Évolution du débit en fonction de l’analyse du contenu de la vidéo

Des outils d’analyse permettent de contrôler la qualité générale de l’encodage en mesurant


le rapport signal/bruit lié à l’encodage.
En MPEG-2, la redondance temporelle est d’abord réduite en utilisant les similitudes entre
deux images successives. La plus grande partie possible de l’image courante est créée (ou prédite)
en utilisant l’information de l’image déjà émise. Quand on utilise cette technique, il suffit de
transmettre une image de différence qui élimine les différences entre l’image Actuelle et l’image
de prédiction. L’image de différence est ensuite soumise à une compression spatiale. Pour des
raisons pratiques, il est plus facile d’expliquer la compression spatiale avant d’aborder La
compression temporelle.
c) Prédiction inter images à compensation de mouvement
Cette technique exploite la redondance temporelle en essayant de prédire l’image qui doit
Etre codé à partir d'une image de référence. La prédiction ne peut être basée sur une image "source"
car la prédiction doit pouvoir être Répétée dans le décodeur, là où les images "sources" n'existent

17
Signal Vidéo et Techniques de Compression

pas. L'image décodée n'est pas identique à l'image source car le procédé de réduction du débit
Introduit des petites distorsions dans l'image décodée (codage avec perte...) La prédiction la plus
simple du bloc à encoder est celle qui utilise le bloc le plus près de l’image de référence. Ceci
permet de réaliser une bonne prédiction pour les régions stationnaires de l'image, mais réussissent
moins bien dans les régions où il y a mouvement.
Quand un objet se déplace sur l’écran TV, il apparaît à un endroit différent, mais il ne
Change pas beaucoup d’aspect.
On introduit donc une méthode plus sophistiquée, appelée motion-compensated inter-
Frame prédiction, qui consiste à copier tout mouvement translationnel qui existe entre le bloc qui
est encodé et l’image de référence et à utiliser le bloc ainsi créé comme prédiction.
La différence d’image peut être réduite en mesurant le déplacement au codeur. Ce
Déplacement est transmis au décodeur sous la forme d’un vecteur. Le décodeur utilise ce Vecteur
pour décaler une partie de l’image précédente vers l’emplacement approprié dans La nouvelle
image.
En pratique, chaque vecteur concerne le déplacement d’un macrobloc. La taille d’un
Macrobloc est déterminée par le codage DCT et la structure de sous-échantillonnage couleur.
d) Les GOPs
En MPEG-2, trois différents types d’images sont nécessaires pour effectuer le codage
différentiel et le codage bidirectionnel avec un minimum d’erreurs de propagation :
 Les images I(I-Frames) :
Sont intra-codées et ne nécessitent pas d’informations supplémentaires pour être décodées.
Elles nécessitent beaucoup de données comparativement aux autres types d’images et c’est
Pourquoi elles ne sont transmises que lorsque cela est nécessaire. Elles consistent essentiellement
en coefficients de transformées et n’ont pas de vecteur de mouvement. Elles autorisent la
commutation de voies et bloquent la propagation des erreurs.

 Les images P(P-Frames) :


Sont celles qui sont déduites d’une image antérieure qui peut être de type I ou P. Les
données d’une image P sont constituées de vecteurs décrivant où chaque macrobloc doit être pris
dans l’image précédente et des coefficients non transformés décrivant la
Correction ou les données de différence à ajouter à ce macrobloc. Les images P comportent
Pratiquement la moitié des données d’une image I.
 Les images B(B-Frames) :

18
Signal Vidéo et Techniques de Compression

Sont prédites bi-directionnellement à partir d’images antérieures ou postérieures et de type


I ou P. Les données des images de type B consistent en vecteurs décrivant l’endroit où les données
doivent être prises dans les images antérieures ou postérieures. Elles contiennent également les
coefficients de transformées fournissant la correction. La prédiction bidirectionnelle est si efficace
que les données de correction sont minimes et que l’image de Type B utilise pratiquement le quart
des données par rapport à une image de type I.
 Structure de GOP
À partir de ces images I, B et P, on forme des Groupe d’Images (GOP, Group Of Pictures). Le
GOP commence par une image I, suivie de quelques images P espacées et entre lesquelles se
placent les images restantes qui sont de type B. La fin du GOP se situe à la dernière image
Précédant immédiatement une nouvelle image I.

La longueur d’un GOP est variable, mais la valeur la plus courante se situe entre 12 et 15.
En fait, si les données d’une image B doivent être utilisées pour construire une image ultérieure,
ces données doivent rester disponibles dans le décodeur. Par conséquent, le codage bidirectionnel
implique que les données soient extraites de la séquence et provisoirement sauvegardées.
À partir de ces frames a été introduit le concept de Groupe d’Images (GOP, Group Of
Pictures). Le GOP commence par une image I, suivie de quelques images P espacées et entre
lesquelles se placent les images restantes qui sont de type B. La fin du GOP se situe à la dernière
image précédant immédiatement une nouvelle image I. La longueur d’un GOP est variable, mais
la valeur la plus courante se situe entre 12 et 15. En fait, si les données d’une image B doivent être
utilisées pour construire une image ultérieure, ces données doivent rester disponibles dans le
décodeur. Par conséquent, le codage bidirectionnel implique que les données soient extraites de la
séquence et provisoirement sauvegardées.

19
Signal Vidéo et Techniques de Compression

La figure ci-dessus montre également que les données de l’image P sont émises avant celles
De l’image B. Notez également que les dernières images B du GOP ne peuvent être
Transmises qu’après la première image I du GOP suivant, dans la mesure où elles ont besoin De
son contenu pour être décodées bidirectionnellement.
Afin de replacer convenablement les images dans leur ordre, une référence temporelle est
Incluse dans chaque image. Comme des en-têtes sont régulièrement insérés dans le flux de
données, un fichier MPEG-2 peut- être affiché dans l’ordre chronologique sur un ordinateur, Par
exemple.
L’extraction des données d’une séquence nécessite un supplément de mémoire dans le
Codeur et le décodeur mais aussi génère du retard. Le nombre d’images bidirectionnelles insérées
entre des images d’autres types doit être réduit pour diminuer le coût des équipements et limiter le
retard si celui-ci doit répondre à des contingences. Un compromis doit être fait entre le facteur de
compression et le retard de codage.

20
Signal Vidéo et Techniques de Compression

Ce schéma représente l’impact du type de codage sur le poids de chaque image. Plus les
GOP Sont long plus la compression est efficace. Un problème se pose lorsque l’on souhaite
manipuler des GOP pour du montage, il est impossible d’intervenir à l’intérieur d’un GOP
directement à moins de le décompresser.

21
Signal Vidéo et Techniques de Compression

 Format MPEG-4
C’est assez logiquement qu’une nouvelle norme a fait son apparition pour améliorer les
Principes du MPEG-2. On est passé directement à la 4ème version, les objectifs visés par la 3ème
Version n’étant plus adaptés aux évolutions techniques.
La norme MPEG-4 regroupe plusieurs parties définissant chacune un contexte précis
d’utilisation. Par exemple, La norme avancée de compression vidéo appelée aussi H.264 ou AVC
(Advanced Video Codec). Cette norme a pour but de réduire les débits obtenus par des normes
plus anciennes tels que le MPEG-2.

22
Signal Vidéo et Techniques de Compression

Les technologies ont en effet progressé depuis l’époque de la création du MPEG-2 et les
besoins sont bien plus grand (avènement de la HD, diffusion numérique...). H.264/AVC comprend
de nombreuses techniques nouvelles qui lui permettent de compresser beaucoup plus efficacement
les vidéos que les normes précédentes (MPEG-1, MPEG-2...) et fournit plus de flexibilité aux
applications dans un grand nombre d'environnements réseau.
 Prédiction temporelle ou Inter-prédiction
Une compensation de mouvement pouvant être effectuée par rapport à plusieurs
images de référence déjà codées. Le choix de l'image de référence intervient au niveau
macrobloc et Sous-macrobloc. Ceci permet d'utiliser dans certains cas jusqu'à 32 images
de référence (contrairement aux précédentes normes, qui étaient limitées à une ou dans le
cas d’images B conventionnelles, à deux) et jusqu'à 4 références différentes pour un même
macrobloc. Cette fonctionnalité particulière permet habituellement des améliorations
modestes au niveau du débit et de la qualité dans la plupart des scènes. Mais dans certains
types de scènes, comme par exemple les scènes contenant des flashs rapides et répétitifs
ou des scènes réapparaissant fréquemment, il permet une réduction du débit réellement
significative.
Une compensation de mouvement pouvant utiliser 7 tailles de blocs différentes
(16×16,16×8, 8×16, 8×8, 8×4, 4×8, 4×4) permet une segmentation très précise de zones se
déplaçant. La taille variable des blocs permet une gestion plus fine des détails. L’image
n’est plus découpée en blocs de tailles identiques. On voit que l'image découpée ainsi
possède des grandes zones de vecteurs identiques. Sur ces zones, on a un gain important
en compression. D'autre part, certaines zones ont été découpées beaucoup plus finement
qu'avec des blocs de taille constante. Ici on a un gain en qualité visuelle. Les petites zones
mobiles sont beaucoup mieux codées. La précision va jusqu’au quart de pixel pour la
compensation de mouvement, permettant une description très précise du déplacement des
zones en mouvement. Pour la chrominance, la précision de la compensation de mouvement
se fait même au huitième de pixel.
La compensation de mouvement pondérée par des poids et des décalages permet au
codeur de construire des prédictions s'adaptant au changement de luminance et de
chrominance de La scène courante. Ceci apporte en particulier un gain pour les scènes
comportant des transitions dues à des flashs ou des fondus entre scènes effectués au
montage.
 Prédiction Spatiale

23
Signal Vidéo et Techniques de Compression

Une prédiction spatiale sur le bord des blocs voisins pour un codage «intra» vient
s’ajouter A la prédiction sur les coefficients continus présente dans MPEG-2.
 Adaptation des transformées discrètes
Une transformée entière est effectuée sur des blocs de taille 4×4 pixels (proche de
la DCT classique). Une autre transformée, celle de Hadamard, est effectuée sur les
coefficients moyens de la Transformée spatiale primaire (pour la chrominance et
éventuellement la luminance dans certains cas) pour obtenir encore plus de compression
là où l'image est adoucie.
 Plusieurs codeurs entropiques

Des outils de codages entropiques plus puissants peuvent être utilisés compte tenu
des évolutions techniques. On pourra utiliser en fonction des besoins :
 Un codage arithmétique, CABAC, qui est une technique sophistiquée de codage
entropique qui produit d'excellents résultats en termes de compression mais
possède une grande complexité.
 Un codage adaptatif de type Huffman à longueur variable, le CAVLC, qui est une
alternative moins complexe que CABAC pour le codage des tables de coefficients
de transformation. Bien que moins complexe que CABAC, CAVLC est plus
élaboré et plus efficace que les méthodes habituellement utilisées jusqu'à présent
pour coder les coefficients.
 Une technique simple et hautement structurée de codage à longueur variable ou
Pour de nombreux éléments de syntaxe non codés par CABAC ou CAVLC, considéré
Comme du code exponentiel-Golomb (Exp-Golomb).

 Deblocking

Un filtrage anti-blocs ou de blocking filter, est effectué dans la boucle de codage et opéré
sur les blocs 4×4, permettant de réduire les artefacts caractéristiques du codage avec
transformation en bloc (frontière de bloc visible).
 Deux modes d'entrelacement

Codage en Picture-adaptive frame-field (PAFF ou PicAFF): l'encodeur choisit d'adapter


le Codage de la trame courante soit de façon progressive (une seule trame), soit par entrelacement
(deux champs ou fields). Codage en Macroblock-adaptive frame field (MBAFF) : même principe
que pour le PAFF sauf que l'application ne s'effectue pas au niveau de la trame mais au niveau des

24
Signal Vidéo et Techniques de Compression

macroblocs 16x16. Le sens du codage est légèrement différent puisqu'il traite deux lignes de
Macroblocs en même temps au lieu d'une seule habituellement.
 L’approche Objet

Toutes les techniques décrites précédemment sont des évolutions de celles exploitées par
le MPEG-2. Le MPEG-4 propose en plus une nouvelle fonctionnalité dans laquelle une scène est
décrite Comme la combinaison de plusieurs objets dynamiques.
Le principe adopté dans MPEG-4 est celui d’une description autonome du contenu : l'image
n’est plus codée dans sa globalité, c’est à dire en la considérant indépendamment de son contenu
comme une surface rectangulaire de X sur Y pixels,mais elle apparaît comme une composition
réalisée avec différents “objets” audiovisuels. Chacun Des objets est codé indépendamment des
autres, et isolé du fond ou de l'environnement

Pour l’heure cette approche n’est que peut utiliser mais permettra à l’avenir d’offrir une
Interactivité bien plus grande pour le spectateur de la vidéo en lui donnant la possibilité d’agir
concrètement sur le contenu des images (point de vue, affichage/masquage des objets...).

25
Signal Vidéo et Techniques de Compression

 Des résolutions multiples

La norme MPEG-4 intègre également la possibilité d’accéder à plusieurs résolutions à


l’intérieur d’un même fichier. Ce principe permet une meilleure adaptation à la ligne de diffusion
en proposant plusieurs niveaux de qualité à partir d’un seul et même fichier source.
 Performances générales et cadre d’utilisation

Ces techniques, ainsi que plusieurs autres, aident MPEG-4 à dépasser significativement les
Standards précédents, dans une grande variété de circonstances et dans une grande variété
d'environnements d'application. MPEG-4 peut fonctionner souvent nettement mieux que la vidéo
MPEG-2 en obtenant la même qualité avec un débit binaire diminué de moitié, voire plus.
Un même format de fichier permet ainsi de s’adapter à des contenus très légers (diffusion
Sur internet) jusqu’à des formats beaucoup plus exigeants qualitativement (Blu-ray, HDTV...).
MPEG-4 est une révolution, tant du point de vue de sa structure physique, que de l'idéologie qui
en découle. C'est la base de tout ce qui touchera la communication et le multimédia dans les années
à venir, et quand on voit l'explosion de toutes ces technologies, on imagine l'importance d'une telle
norme.
MPEG-4 n'en est qu'à ses débuts, mais ses applications sont vastes et beaucoup de choses
ont déjà été réalisées. Malgré tout, le travail à effectuer est encore long avant d’obtenir des
résultats convainquant pour tous les compartiments de la norme. En particulier, il reste deux
problèmes majeurs à résoudre pour le codage des vidéos naturelles, à savoir, l'estimation de
mouvement et la segmentation de la vidéo en objets.
On retrouvera le codec MPEG-4 à la base des formats HDCAM-SR, AVCHD, TNT HD,
télévision HD par ADSL, AVC intra de Panasonic...

MPEG-4 utilise des techniques similaires à M-JPEG, en ce qui concerne la mise en


séquence. Il compare essentiellement deux images compressées, enregistre l'image et enregistre
uniquement la différence à partir de chaque image séquentielle supplémentaire, comme le
mouvement, ce qui permet d'économiser du temps, de l'espace mémoire et une puissance de
traitement.
Un taux de compression plus élevé fait partie des avantages de MPEG-4. Il peut
synchroniser l'audio et la vidéo, et est idéal pour la visualisation en temps réel. MPEG-4 a été
conçu pour prendre en charge les applications à faible bande passante.

26
Signal Vidéo et Techniques de Compression

Les inconvénients de MPEG-4 incluent une qualité d'image inférieure (M-JPEG), et il est
autorisé, ce qui permet aux téléspectateurs d'avoir des frais supplémentaires. Il prend en charge un
nombre réduit de caméras, comme les caméras mégapixels.
 Algorithme de compression
 Motion Estimation and Intra Estimation
 Transformer (et transformée inverse)
 Quantification (et quantification inverse)
 Filtre en boucle
 Entropie de Codage
 Avantages et les inconvénients de MPEG :
Certains avantages de M-JPEG incluent une meilleure décompression sur l'ordinateur, une
meilleure visualisation en direct et une excellente qualité d'image (de manière cohérente).
M-JPEG est également sans licence, ce qui le rend gratuit pour l'utilisateur et le visualiseur.
Un autre aspect qui rend le M-JPEG bon est sa robustesse, si une image est supprimée, elle n'affecte
pas la vidéo.
Cependant, les inconvénients de M-JPEG sont d'importants inconvénients. La
synchronisation sonore n'est pas prise en charge. En raison de la haute résolution des images, ils
occupent beaucoup d'espace sur le disque dur, bien que la taille de l'image puisse être restreinte
dans les paramètres. Aussi en raison de la taille, il faut beaucoup plus de bande passante pour
transmettre les photos.

27
Signal Vidéo et Techniques de Compression

28

Common questions

Alimenté par l’IA

Human perception plays a crucial role in video compression by allowing algorithms to prioritize changes less noticeable to the human eye, such as those in color resolution, rather than detail resolution, which humans are more sensitive to. Techniques like reducing frame rates exploit the fact that humans perceive continuous motion without detecting discrete frames, allowing for reduced storage without perceptual loss in quality .

Lossy compression techniques involve some loss of data and are generally used when compression rates must be high, such as in video and audio compression for transmission, where exact replication is not critical . Lossless compression retains all the original data and is used where data integrity is crucial, such as in text files or certain medical imaging technologies . Both methods can apply algorithms like Huffman coding or Lempel-Ziv, but looser requirements in lossy compression allow for higher rates through acceptable quality degradation .

Video compression techniques include the reduction of chromatic resolution, image size, frame rate, and elimination of unnecessary information. These techniques are significant because they help manage large file sizes that exceed storage and communication capacities. For instance, reducing the chromatic resolution and frame rate allows for significant space savings without drastic loss in quality by eliminating redundancy and exploiting human perception characteristics .

Huffman coding creates prefix codes based on symbol frequency, optimizing for known symbol distributions, while LZW utilizes a dynamic dictionary to create compression codes as data is processed, which allows it to adapt to unknown symbol distributions efficiently. Huffman is static and optimal for fixed datasets, LZW is adaptive and better for variable datasets .

Technological advancements like H.265/HEVC significantly reduce data use, allowing for high-quality video streaming and substantial storage savings. For media streaming, this means better video quality over lower bandwidths, optimal for mobile and network-constrained environments. In storage, more videos can be stored at improved quality while occupying less disk space .

Inter-frame prediction addresses temporal redundancy by using information in one frame to predict subsequent frames. Implemented in MPEG formats, it ensures only essential changes between frames are encoded. Techniques involve using motion vectors to represent macroblock movements, efficiently encoding dynamic video content by limiting redundant data transmission .

GOP in MPEG refers to a video sequence segment containing intra-coded (I), predictive-coded (P), and bidirectionally predictive-coded (B) frames. This structure allows efficient compression by reducing temporal redundancies across frames within a sequence, only sending full data for I-frames and differential data for P- and B-frames, thereby improving compression efficiency and maintainability of video flows .

H.265/HEVC doubles the compression efficiency of H.264/AVC, allowing for the same visual quality at half the bit rate, or significantly better quality at the same bit rate. This advancement impacts video quality and efficiency by making it possible to stream higher quality video over the same bandwidth, supporting resolutions up to 8K UHD .

MPEG-2 improved upon MPEG-1 by supporting higher bit rates and better handling of interlaced video, crucial for broadcast. It addressed technological needs such as supporting a broader range of bit rates for different receiver capabilities and network independence, accommodating mediums like cable and satellites. MPEG-2 also introduced enhancements for video quality at lower bandwidths, crucial for digital television .

DCT is used to transform spatial representation of image blocks into frequency domain, compacting the image's energy which allows significant compression. This transformation minimizes block artifacts and efficiently compresses by reducing spatial redundancies, making DCT advantageous in maintaining quality while enabling high compression ratios .

Vous aimerez peut-être aussi