Codage unaire

Le codage unaire est un codage entropique utilisé essentiellement en compression de données et s'appuyant sur la base 1.

Principe

Chaque symbole est assimilé à un entier naturel et est représenté par occurrences de (la représentation de l'entier naturel en base 1) suivies d'un faisant office de délimiteur. Le codage unaire produit donc un code préfixe.

Représentation des premiers entiers naturels avec différents codes
Base 1 Unaire Binaire
(sur 8 bits)
Décimal Nombre de Church
0 0000 0000 0 λ f · λ x · x
1 10 0000 0001 1 λ f · λ x · f x
11 110 0000 0010 2 λ f · λ x · f (f x)
111 1110 0000 0011 3 λ f · λ x · f (f (f x))
1111 1 1110 0000 0100 4 λ f · λ x · f (f (f (f x)))
1 1111 11 1110 0000 0101 5 λ f · λ x · f (f (f (f (f x))))

Longueur du code

La longueur du code unaire associé à un entier naturel peut être exprimée par :

Optimalité

Le codage unaire est optimal au niveau du symbole pour coder une source dont la distribution est non uniforme et suit la loi de probabilité :

Autrement dit, ce code est optimal lorsque la probabilité de coder un est de , celle de coder un de , celle de coder un de ...

Dans ce cas, le code produit est identique au code de Shannon-Fano ou au code de Huffman équivalent. Un codage arithmétique, optimal au niveau du bit, pourra cependant produire un code encore plus court.

Utilisations

Le codage unaire est rarement utilisé seul, un codage de Huffman étant dans le pire des cas aussi efficace et dans tous les autres cas meilleurs.

Il demeure cependant intéressant du fait de sa simplicité et de sa rapidité, et est notamment utilisé pour le codage du quotient lors d'un codage de Golomb ou d'un codage de Rice. Ces deux techniques sont d'ailleurs équivalentes au codage unaire lorsque leur paramètre est 1.

Le codage unaire sert également pour coder le nombre de bits nécessaires pour coder un entier en binaire lors d'un codage gamma (et aussi, du coup, lors d'un codage delta).

Analogies

La représentation des entiers naturels par le codage de Church, utilisé en lambda-calcul est assimilable à un codage unaire.

Voir aussi

Articles connexes