jeudi 24 juillet 2014

MP3, FLAC, WAV et les autres : les formats numériques audio, de la compression à la haute-définition



Essayons de prendre quelques repères dans la jungle des formats numériques audio...

Depuis quelques mois, Neil Young a ouvert un débat public sur la qualité de la musique numérique, en partant en croisade contre le MP3, et en annonçant son projet de lancer sur le marché le Pono, un baladeur dédié à la lecture fichiers numériques à la très haute définition. Au delà des sarcasmes qui fusent déjà, tel Trent Reznor comparant le design du Pono à celui d'un Toblerone, on peut se demander si ce battage médiatique n'est pas le déploiement d'une belle opération de marketing, inspirée par le succès des casques Beats de Dr. Dre ?


Neil Young présentant son Pono au David Letterman show


Car la prophétie annoncée par Neil Young est déjà réalisée : les baladeurs numériques audiophiles sont là : on peut citer notamment les baladeurs des fabricants Sony (Japon), Cowon, Astell&Kern (Corée) ou Fiio (Chine), HifiMAN (US), Colorfly (Allemagne). L'apport de ce type de baladeurs est de lire des fichiers haute qualité.
Ajoutons à cela que les smartphones sous Androïd de génération récente sont aussi capables de lire des fichiers haute-résolution avec le player adapté (type Poweramp, Neutron Music Player). De même, les produits Apple dernière génération (Iphone, Ipad, Ipod), sont en partie compatibles avec de l'audio HD (aujourd'hui jusqu'à la résolution 24-bit/48 kHz avec les formats ALAC, AIFF, WAV).

Baladeurs audiophiles de marque Sony, Fiio, Cowon


Qualité CD / Haute résolution, quelle différence ?

Les fichiers audio d'un CD sont encodés en 16bit à une fréquence de 44 kHz
Les fichiers haute-résolution (ou haute-définition) (comme ceux du SA-CD ou du Blu-ray Pure Audio) sont en 24 bit - fréquence 44, 48, 88, 96, ou 192 kHz
Qu'est-ce que cela signifie ?
16 bit - 44 kHz = 65 536 bits (2 à la puissance 16) x 44 100 Herz x 2 (stereo) par seconde
24 bit - 192 kHz = 16 777 216 bits (2 à la puissance 24 ) x 192 000 Herz x 2 (stereo) par seconde
Une heure de musique haute-résolution occupera donc plus de 2 Go contre 635 Mo pour de la qualité CD
On mesure le gap en volume d'informations et en puissance de calcul entre un fichier qualité CD et un fichier haute définition.

Quel format choisir ? 

Il faut d'abord distinguer :
  • les formats de compression avec perte : MP3, AAC, Ogg Vorbis, WMA
  • les formats non compressés ou compressés sans perte : AIFF, ALAC, FLAC, WAV, DSD, Monkey’s audio, WMA Lossless 
Aujourd'hui si l'on recherche la qualité audio, on doit choisir entre 3 niveaux d'exigence :
  • qualité haute : MP3 196 à 320  kb/s, AAC 128 à 256  kb/s, OGG vorbis 160 à 320  kb/s
  • qualité CD lossless : FLAC, ALAC, WMA, WAV, AIFF (16 bits - 44,1 kHz)
  • qualité haute-résolution : FLAC, ALAC, WMA, WAV, AIFF, DSD (24 bits - 44, 48, 88, 96, 192 kHz)
Le choix d'un encodage en MP3 320 kbs ou en FLAC (16bits - 44,1 kHz) semble un bon compromis. 

Et en streaming ? 

Le choix du format audio est également important pour les plateformes de streaming (d'autant plus qu'il est conditionné par des contraintes de débit et de bande passante) :

Deezer utilise le format MP3 avec 2 niveaux de qualité :
128 Kbits/s pour la version gratuite,
320 Kbits/s (son HQ) pour la version payante

Qobuz en streaming utilise 2 formats :
du MP3 en 320 MhZ pour son service "premium" et
du FLAC en qualité CD (16 bits à 44,1 kHz) pour l'option Hi-fi
(Qobuz vend aussi des fichiers en qualité studio master 24-bit, allant de 44,1 kHz à 192 kHz au format WAV, AIFF, FLAC, ALAC, WMA Lossless)

Spotify utilise le format Ogg Vorbis pour le streaming, avec trois niveaux de qualité :
96 kbps : Réglage "Bas débit" de l'appli mobile Spotify
160 kbps : Qualité de streaming standard de l'appli pour ordinateur / Réglage "Haute qualité" de l'appli mobile
320 kbps : Réglage "Haute qualité" disponible dans l'appli pour ordinateur avec Spotify Premium / Réglage "Qualité extrême" de l'appli mobile (uniquement disponible sur iOS et Android actuellement)

YouTube utilise le format audio AAC en 128 ou en 192 kbps pour streamer le son des vidéos en résolution moyenne et haute (et aussi du MP3 en 64 kbps, pour les vidéos en résolution basse) (source)

S'équiper d'un système d'écoute nomade

S'équiper d'un baladeur haute-fidélité suppose d'être attentif à tous les éléments de "la chaîne" : qualité de l'enregistrement initial, du fichier encodé, du matériel de diffusion, du logiciel (player), et du casque. Ce qui suppose une approche comparative et empirique pour évaluer séparément chaque paramètre. Par exemple,si on peut écouter des fichiers 24bit-88Mhz avec un smartphone sous android,  le rendu ne sera pas le même selon le choix de l'application player audio choisie  (poweramp, google music, neutron music player, ...) On peut même pousser le perfectionnisme jusqu'à brancher un DAC (digital to analog converter) entre le smartphone et le casque (voir Complete Guide to Android Smartphone Audiophile).

Présentation des formats et des codecs audio

AAC
L’Advanced Audio Coding est un format de compression utilisé par Apple. Il est réputé avoir un meilleur ratio qualité/débit que le mp3. Ainsi certains affirment qu’un fichier AAC en 128 kb/s a une qualité équivalente à un fichier MP3 en 256 kb/s
Extensions de fichier : .aac, .m4a, .m4p, .m4b, .mp4, .3gp
débits : 64, 80, 96, 128, 160, 192, 256, 288, 320 Kbps
fréquences d’échantillonage : 11, 12, 16, 22, 24, 32, 44, 96 kHz
Apple le propose à différents bitrate :
  • qualité podcast parlé : 64 kb/s / 22 kHz 
  • “haute qualité” (qualité standard) : 128 Kbps / 44 kHz (attention : les fichiers AAC achetés sur Itunes peuvent être protégés par des DRM limitant à 5 le nombre de partages de ces fichiers sur les ordinateurs)
  • iTunes Plus : 256 kb/s / 44 kHz 
Avantages : bonne qualité de compression, adapté à l'environnement Apple (ipod, iphone, ipad)
Inconvénients : format de compression avec perte. Non lisible par tous les baladeurs.

AIFF
L’ Audio Interchange File Format est un format développé à Apple, c’est un peu l’équivalent du format Wav choisi par Microsoft
Extension du fichier : .aif
débits : 8, 16, 24 bits
fréquences d’échantillonage : 8, 11, 16, 22, 24, 32, 44, 48, 96, 192 kHz
 2 niveaux de qualité :
  • qualité CD : 16 bits / fréquence 44 khZ 
  • haute résolution : 24 bits / fréquence de 44 à  192 khZ 
Logiciels compatibles : Ableton Live, Audacity, Cubase, Foobar 2000, GarageBand, iTunes, Pro Tools, QuickTime, Sound Forge Sound , VLC media player, Winamp
Il peut aussi être compressé dans sa version AIFF-C ou AIFC
Avantages : L’AIFF est l’un des 5 formats à la norme Hi-Res (audio haute resolution). Le son AIFF serait pour certains "plus analogisant et destressé" que le Flac...
Inconvénients : les fichiers au format AIFF peuvent poser des problème de reconnaissance de tags d'un player à l'autre. Format non comprimé, donc volumineux.

ALAC
L'Apple Lossless Audio Codec est un format d'encodage sans perte développé par Apple, à présent sous licence libre Apache.
Extension du fichier : .m4a
L’ALAC a un taux de compression d'environ de 50% des fichiers PCM (CD), comparé à d’autres formats il est plus facile à décoder, et demande moins de ressources de calcul
L’ALAC à l’inverse de AIFF gère les tags. En revanche, le taux de compression en ALAC est plus lent
C'est un format à utiliser dans un environnement iTunes avec les appareils d’Apple : iPod, Iphone, ...
2 niveaux de qualité :
  • qualité CD  : 16 bits / fréquence 44 khZ 
  • haute résolution : 24 bits / fréquence de 44 à 192 khZ 
Avantages : Format haute résolution adapté à l'environnement Apple
Inconvénients : Format moins répandu que le FLAC

Atrac 
L’ Adaptive Transform Acoustic Coding est le format de compression que Sony avait développé en 1992 pour les mini-disc.
extension : .aa3, .oma, .at3
L'Atrac était également lisible sur les baladeurs et les consoles de jeux video du constructeur japonais.
Il en existait 4 versions : ATRAC, ATRAC3, ATRAC3plus, ATRAC Advanced Lossless
Format abandonné par Sony en 2007 (source)

Audible file 
Audible est un éditeur et distributeur de livres audio ayant développé un format audio. La société a été acheté par Amazon en 2008.
extension .aa, .aax, and .aax+



DSD
Le Direct Stream Digital est un format audio utilisé notamment sur le Super Audio CD, lancé à la fin des années 1990 par Sony et Phillips. Sa technologie consiste en un codage de son avec une quantification sur un 1 bit unique à une très haute fréquence d’échantillonnage : 64 fois supérieure à l'échantillonnage PCM du Compact Disc. Soit une fréquence de 2,8224 MHz (64 x 44,1 khz) (wikipédia) Un SACD codé au format DSD pèse 7,95 GB (700 MB pour un CD) . Le DSD peut être compressé sans perte avec le DST (Direct Stream Transfer).
Rares sont les marques de baladeurs qui lisent le DSD (Astell & Kern, Fiio)


FLAC
Le Free Lossless Audio Codec est un codec libre de compression audio sans perte, qui à l’inverse du MP3 n’enlève aucune information de la source originale.
extension : .flac
Ni Windows, ni Apple ne proposent l'encodage en FLAC, bien que ce codec soit apprécié par beaucoup d'amateurs de musique pour la fidélité de sa reproduction sonore.

Avantages : Un bon compromis pour écouter sur son baladeur du son de qualité. Convertir sa discothèque au format FLAC, est réellement intéressant si on possède du matériel d'écoute audiophile (baladeur ou smartphone + casque) et un espace de stockage suffisant. La méthode pour convertir un CD en FLAC avec le logiciel Foobar 2000 est expliquée dans les tutoriels suivants :  Convertir un CD Audio en FLAC ;
Tutoriel : Riper un CD directement en FLAC / Convertir en FLAC avec Foobar2000
Inconvénients : Les fichiers FLAC sont environ 3 à 5 fois plus volumineux que les fichiers MP3. Le FLAC n'est pas lu par tous les baladeurs numériques (l'Ipod, l'phone notamment). Parmi les marques proposant des lecteurs compatibles FLAC, on trouve SanDisk, Archos, Sony, Cowon, Fiio, les smartphones sous Android.

Monkey's Audio 
Monkey's Audio est un codec de compression audio sans perte.
Format peut répandu, lisible avec VLC et sur les baladeurs Cowon, dernière génération.
extension : .ape


MP3
Le MPEG-1/2 Audio Layer 3, est le format de compression le plus connu… et peut-être l’un des moins bons, d’après de nombreux avis.
Il a été conçu en 1997 par l’institut Fraunhofer (ce même institut a aussi développé le format aac, réputé meilleur)
extension : .mp3
L’utilisation du MP3 n’est souvent pas perçue comme un soucis, car la perte de qualité due à la compression est masquée par la qualité moyenne du matériel d’écoute : baladeurs, écouteurs à oreillettes, smartphones, ou haut-parleurs bas de gamme des ordinateurs.
Le MP3 permet un taux de compression de 4,11 (320 kbit/s) à 176 (8 kbit/s)
débit : 8, 16, 24, 32, 40, 48, 56 , 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 Kbits/s
fréquence d’échantillonage : 8, 11, 16, 22, 24, 32, 44, 48 kHz
Quel débit choisir pour son baladeur ?
  • à partir de 128 Kbits/s : bonne qualité (qualité podcast Radio France)
  • à partir de 192 Kbits/s : très bonne qualité 
  • 320 Kbits/s : qualité optimale sur ce format
Le site  Lasonotheque.org propose d'écouter la différence entre différents niveaux d'encodage de mp3 : L’encodage MP3

Ogg Vorbis
Vorbis est un format libre et ouvert développé par xiph.org, également à l’origine du Flac. Il est réputé plus performant, à taux de compression égale, que le format mp3.
extensions : .ogg .oga
Sa qualité est noté de -2 à 10, selon son bitrate : de 32kb/s à 500Kb/s.
Avantages : Format léger. Codec libre
Inconvénients : Format de compression avec perte. Lisible sur peu de baladeurs.


WAV 
extension : .wav
Format développé par Microsoft et IBM, “le format WAV est une extension de fichiers audio, il s'agit d'un conteneur capable de recevoir des formats aussi variés que le MP3, le WMA, l'ATRAC3, l'ADPCM, le PCM. C'est ce dernier, le PCM qui est le plus courant, et c'est pour cela que l'extension .wav est souvent — et donc à tort — considérée comme correspondant à des fichiers « sans pertes » “ (Wikipédia)
Le format permet un encodage sans aucune perte de qualité en 16 bits - 44 khz.
Mais son système d’étiquetage (tags) est peu pratique, et la taille du fichier est limité à 2 Go : limitatif pour les les fichiers en H résolution (2Go = 20 minutes au format 5.1 en 24 bit/96 kHz)
Le format Wav est utilisé pour l’enregistrement sous environnement Windows. Audacity ou Sound Forge permettent notamment d’éditer des fichiers Wav.
En format compressé : la qualité est médiocre en dessous de 96 Kbits en mode CBR (son métallique) fréquence d’échantillonage : 8, 11, 16, 22, 24, 32, 44, 48, 96, 192 kHz
taille échantillon : 8, 16, 24 bits
Pour la Hi-Fi : 2 niveaux de qualité :
  • qualité CD : 16 bits – 44khz
  • qualité haute résolution : 24 bits – de 48 khz à 192khz 
Avantages : lu par quasiment tous les types d'appareils
Inconvénients : format volumineux, système de tags rudimentaire

Sources et références pour aller plus loin :

Les fichiers numériques audio
L'audio en haute résolution
La qualité du streaming musical
Comment ça marche ?

Aucun commentaire:

LinkWithin

Related Posts Plugin for WordPress, Blogger...