Petites différences entre WAV, FLAC, MP3

Twitter Facebook Google Plus Linkedin email

Avant d’aborder le sujet plus global de la compression de données, j’aimerai vous partager rapidement quelques détails sur les raisons qui ont fait du MP3 le champion de l’audio numérique grand public depuis maintenant près de 20 ans, et ce même si d’autres ont tenté de le remplacer à plusieurs reprises.

Petit rappel sur les formats

Le WAV est un format non compressé d’audio. D’un point de vue purement technique, c’est du PCM. Le FLAC, c’est un format compressé mais sans pertes, libre de brevets. Le MP3 est en revanche un format compressé, initialement affublé d’une tétrachiée de brevets qui ne l’ont pas empêché de se retrouver dans tous les appareils du marché pendant maintenant 20 ans. Initialement parce que depuis quelques mois, les derniers brevets sont arrivés à expiration et donc maintenant plus aucune restriction n’existe pour son utilisation dans tout types de produits.

Petit rappel sur l’échantillonnage et le bitrate

Dans le domaine de l’audio numérique, la fréquence d’échantillonnage correspond au nombre de fois qu’on capture un son en une seconde. Plus la fréquence est élevée, plus le son capturé est proche dans son évolution de ce qu’on entend avec nos oreilles. Il faut aussi tenir compte de la taille de l’échantillon : en informatique, on code avec des bits, séries de 0 et de 1. plus il y a de bits pour un échantillon, plus la quantité d’informations est importante, et plus fidèle sera le son.

Chaque marche représente un échantillon, plus on a d’échantillon, plus on est proche de la courbe d’origine

Exemple, le CD audio que l’on connaît maintenant depuis plus de 30 ans utilise une fréquence d’échantillonnage de 44100 Hz sur 16 bits (soit 44100 échantillons par seconde).

Vient enfin le concept de bitrate, qui dans le cas du MP3 est lié à la compression : un débit de bits plus faible indique une compression plus forte, ce qui veut dire une perte d’information plus grande. Voilà pourquoi je considère les plateformes grand public comme des destructeurs, puisque trop souvent le MP3 se limite à maximum du 256kbps (même si de rares vendeurs proposent jusqu’à 320kbps).

Voilà, on a les bases, on peut y aller.

Attaquons les choses sérieuses : la comparaison

Le morceau que j’ai utilisé provient d’un artiste dont je vous parlerai plus longuement dans un billet dédié. Sa version non compressée fait 50Mo :

La rapide petite analyse nous indique donc du PCM, avec une fréquence de 44100Hz sur 24 bits, soit un peu mieux que notre bon vieux CD audio. J’aurais pas craché sur du 96kHz mais on va pas chipoter non plus, 14 albums pour 70$ sans compression, même sans tenir compte du taux de change, la qualité est déjà bien au dessus de ce qu’on peut trouver sur les plateformes grand public.

Malgré un espace confortable de 16Go, je ne compte pas engorger la clé USB utilisée pour mon autoradio avec autant d’espace consommé. Les archives ZIP pèsent à elles seules 7,6Go, Rajoutez une trentaine de Mo par album une fois extrait. Vous comprenez maintenant d’où vient l’idée de l’article ?

Pour parvenir à mes fins j’ai réadapté certains vieux scripts, et notamment celui pour le passage du FLAC au MP3 qui a maintenant de la bouteille mais qui fait toujours autant le travail. Commençons justement par la conversion en FLAC, avec une petite subtilité. Lors de mes recherches sur les options que je pourrai appliquer, j’ai cherché comment conserver au maximum la qualité originale, ne sachant pas notamment si l’encodage de 24bit allait être conservé. Eh bien oui, si on utilise les options suivantes :

Dans les infos originales, on a déjà ce s32 affublé d’un « 24bit » juste à côté. Donc ça donne quoi ?

Seulement 8M de gagné, c’est pas foufou, mais rapporté à 12×14 morceaux, ça fait 1,3Go de gagné. Un joli début donc. Admettons que j’accepte de sacrifier une partie de la qualité, en repassant sur un encodage en 16bit. Déjà pourquoi ferais-je une chose pareille ? Ne serait-ce que parce que je n’ai pas d’appareil d’une qualité suffisante me permettant d’apprécier toute la clarté du son, que de toute façon une de mes oreilles commence légèrement à décliner par rapport à l’autre (à moins que ça ne soit directement mon cerveau, ce qui n’est pas exclus non plus); et si la qualité CD convient à une grande majorité de personnes depuis 30 ans, et que toutes les tentatives grand public pour le remplacer ont échoué (au point qu’on voit revenir le Vinyle en force), et si les gamins de maintenant arrivent à supporter un MP3 compressé à mort lu par leur smartphone sur le casque Beats horriblement cher qu’ils ont extorqués à leurs parents, on est pas près d’élever le niveau. 16bit seraient donc suffisants pour le commun des mortels.

On remarquera donc l’ironie de la chose puisqu’on va utiliser un format dit sans perte mais on va mécaniquement perdre de l’information. Pour ça, il faut légèrement modifier l’option aformat :

Oui c’est aussi simple et puissant que ça. Voyons dès lors le résultat :

Ah ouais. Là on se rapproche d’une taille raisonnable, mais au prix d’une information moins précise.

L’information moins précise, on va l’obtenir de toute façon avec le MP3, avec les mêmes réglages que mon script original, simplement en disant qu’on cherche du WAV au lieu du FLAC, ce qui nous donne le fichier suivant :

Bon ben là ça met tout le monde d’accord. A noter qu’on a tout de même conservé le 44100 Hz et qu’on est repassé sur 16 bits :

Et à l’écoute, en fonction des outils (casque, carte son, logiciel de lecture/égaliseur, autoradio), le résultat reste plus que correct. On comprend mieux dès lors pourquoi, même affublé de brevets, le format a explosé d’abord de manière illégale (pour ceux qui ne connaissent pas l’histoire, il n’y avait AUCUNE plateforme de vente numérique de musique lorsque Napster est apparu en 1999), puis sur les plateformes en ligne une fois la lubie des DRM dépassée (avant que l’évolution des débits ne permette l’apparition et l’expansion du streaming, retirant le contrôle de l’écoute des mains des consommateurs).

Quel format choisir dès lors ?

Celui que vous voulez ! Tout dépendra de vos contraintes, qu’elles soient liées à l’espace disque (les smartphones ne sont pas spécialement bien équipés de ce côté-là), à l’appareil sur lequel vous allez jouer la musique (mon autoradio ne supporte tout simplement pas le FLAC), au dispositif de restitution (enceintes, casques), bref, vous avez compris. Pour ma part, je garde plusieurs versions : les WAV d’origine, dans leur archive que je vais tout de même passer au format 7z, ce qui me permet là aussi d’économiser environ 80Mo par album (et encore cette valeur est tirée d’un test avec les options par défauts de 7z en ligne de commande), et les FLAC 16bit. A l’occasion, si j’ai besoin d’un support supplémentaire, je fais la conversion rapidement, et le tour est joué 🙂


Bonus : les formats qui ont tenté de supplanter le MP3

Ce n’est pas une liste exhaustive (faites un ffmpeg -codecs |grep D.A pour vous en convaincre), mais lorsque le MP3 a commencé à rencontrer son succès auprès du grand public, les vendeurs de musique ont mis des années à proposer leur catalogue en ligne de manière légale, d’abord affublé de restrictions (DRM, pour Digital Rights Management, ou MTP en français, Mesure Technique de Protection – en bref, un dispositif destiné à vous empêcher de faire ce que vous voulez de ce que vous avez acheté). En parallèle, des alternatives open-source/libre ont également vu le jour avec parfois des objectifs différents (c’est le cas du FLAC qui contrairement au MP3, ne perd en théorie pas d’informations).

Il y a d’abord l’AAC, conçu par l’institut Fraunhofer à partir de 1997, qui était déjà l’initiateur du MP3 (car il faut savoir que ce dernier remonte à bien longtemps avant sa montée en popularité du début des années 2000). C’est notamment le format qu’essaie de privilégier Apple dans son univers, et il est vrai que les promesses de qualité égale à poids plus faible sont alléchantes. Apple ayant fait du Apple (à savoir du Apple-compatible only) avec notamment les DRM les premiers temps, et personne d’autre ne l’ayant considéré, le format n’a jamais pu décoller, et reste marginal à l’heure actuelle. Malgré tout, les travaux pour le faire évoluer et entrer dans le monde de la HD et du streaming continuent.

Toujours dans le domaine du propriétaire/breveté de partout, Microsoft a tenté le coup avec le WMA, qui n’apporte strictement rien que ce soit en terme de qualité, de performance, ou d’ouverture (idem, ils ont forcé à mort le DRM avec l’argument « ça marche sur windows », mais seulement avec le lecteur Windows Media qui n’était déjà pas le plus populaire des lecteurs audio sous Windows à la fin des années 90). Je ne vais que très rapidement évoquer un autre format vite tombé en désuétude, le RealMedia, qui se lisait avec le RealPlayer, et était l’un des premiers formats à pouvoir se lire en streaming durant les années 90 (bien avant les solutions d’aujourd’hui donc).

Côté libre, on a le Vorbis, qui a taux de compression égal est censé fournir un fichier de taille plus légère et d’une meilleure qualité (ça, on sait que c’est compliqué à évaluer). C’est généralement valable la plupart du temps, mais le souci, c’est son support matériel presque entièrement absent du marché quand à l’époque de la montée en puissance du MP3 FraunHofer proposait directement des modèles d’implémentation dans des puces de décodage dédiées (de la programmation physique quoi). Le même Vorbis a été choisi par Google pour gérer la partie audio du Webm, aux côtés du VP8 puis du VP9 pour la vidéo. J’ai évoqué le FLAC, qui a du succès, mais qui pourtant ne vise pas le même objectif puisqu’il n’y a pas de perte de qualité au prix d’une consommation disque furieuse. Reste l’Opus, qui est principalement destiné à des applications de flux (streaming, soit vidéo, soit au sein de logiciels de communications), mais qui peut également faire l’affaire. Pareil, malgré l’absence de brevets, tout comme pour le Vorbis, on voit peu de support de la part des constructeurs, et rares sont les applications de lecture en dehors d’un certain VLC à le supporter hors navigateurs Web évidemment.

C’est dommage, le MP3 c’est bien, mais ça a déjà 25 ans, on a su mettre le Divx/XviD à la retraite (enfin presque), il serait temps de s’attaquer à nos oreilles maintenant que nos yeux sont rassasiés.

8
Poster un Commentaire

avatar
3 Fils de commentaires
5 Réponses de fil
2 Abonnés
 
Commentaire avec le plus de réactions
Le plus populaire des commentaires
6 Auteurs du commentaire
MatSeboss666JacksonSergiofredéric Auteurs de commentaires récents
  S’abonner  
plus récent plus ancien
Notifier de
FMR
Invité

Salut,
Très intéressant cet article.
Tu devrais faire un test ABX entre Flac HD et FLAC 16/41 http://www.lemonde.fr/pixels/article/2015/08/21/on-a-teste-la-musique-en-haute-definition_4711583_4408996.html
Mais aussi entre MP3@320 et V0. Peut-être aurais tu des surprises…

fredéric
Invité
fredéric

Bonjour,
Petite précision mathématique :
« Plus la fréquence est élevée, plus le son capturé est proche dans son évolution de ce qu’on entend avec nos oreilles. »
Ce n’est pas tout à fait vrai. Le théorème de Shannon stipule que la fréquence d’échantillonnage doit être uniquement deux fois supérieure au signal à échantillonner voir https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_d%27%C3%A9chantillonnage. On peut toujours prendre plus d’échantillon, on n’améliore pas la numérisation du signal juste de la perte de capacité de stockage.
A+

Sergio
Invité
Sergio

Ttu as mal lu, dans l’article que tu cites:
La représentation discrète d’un signal exige des échantillons régulièrement espacés à une fréquence d’échantillonnage supérieure au double de la fréquence maximale présente dans ce signal.
d’ailleurs sur un cd l’echantillonnage n’est pas a 40Khz …

Jackson
Invité

Y’a t’il une réelle différence entre la qualité CD 16 bits et du MP3 320 kbps ?