Egalisation - Des Hertz et des sons
1 janv. 2000 - par Franck ERNOULD
Cette partie traite notamment des relations entre Hertz et sons, corrections et impressions sonores.Toute considération psychoacoustique est éminemment subjective et nécessite souvent une adaptation d'une personne à une autre. Les termes, adjectifs et chiffres cités dans cet article ne sont aucunement donnés pour universels, intangibles et rigoureux : ils reflètent les conceptions et opinions de l'auteur. S'ils peuvent être la base de remises en question, de discussions, d'expériences, voire même s'ils peuvent apprendre certaines notions au lecteur, leur but sera pleinement atteint...
Le plat pays | |
-
On recherche de tout appareil électroacoustique, qu'il soit électronique (ampli, console, convertisseur...) ou de type transducteur (micro, enceinte acoustique...), une courbe de réponse la plus plate possible. Or, s'il est bien un capteur auquel le mot linéarité s'applique fort mal, c'est l'oreille humaine ! Au fil de l'évolution de l'espèce, elle s'est sensibilisée aux fréquences les plus proches de la voix - plus particulièrement celle d'un bébé. Notre zone de perception maximale se situe donc autour de 1 à 2 kHz. Au-dessous et au-dessus de ces fréquences, on entend d'autant plus mal que le niveau est bas ! La courbe "niveau réel objectif/niveau perçu subjectif" la plus plate est atteinte vers 85 dB SPL. Entre parenthèses, c'est d'ailleurs le niveau sonore de mixage normalisé en cinéma : le mixeur procède au calibrage de son installation de façon à mesurer, là où il est assis, ces fameux 85 dB SPL !
A des niveaux d'écoute inférieurs, les graves et les aigus sont moins bien perçus. Les fameux correcteurs de "loudness", présents sur nombre de chaînes hifi, servent à rééquilibrer ces défaillances de l'oreille. À des niveaux d'écoute supérieurs, la courbe redevient tourmentée, l'oreille se fatigue plus vite, et la dynamique est moins bien analysée. Voilà pourquoi un même son aigu, inoffensif écouté doucement, peut devenir strident si on en augmente le niveau sonore.
Des goûts et des couleurs | |
-
Autre préliminaire avant d'entrer dans le vif du sujet : toutes les écoutes, quelle que soit leur marque, leur modèle, leur prix, ont une coloration acoustique propre. Aucune ne possède une courbe de réponse parfaitement plate. C'est une vue de l'esprit ! N'oublions pas non plus les phénomènes de mode, actuellement favorable aux moniteurs de studio très généreux dans le grave, jolis dans l'aigu (style Genelec, FAR...) : des enceintes hifi déguisées en modèles professionnels par surdimensionnement de leurs composants, en quelque sorte.
Écouter des sons sur ces enceintes colorées revient à vouloir juger de l'équilibre des tons sur un tableau en le regardant avec des lunettes teintées : un peu de rose, un peu de vert... Voilà le problème ! Contrairement à l'oeil, l'oreille s'habitue à ces colorations, finit par les compenser. Cela explique que certains ingénieurs du son, accoutumés à leurs écoutes, réalisent d'excellents mixages en se fiant à ce que d'autres, moins habitués, qualifient volontiers de "casseroles".
Pour ne rien arranger, ces enceintes sont placées dans une cabine dotée elle aussi d'une personnalité acoustique propre, encore qu'en écoute de proximité, son influence reste assez réduite. Enfin, n'oublions pas que l'amplificateur possède lui aussi un son, et qu'une enceinte peut se comporter différemment selon le modèle qui l'alimente. Un aspect que les moniteurs actifs contournent élégamment.
Six registres | |
-
Après cette entrée en matière, qui visait à vous rendre conscient de tous les prismes déformants situés entre la modulation électrique et vos oreilles, passons aux choses sérieuses : les relations entre Hertz et sons ! Sans vouloir être par trop minutieux, on peut "décortiquer" le spectre audible (qui, dans la fourchette la plus couramment admise, s'étend de 20 Hz à 20 kHz pour une oreille en pleine forme) en six registres.
1°) Extrême-grave : entre 20 et 60 Hz
Le son est davantage ressenti qu'entendu, à moins d'y consacrer une énergie électrique considérable. La présence d'extrême-grave dans un mixage, à sous réserve que les écoutes puissent reproduire ce registre, donne une impression de puissance. En mettre trop rendra le son indistinct, confus... et abrégera la vie des membranes ! En mixage cinéma style Dolby Digital ou DTS, c'est l'ajout de ces composantes très graves aux bruits et effets qui donne tout l'aspect spectaculaire... et justifie la présence d'un canal spécialement dédié à ce registre !
2°) Grave : entre 60 et 200 Hz
C'est ici que se situe en grande partie l'énergie d'une rythmique. La tessiture "habituelle" d'une basse, par exemple, va de Mi 1 à Mi 4, soit des fondamentales s'échelonnant de 80 Hz à 640 Hz.
3°) Bas-médium : entre 200 Hz et 1,5 kHz
Les premières fréquences harmoniques de la plupart des instruments sont là. Si l'on apporte trop de corrections dans cette région du spectre, les timbres deviennent souvent nasillards, un peu pincés, voire fatigants - il y a trop d'énergie par rapport à la fondamentale.
4°) Haut-médium : entre 1,5 kHz et 4 kHz
Zone où commencent à se trouver les harmoniques de rang élevé. C'est le respect de ce registre qui permet de "reconnaître" le contenu des messages (facteur d'intelligibilité en transmission vocale - respect des consonnes). Conséquence : pour améliorer la compréhension d'un texte chanté, c'est ici qu'il faut corriger !
5°) Aigu : entre 4 et 10 kHz
Nous voici au pays de la clarté, de la définition des sons. Corriger un instrument ou une voix vers 5 kHz la fait se rapprocher, en augmente la présence. Toutefois, gare aux éventuelles sifflantes, qui se trouveront boostées par un tel traitement, jusqu'à rendre la voix agressive.
6°) Extrême-aigu : entre 10 et 20 kHz
Ici encore, on parle d'une impression de clarté, de brillance, d'air... Corriger dans cette région peut donner un "piqué" intéressant. Méfiance : les éventuels souffles, bruits à spectre large et autres pllutions ne demandent qu'à se réveiller lors d'égalisations un peu appuyées...
La scission des registres extrêmes en deux parties peut sembler un peu "artificielle". Concrètement, sur les consoles professionnelles, vous remarquerez généralement la présence de quatre correcteurs, les plus sophistiqués (paramétriques) étant réservés aux bas et haut-médiums. Sur les consoles home studio, on ne bénéficie généralement que d'un seul correcteur, semi-paramétrique de surcroît, pour trafiquer cette zone si sensible qu'est le registre médium. Le home studiste ne part donc pas gagnant... D'autant que les graduations sérigraphiées sur les correcteurs des consoles ne sont pas toujours exactes ni précises !
Pairs et impairs | |
-
Parlons musique. Pour une même note (mettons le La du diapason, autrement dit le La 3, soit une fréquence fondamentale de 440 Hz), on reconnaît sans coup férir un piano d'un violon ou d'une voix humaine. Pourquoi ? Je vous entends répondre "Par leur timbre !". Rappelons, d'après Fourier, que n'importe quel son se décompose en un ensemble de sinisoïde : une fondamentale (ici, 440 Hz) et une nuée d'harmoniques, dont les fréquences sont des multiples entiers de cette dernière. Les harmoniques "pairs" (rangs 2, 4, 6, 8, soit 880, 1760... Hz) sont jugés agréables à l'oreille (le 2, le 4 et le 8 sont des octaves et le 6 est une quinte du son de base), tandis que les harmoniques impairs (rangs 3, 5, 7, soit 1320, 2200... Hz) sont jugés désagréables (intervalles souvent dissonnants : quinte, tierce majeure, puis mineure, puis seconde...). Il faut garder à l'esprit que ces harmoniques se retrouvent rarement seuls, mais cohabitent comme "satellites" de fondamentales d'accords à quatre, voire cinq sons - voir encadré "Dissection de deux accords de guitare".
Un son ayant une fondamentale intense et peu d'harmoniques sera "velouté". Il semblera "creux" si ses harmoniques de rang élevé sont importants par rapport à sa fondamentale. C'est en estimant la "dose" relative de chacun des harmoniques.... jusqu'à 20240 Hz (harmonique de 46è rang !) que notre oreille reconnaît le timbre d'une trompette ou d'une flûte. Vrai, mais incomplet. D'autres expériences ont montré que, privé de leur attaque percussive, un son de piano ou de guitare deviennent méconnaissables. Pourtant, leur timbre est préservé par la manipulation ! Cet effet fut très apprécié des premiers compositeurs de musique concrète, voici 50 ans. Après tout, une banale guitare électrique "jouée" à la pédale de volume s'éloigne beaucoup du son original... Application : dans un mixage, lorsqu'on désire mieux percevoir un instrument, ce n'est pas toujours le son "établi" qu'il convient de corriger, mais aussi son attaque !
Notons également que la personnalité d'un instrument provient parfois d'un nombre réduit d'harmoniques, dont la combinaison est si particulière que l'oreille peut s'y référer pour le reconnaître à partir de ces quelques fréquences. Autre "truc" pour reconnaître un son : les formants. Imaginons une même anche montée sur une clarinette, puis un saxophone : l'excitation de base est la même (un signal très riche en harmoniques), mais c'est le son particulier de l'instrument, ses formants, une coloration qui n'a rien à voir avec un spectre régulier, qui viendra colorer cette excitation de base, renforçant donc certains harmoniques de départ au détriment de certains autres, et fera distinguer la clarinette du sax. Remplacez l'anche par les cordes vocales et le sax par un larynx : c'est grâce aux formants de celui-ci qu'on reconnaît la voix de son interlocuteur au téléphone (bande passante : 300 - 3 000 Hz) par exemple. Ce principe de faire émerger les zones caractéristiques d'un instrument, en laissant tomber les autres, s'applique au mixage quand de nombreux instruments sont mélangés - nous y reviendrons dans les prochains volets.
Quid enfin des instruments percussifs à spectre large, sans hauteur donc fondamentale définie ? Laissons de côté les développements mathématiques et remarquons que les sons de ces instruments explorent toute la gamme de fréquences, même si ce n'est pas évident à l'oreille et au bon sens. De l'aigu sur une grosse caisse ? Du grave sur une charley ? Écoutez ces sons à nu, et essayez d'enlever respectivement beaucoup d'aigu ou beaucoup de grave, vous entendrez ! Cela dit, leur zone "utile", celle qu'on perçoit dans un mixage, est bien définie, et c'est sur elle qu'il conviendra d'agir : attaque, "clong", clous d'une cymbale...
Si on chantait | |
-
Passons maintenant à un type d'instrument un peu particulier : une voix qui chante un texte ! Nous aurons un mélange de sons établis (les voyelles) et de sons transitoires (les consonnes, percussions plus ou moins dures - T, B, K - ou bruits diffus doux - F, Z, J - ou durs - S, CH). Or, chaque voyelle correspond à un "formant", une "signature" spectrale particulière. Les consonnes, elles, se rapprochent plutôt de bruits, à spectre plus ou moins large : un chhhh est presque du bruit blanc ! Enfin, les spécificités de chaque langue (lorsqu'il parle, un Allemand n'a pas la même voix qu'un Américain, qui n'a pas la même voix qu'un Français) provoque lui aussi l'apparition de structures harmoniques particulières. Autrement dit, pour une même chanson interprétée en allemand, en anglais ou en français, avec un même playback, la mélodie sera identique, mais tout le reste différera: emplacement et type des consonnes (ouvertes, A, O, ou fermées, I, U, diphtongues...), emplacement et type des voyelles, "placement" général de la voix, accent tonique éventuel. Conclusion : impossible de poser la voix sur cette musique en appliquant les mêmes recettes pour les trois langues. La plus favorisée sera l'Anglais (c'est bien connu, on "rentre" plus facilement une voix anglo-saxonne dans un mix), puis viendra l'Allemand, et enfin le Français - notre langue se prête facilement à l'adoption d'une articulation "molle" et d'une voix détimbrée, c'est-à-dire dépourvue de couleur (voyelles sans diphtongues), de signature harmonique forte, là où, culturellement, les Américains ou les Anglais timbrent sans y penser, d'où leur côté un peu nasillard parfois. Comparez les deux strophes suivantes :
"Show me the way to the next whisky bar / Oh, don't ask why / For if we don't find the next whisky bar / I tell you we must die"
"Dis-nous où trouver le prochain beau p'tit bar / D'mande pas pourquoi / Car si on trouve pas le prochain beau p'tit bar / J'te jure qu'on en crèvera"
Il s'agit de la version originale de la chanson "Alabama song", écrite directement en Anglais par Bertold Brecht, puis adaptée en Français par Boris Vian. La comparaison des types de consonnes est éloquente : Ch, x, k, b, f, t... contre D, n, p, J. Même chose pour les voyelles : o-ou, ou-éi, ou-i, aï, eu contre i, é, o, ain, è, a... Quoi d'étonnant si Jim Morrison se mixe beaucoup plus facilement que Catherine Sauvage ?
Voilà, c'est tout pour aujourd'hui. Dans [article.php?lang=FR&id=19]la prochaine partie[/], nous envisagerons le mixage lui-même : il nous faudra corriger nombre de sons en tenant compte de leurs voisins, et réussir à "faire une place" à chaque instrument. Une vraie gageure...
Notes | |
-
Les dB
Les décibels vous semblent décidément bien abstraits ? Voici deux recettes simples : primo, une correction de 1 dB est la plus petite généralement audible pour une oreille statistiquement "moyenne". Secundo, lorsqu'il s'agit de signaux audio passant dans une tranche, la tension double (ou diminue de moitié) chaque fois que vous ajoutez (ou retranchez) 6 dB. Exemple : un son a une composante riche vers 3 kHz, et il module tel quel à -5 dB environ. Si vous corrigez méchamment, par exemple de + 18 dB, vous multiplierez la tension correspondant à cette composante par 8 (6 + 6 + 6 dB équivaut à 2 x 2 x 2), passant par exemple de 125 mV à 1 V.
Faites glisser
"Les Hertz", la "dureté", le piqué... C'est bien joli, mais comment savoir où corriger un son ? Comment déterminer à quelle fréquence se trouve la partie sa plus "caractéristique ? Facile : poussez le gain de votre correcteur paramétrique ou semi-paramétrique à fond ou presque, puis balayez toute la gamme de fréquence qu'il autorise. Fatalement, à un moment ou à un autre, vous tomberez sur le "corps" de votre son, c'est très audible. Remettez alors le gain sur 0 dB et procédez à la correction voulue...
Plus c'est fort, plus c'est riche
Sans vouloir tomber dans un cours d'organologie appliquée, sachez que plus on sollicite fortement un corps, plus il émet d'énergie sonore, bien sûr, mais aussi plus le spectre se charge en harmoniques aigues. Ce phénomène fonctionne sur les cordes pincées, frappées, grattées, sur les percussions, les anches, les embouchures... et sur les cordes vocales ! L'expérience mérite d'être tentée : enregistrez la même mélodie "à voix très basse", puis "à voix haute". En écoutant les pistes correspondantes en solo sur leur tranche respective, faites-les moduler de manière équivalente au VU-mètre. Essayez ensuite de les incorporer, à ce niveau, dans un playback... Dépourvue d'énergie dans les harmoniques supérieurs, votre "version murmurée" ne passera jamais telle quelle. Il faudra sans doute la corriger outrageusement dans la zone d'intelligibilité - c'est-à-dire les haut-médiums - et sans doute la comprimer assez méchamment. Nous verrons d'ailleurs dans les autres volets de cette série que la compression est souvent l'alliée indispensable de l'égalisation...
Un bête accord de guitare...
Prenons un accord de mi majeur joué sur la guitare : il est composé des notes mi1, si1, mi2, sol#2, si2, mi3. Le tableau ci-dessous envisage, tout à fait arbitrairement, les six premières harmoniques des notes de l'accord. On s'aperçoit d'une part que leurs fréquences ne vont pas au-delà de 1980 Hz, et d'autre part que si les notes de l'accord parfait lui-même sont majoritaires (mi sol# si), elles frottent quand même un peu avec des fa# et ré #... Accessoirement, le tableau permet de s'apercevoir que la guitare est finalement un instrument assez bas-médium par elle-même : heureusement que le plectre, le métal des cordes, les éventuels jeux de cordes sympathiques (accordées à l'octave supérieure sur une 12 cordes) et, en version électrique, les diverses saturations existantes, se chargent d'enrichir la palette sonore dans les aigus, bien au-delà de notre sixième harmonique...
Corrections et sampling
L'échantillonnage peut parfois réserver des surprises. Prenons par exemple un piano, un vrai. Premier écueil : le spectre de chaque note est un peu différent de celui de la note précédente ou suivante. Par conséquent, si vous samplez un do2, que vous jouez ensuite de do 1 à do 3, le sampler transposera sans autre forme de procès le contenu harmonique propre au do 2. L'oreille reconnaîtra la mélodie grâce à la fondamentale, mais le spectre figé transposé "bêtement" ne la trompera pas : elle a l'habitude du "vrai" piano, où les harmoniques d'un do 3
ne sont pas répartis comme ceux d'un do 1.
Second écueil : les bruits de marteaux. Ces chocs sur les cordes possèdent pour leur part un spectre large, qui excite toute la structure mécanique du piano. Autrement dit, il apparaît un formant caractéristique, constant pour chaque "vraie" note. Autrement dit, que vous jouiez un do 1 ou un do 3, cette partie su son restera identique : une mécanique faisant réagir une structure. L'échantillon do 2 de tout à l'heure inclut bien sûr cette composante du son. Lorsque vous le transposez vers le haut, vous transposez aussi ce formant, qui devient mobile et vient se greffer à des composantes harmoniques non respectées. Alors là, l'oreille n'est plus du tout contente ! Voilà pourquoi les pianos échantillonnés comportent généralementdes multitudes d'échantillons...
Ce principe s'applique tout autant à une guitare (avec le bruit caractéristique du plectre qui pince la corde) ou à une basse électrique, dont la caisse aurait une résonance centrée vers 200 Hz, reprise par ses micros et qui ferait partie intégrante du son (soit dit en passant. Jouée en "vrai", il suffira de corriger dans une bande assez large autour de 200 Hz pour l'atténuer. Si vous avez samplé un sol (fréquence : environ 96 Hz), dont la résonance aura musclé l'harmonique 2, et que vous jouez ensuite cette note harmoniquement colorée, la résonance se transposera avec le reste de la note : plus question de l'atténuer d'un coup de correcteur !
© 1998 - Franck ERNOULD
L'avis des membres | |