Catégorie : Affinity

Non, ce n’est pas un billet tiré de « philosophie magazine » ou inspiré par une quelconque mouvance « mindfulness », quoique… allez savoir !

Je reviens à nos moutons audioprothétiques, et là normalement vous allez vous dire que le rédacteur de ce billet est totalement obsédé par ce sujet de… dynamique vocale !

Oui, je vais encore aborder le sujet car il me semble important, et même crucial de connaître l’état de cette dynamique à l’entrée de l’aide auditive, et à sa sortie. Surtout à sa sortie : une aide auditive qui lisserait les contrastes temporels de la parole par une compression trop importante des « crêtes » ou une amplification exagérée des « vallées » en réduirait le contraste dynamique, réduisant du même coup les chances du malentendant appareillé d’extraire ces informations dans un bruit par nature souvent plus stationnaire que la parole.

Mais puisque l’on parle de « dynamique », encore faut-il savoir de quoi on parle. Nous avons coutume de considérer que la parole a une dynamique de 30dB environ. C’est à dire que si l’on mesure son niveau par bandes de 1/3 d’octaves à long terme (ex : 1 minute), les crêtes se situent 12dB au-dessus de ce niveau à long terme, et les vallées 18dB en-dessous, environ.

Cette dynamique de 30dB n’est pas « plaquée » autour du LTASS, elle est le résultat d’une analyse statistique de la distribution des niveaux du signal. Dans le cas de la chaîne de mesure in-vivo, pendant toute la durée de la mesure, la chaîne de mesure « classe » les différents niveaux atteints, et va se retrouver avec une courbe de distribution suivant une loi normale (cas de l’ISTS), ou de densité autre (signaux non vocaux par exemple), et dont les niveaux se répartissent autour d’un niveau médian (= dépassé, ou non-atteint 50% du temps), et qui indique, par exemple,  que 10% du temps le signal  a atteint tel niveau, que 30% du temps il a dépassé tel niveau, etc.

C’est une donc ce que l’on appelle l’analyse percentile du signal. Je vous laisse imaginer le calcul processeur nécessaire pour faire cela « à la volée », mais aussi en parallèle compiler et classer sur le long terme (ex : pendant 45 secondes).

Classer les différents niveaux va permette au final de définir la « dynamique » que nous avons l’habitude de visualiser entre le 30ème percentile (dépassé 70% du temps = les vallées) et le 99ème percentile (dépassé 1% du temps = les crêtes). Et on a coutume de dire que cette dynamique 30/99ème percentile est de 30dB.

Oui… mais pas tout à fait ! Ce calcul est totalement dépendant de la fenêtre temporelle d’analyse du signal. Si on voulait utiliser une analogie avec la photographie ce serait le temps d’ouverture de l’objectif de l’analyseur. En photo, plus longtemps vous « ouvrez », plus vous faites entrer de photons sur le capteur. Si vous êtes en plein jour et que vous ouvrez très longtemps, votre photo sera « cramée », c’est à dire blanche…

La chaîne de mesure fonctionne un peu comme un objectif : elle prendra une « photo » selon un temps d’ouverture, et le résultat de l’analyse percentile (et donc la dynamique du signal) sera très dépendant de nombreux facteurs. Parmi ceux ci, il y a la résolution temporelle de la fenêtre de la FFT, et cette dernière peut avoir une influence sur la résolution fréquentielle de la mesure (voir plus loin).

Pour faire savant, si un signal est échantillonné à 44100Hz (Fs) et que la FFT est réalisée avec un bloc de 1024 échantillons (c’est à dire N = 1024 échantillons temporels, correspondant à une taille mémoire imposée par le matériel), la résolution temporelle sera de N/Fs = 1024/44100=23ms, et la résolution fréquentielle sera de Fs/N = 44100/1024=43Hz. N est toujours une puissance de 2 dans les analyseurs physiques. Le principe de la FFT (Fast Fourier Transform) utilisée, entre autres, dans nos chaînes de mesure est donc de prendre ces 1024 échantillons temporels de 23ms et 43Hz de « large » qui vont aller remplir la mémoire de l’analyseur pour ensuite passer dans un algorithme de calcul FFT. Si on voulait avoir une résolution temporelle de 1 seconde, il faudrait remplir une mémoire adéquate avec 44100 échantillons (dans ce cas, le nombre N d’échantillons temporels serait égal à la fréquence d’échantillonnage Fs).

Dans nos chaînes de mesure, il va y avoir, comme dans tout analyseur matériel, plusieurs limitations. L’une est la taille de la mémoire (qui limite le nombre d’échantillons à analyser), l’autre est la vitesse de transmission du port USB qui limite la résolution temporelle de signaux pouvant transiter vers le PC à des blocs de 46ms (donc impossible de faire transiter des informations plus fines en temporel). Ce n’est pas forcément un problème, car l’analyse idéale, définie par la norme IEC 60118-15 (qui régit l’analyse des signaux de mesure in-vivo), souhaiterait que la mesure in-vivo soit réalisée avec une résolution temporelle de 125ms. Mais c’est, pour l’instant, techniquement difficile, car pour y arriver il faudrait, au choix :

  1. diminuer la fréquence d’échantillonnage du signal, et donc sa bande passante (voir la suite)…
  2. ou alors, si on voulait conserver une fréquence d’échantillonnage de 44100Hz afin de ne pas perdre de bande passante mais garder une résolution temporelle de 125ms (0,125sec), effectuer 0,125ms x 44100Hz = 5512,5  blocs temporels pour le calcul de la FFT, soit 5 fois plus qu’actuellement (en fait, ce serait 2 puissance 12 ou 2 puissance 13 blocs temporels pour être exact).

Tout est une question de moyens financiers que l’on veut mettre dans du matériel possédant des capacités aussi importantes… Notez quand même qu’à l’heure actuelle, un matériel distribué en France par la société AURITEC, le Verifit2 d’Audioscan, permet une résolution temporelle de 128ms avec une bande passante (in-vivo et coupleur) de 16kHz, donc 4096 blocs temporels (32000Hz*0,128ms) pour le calcul de la FFT. Il s’agit d’une chaîne autonome (non reliée en USB au PC), tournant sous Linux, avec processeurs dédiés.

Si on applique cette méthode d’analyse idéale (norme IEC 60118-15), donc avec fenêtre de 125ms (donc N=Fs x 0,125ms = 5512,5), pour un signal (ISTS) émis à 65dB SPL, on obtient :

ISTS_30_99_125ms_65dB SPL

En observant l’analyse ci dessus, on constate bien que la dynamique entre les percentiles 30/99 est d’environ 30dB à 3kHz,et d’environ 20dB à 400Hz.

Mais si on avait analysé le signal avec une fenêtre de résolution temporelle 1 seconde (N=44100 échantillons temporels), pour un ISTS toujours à 65dB SPL, on aurait eu :

ISTS_1s

La fenêtre d’analyse étant plus grande, et si on suppose que les zones faibles (comme les fortes) du signal sont très brèves, elles ont été « diluées » en quelque sorte avec les zones moyennes (entre les percentiles 50 et 65), plus représentées statistiquement. La dynamique a été divisée par 2 (env. 15dB à 3kHz). La parole peut être considérée comme un signal stationnaire… (Citation de Franck L. 😉 ).

Poussons le raisonnement à l’inverse, avec une fenêtre de résolution temporelle de 5ms (de l’ordre du phonème, avec N=220,5 écantillons temporels) :

ISTS_5ms

La dynamique du signal passe à 30dB à 400Hz, et environ 37dB à 3000Hz. Mais surtout, vous remarquerez la perte de résolution fréquentielle  dans les basses fréquences. C’est mathématique : la durée de la fenêtre temporelle doit être au moins 5 fois plus longue que la période du signal à analyser : donc ici pour 200Hz, fenêtre temporelle minimale = 5 x (1/200Hz) = 0,025 = 25ms. La fenêtre temporelle de 5ms n’est pas adaptée à l’analyse de signaux de 200Hz, et pour être exact, cette résolution temporelle ne permet même pas une analyse correcte de signaux inférieurs à 900Hz car leur période (= 1/fréq) est supérieure à la résolution temporelle de la fenêtre d’analyse… ce qui veut dire en clair que nous n’aurons jamais accès à des événements brefs (impulsionnels), dans les graves tout au moins avec les méthodes de type analyse FFT utilisées actuellement sur nos chaînes de mesure. Mais d’autres méthodes existent pour ces événements impulsionnels, et peut-être les verrons-nous dans de futurs modèles de chaînes de mesure…

AN : avec une résolution temporelle de 23ms sur une chaîne de mesure, la plus basse fréquence analysable correctement est de 5/0,023 = 217Hz. On comprend mieux pourquoi l’ISTS a été créé avec des voix de femmes et un fondamental laryngé de 200Hz, et pas des voix d’hommes avec un F0 à 125 ou 150Hz…

Et enfin, ce que font nos chaînes de mesure avec une résolution temporelle de 46ms (2 blocs de 23ms moyennés = 2 x 1024 points moyennés) :

ISTS_65dBSPL_46ms
Vous remarquerez que la dynamique percentile 30<–>percentile 99 est un peu plus importante que celle du signal analysé en 125ms. Tout est relatif donc dans ce genre de mesures et d’analyse de la dynamique du signal…

Le facteur temporel d’analyse, qui découle donc de la fenêtre FFT (1024 échantillons sur nos chaînes de mesure), a donc des répercussions sur la lecture des mesures. La dynamique de la parole (ou d’un autre signal) est tout à fait relative, en fonction des paramètres d’analyse, souvent dictés par le matériel. Les audioprothésistes (les fabricants de nos chaînes de mesures…) sont face à un dilemme :

  • nous donner accès à des événements très brefs et potentiellement agressifs pour le patient, en lecture de crêtes, mais en perdant de la résolution fréquentielle et en sachant que ce n’est pas possible en basses fréquences (avec les méthodes d’analyse actuelles)
  • nous donner accès à la meilleure résolution fréquentielle possible pour les réglages en perdant en résolution temporelle, et donc en risquant de ne pas avoir la lecture d’événements potentiellement agressifs…
  • … je résumerais donc ce dilemme avec une maxime de Pierre DAC : « Plus je pédale moins fort, moins j’avance plus vite » !

Il y a donc un compromis dans la mesure, pour l’usage en audioprothèse, et qui va être :

  • de ne pas descendre sous quelques dizaines de ms afin de garder une bonne résolution fréquentielle (en BF),
  • d’aller au-delà de 125ms afin de visualiser l’effet des compressions sur le signal amplifié par la lecture de sa dynamique,
  • … mais tout en sachant que se rapprocher de 125ms permet une bonne résolution fréquentielle (idéale selon la norme)…
  • … donc de se situer dans une fourchette d’analyse 40 <–> 125ms… c’est justement celle choisie par les fabricants de chaînes de mesure !
  • … et tout cela dans la mesure du possible d’une chaîne de mesure reliée à un PC et qui est limitée par son port USB ne pouvant transmettre des segments de plus rapides que 46ms !

On peut imaginer dans un futur pas si lointain la possibilité  de se rapprocher des préconisations de la norme IEC de 125ms, avec un port plus rapide, voire un système autonome (chaîne de mesure ayant une fréquence d’échantillonnage plus importante que 44100Hz, avec processeurs dédiés à l’analyse et tournant sous son propre OS). Allez savoir, il est bien possible que ce soit dans les cartons…

Mais pourquoi tout ce cirque avec une analyse précise de la dynamique ?

A des niveaux « normaux » (efforts vocaux moyens), la lecture précise de la dynamique du signal amplifié est réellement utile, car elle peut être détruite par une compression trop importante qui en lisserait les crêtes, mais, c’est moins connu, également par une amplification trop rapide et importante des vallées (réduction de la dynamique par le bas). C’est ce qu’avait montré Holube en 2007 (interview pour Audiology Online de l’initiatrice de l’ISTS) :

 

 

TA_TR rapides

Le graphique de gauche montre le signal amplifié par une aide auditive à temps d’attaque (TA) et temps de retour (TR) très rapides. Les vallées, dès qu’elles faiblissent, sont amplifiées très rapidement; les crêtes, dès qu’elles apparaissent sont lissées très rapidement également. Il en résulte une très nette diminution de la dynamique par rapport à un système plus lent (graphique de droite). Pour aller plus loin, vous pouvez également consulter ce document très intéressant (enfin, je trouve !).

Attention donc : sur quelques appareils, nous avons encore indirectement la main sur ces facteurs temporels, par le choix (obscur, j’adore !) de la « typologie du malentendant » et notamment un fameux choix « dynamique ». Les connaisseurs de ces fabricants reconnaitrons de qui je veux parler…

Juste pour vous montrer ce que devient le signal extrait d’un RSB 0dB, d’un appareil que j’avais testé précédemment sur ce blog, avant son amplification, puis après (émission à 65dBA, fenêtre d’analyse IEC 60118, de 125ms) :

Dyn ISTS in SNR0Dyn_voix extr SNR0

La dynamique est réduite après amplification, au maximum, d’environ 5dB. Il y a donc un respect de la dynamique du signal, même en milieu bruyant. Ce n’est pas toujours le cas… (des noms ! des noms !). Ce n’était pas du tout le cas il y a quelques années, et c’est là que les choses ont beaucoup évolué, il faut le reconnaître. Notez au passage l’amplification du signal @ 3kHz = 28dB.

Voilà ce que subit le bruit avant et après amplification par le même appareil, extrait du même mix à RSB 0dB :

Dyn ISTSnoise in SNR0

Dyn_bruit extr SNR0

Le bruit n’a pas de dynamique (c’est l’IFnoise), ce qui rend d’ailleurs « l’audition dans les vallées du bruit » très difficile; sa dynamique n’est donc pas affectée… puisqu’il n’en a pas. Notez au passage l’amplification du bruit @ 3kHz = 22dB, alors que les deux signaux ont été émis strictement au même niveau (RSB 0dB) et ont la même densité spectrale de niveau. Le signal est détecté, traité et amplifié de manière sélective (+6dB d’amplification par rapport au bruit).

Imaginons maintenant que la dynamique de sortie du signal n’ait pas été respectée (écrasée), cette différence d’amplification entre le signal et le bruit aurait été réduite à néant, car nous l’avons vu, la dynamique du signal avait déjà été réduite de 5dB par les compressions déjà « douces » (CR env. 1.2); une trop grande compression (protection) de la part de l’audioprothésiste aurait encore réduit cette dynamique, lui faisant perdre ses quelques dB d’émergence.

On le voit donc, la lecture de la dynamique du signal est extrêmement importante. Son respect par les algorithmes de traitement du signal est crucial. Pour info, la plupart des chaînes de mesure utilisent résolution temporelle de 46ms, mais en « overlapping », c’est à dire en faisant se chevaucher plusieurs blocs temporels à 50%, arrivent à 92ms de résolution temporelle, et donc se rapprochent des 125ms de l’idéal standard (j’en avais déjà parlé dans un billet traitant des diverses constantes de temps des chaînes de mesure in-vivo). Vous pouvez accédez à cette fonction dans le paramétrage de vos chaînes de mesure.

Tout cela montre bien la subtilité de toutes ces analyses, mais nous fait aussi prendre conscience (attention : psychologie magazine !) que nous voyons le monde, en général, à travers… une fenêtre !

###############################################

Atelier informatique

###############################################

Pour ceux qui seraient intéressés, cette analyse percentile du signal est réalisable avec une fonction (script) écrite pour le logiciel R.

Ce programme a été écrit par Nathan D. Merchant pour accompagner leur article sur l’acoustique des habitats écologiques. J’en ai modifié le code source afin de l’adapter à l’analyse percentile du signal au audioprothèse. Vous pouvez, si vous le souhaitez, en modifier également les bornes percentiles (ici j’ai défini 30, 50, 65, 95 et 99, dans le fichier Viewer.R). Vous trouverez le script de cette version modifiée ici. Téléchargez les fichiers PAMGuide.R et Viewer.R et mettez-les dans un dossier (votre bureau par exemple). Ouvrez R et définissez ce dossier comme répertoire de travail, puis tapez les commandes suivantes :

source("/votre dossier de destination/PAMGuide.R")

Vous pouvez aussi, sans taper cette commande, accéder au menu « Sourcer fichier » dans R et sélectionner « PAMGuide.R », puis taper :

PAMGuide(atype="TOL", plottype="Stats", lcut=200, Hcut=16000, N=5512.5)

Cette commande déclenche une boîte de dialogue vous demandant de choisir un fichier .wav pour analyse. Cette dernière est effectuée en 1/3 d’octave (TOL), en bande passante de 200 à 16000Hz, et avec fenêtre temporelle de 125ms (N=5512,5). Le paramètre temporel N est fonction de la fréquence d’échantillonnage du signal à analyser : si vous avez 44100Hz de f.e., N=44100 x 0,125 =5512,5. Pour un signal échantillonné à 96000Hz, avec fenêtre d’analyse de 46ms, N = 96000 x 0,046 = 4416. Dans le cas où vous souhaiteriez avoir les valeurs en dB SPL (comme ici) et non pas en dB relatifs, utilisez le paramètre « calib=1 », puis définissez la sensibilité en dB du paramètre Mh en fonction de votre calibration (ici, un fichier .wav de calibration à 94dB SPL a servi de référence pour définir précisément Mh).

Par exemple pour une analyse de l’ISTS (fichier son téléchargeable sur le site de l’EHIMA), en dB absolus (et RMS = 65dB SPL) et fenêtre temporelle de 1 sec. :

PAMGuide(atype="TOL", plottype="Stats", lcut=200, hcut=16000, N=44100, calib=1, Mh=-3.4)

Et pour finir, l’analyse standardisée IEC 60118-15 en audiologie/audioprothèse, pour l’ISTS :

PAMGuide(atype="TOL", plottype="Stats", lcut=200, hcut=16000, N=5512.5, calib=1, Mh=-3.4, winname="Hann", r=50)

… suite de la première partie.

En reprenant l’exemple suivant :

Capture

 

Environ 30dB SPL de bruit de fond (EINLevel) à 3KHz peuvent-ils être considérés comme gênants pour ce patient ?

On peut penser (mais je n’en ai pas la confirmation) que lorsqu’un fabricant met un modèle sur le marché, de surcroît s’il est censé pouvoir s’adapter sur des surdités légères à moyennes, il connait les limites de BDF acceptables issues de la littérature. Enfin, on espère…

Une solution radicale pour se garantir de toute perception de BDF serait de placer le 1er TK en entrée assez haut, mais pas trop quand même car il y aurait un risque de sous-amplifier les zones failles de la parole; disons 30/35dB SPL. C’est étrange, en explorant les courbes entrée/sortie (si par chance vous les avez), c’est justement la limite très commune d’expansion !

Un seul fabricant, depuis fort longtemps s’est quand même aventuré à passer sous cette barre : Widex, depuis le premier Senso. Mais quand vous voulez amplifier des niveaux très bas (5 à 30dB SPL) pour éventuellement les faire émerger au-dessus du seuil, il va falloir énormément de gain (si le larsen vous le permet). Et donc vous pouvez amener par la même occasion le bruit de fond en même temps que l’information dans la zone audible. Je crois me souvenir que tout avait été pensé chez ce fabricant pour maintenir le niveau du BDF toujours sous le meilleur seuil, notamment par la mesure du « sensogramme » qui était (est toujours) quasi obligatoire, comme celle du larsen. Très rapidement, l’effet d’évent (et pas uniquement son seul diamètre) a été également mesuré afin d’estimer la limite basse de TK sans larsen et/ou sans risque de BDF perceptible dans les BF.

Bref, pour passer sous la barre des 30dB SPL en entrée sans craindre une perception de BDF avec une méthodologie d’amplification non-linéaire, il vaut mieux avoir confiance en sa technologie…

Macrae et Dillon ont établi des niveaux de BDF acceptables en fonction du gain apporté (donc en fonction du seuil d’audition) à diverses fréquences, et mesuré dans un coupleur HA1 (intra). Pour donner quelques exemples (mais vous pouvez les retrouver sur l’article téléchargeable de la première partie) :

@1KHz, de 0 à 50dB de gain : env. 17,5dB SPL

@250Hz, de 0 à 45dB de gain : env. 37dB SPL

@2KHz, de 0 à 60dB de gain : env. 13dB SPL

Attention : il s’agit de bruit de fond à l’entrée, comme vu dans la première partie. On constate une gêne survenant plus rapidement après 1KHz. Etrangement, la « tolérance » au BDF semblerait importante dans les BF, mais ces zones fréquentielles sont souvent masquées (et le BDF avec) par le bruit ambiant, la « rumeur ». Et d’autant plus  l’appareillage présente un évent : le bruit ambiant entrant par l’évent minimise la perception du BDF de l’appareil.

Je vous passe les calculs éprouvants des auteurs, mais je reprendrais le résumé de leur méthode de calcul du EIN acceptable en fonction de la surdité : considérant un seuil à une fréquence donnée, ce seuil doit être corrigé avec NAL (et oui, c’est Dillon quand même !). Attention, ici, c’est NAL « old school » = formule linéaire d’avant NAL-NL1, c’est à dire NAL-R.

On a :

 EINL = Max( HTL + MAP – CG – Corr – 15,EINL0 )   (1)

Et là, oui, c’est beaucoup plus clair n’est-ce pas ?

En fait, NAL ne fournissant pas de cibles de niveaux de sortie en dB SPL au tympan (REAR), contrairement à DSL, Macrae et Dillon on converti la perte auditive (HTL), en niveau au tympan. Ils ont donc pour ceci ajouté au seuil HTL, le MAP (qui est le niveau d’audition minimal mesuré en dB SPL au niveau du tympan), ce qui a converti en quelque sorte le seuil HTL en seuil SPL au tympan. Mais comme la valeur du gain (CG) est donnée dans le coupleur d’intra (le HA1), ils ont ajouté une correction (Corr) pour passer du coupleur au tympan. Pour les puristes, cette valeur de correction provient de diverses tables de conversion toujours utilisées et très souvent citées dans la littérature : les valeurs de conversions (ou fonction de transfert) de Bentler & Pavlovic, et leur pendant en champ diffus. Aride… mais sachez quand même que ces valeurs se cachent encore dans tous nos logiciels de réglages et jusque dans nos chaînes de mesure (tables 1 & 2). Et enfin, la soustraction de l’EIN tolérable (EINL0) donnant 0dB SL (Sensation Level).

Vous retrouverez dans l’article (Table 6.) les valeurs de l’EIN max. acceptable, en fonction du seuil d’audition pour chaque bande de 1/3 d’octave.

Ce qui est intéressant, c’est de pouvoir saisir ces valeurs dans votre chaîne de mesure, comme ici pour un seuil de 0dB HL (ligne pleine) et un seuil, par exemple, de 50dB HL (carrés) :

Limites EIN

Par contre, il faut relativiser cette mesure, par l’apport de bruit de fond extérieur : performance du caisson de mesures (isolation) et BDF des transducteurs de mesure (microphones de mesure et de référence). Par exemple dans un caisson très performant, Bruël&Kjaer/Interacoustics TBS25 avec la config suivante:

20150306_173214

On obtient, au plus bas, cet EIN:

EIN TBS25 micros

Pour conclure, j’ouvrirais le débat sur les valeurs de Macrae et Dillon qui ont été obtenues à l’époque sur la base d’une formule linéaire (NAL-R). Il serait très intéressant d’avoir des valeurs aujourd’hui avec des formules de correction non-linéaires (NAL-NL et DSL) puisque les sons faibles sont nettement plus amplifiés qu’avec NAL-R, et que l’EIN risque donc potentiellement d’augmenter car le facteur CG de l’équation (1) augmente.

Avis aux étudiants de D.E. ou M1/2 en recherche de mémoire…

Les appareillages de surdités légères se multiplient ces dernières années (enfin, je trouve). Dans le même temps, je pense que nous ne sommes pas loin d’adapter quasiment 100% des aides auditives BTE/RIC/RITE avec deux micros, qu’ils soient utilisés dans leurs modes directionnels ou non.

La conjonction de ces deux faits augmente potentiellement le risque de perception de bruit de fond, notamment par un risque accru d’encrassement ou de panne du micro arrière, souvent plus exposé que le micro avant. Le circuit lui-même également génère un bruit de fond lors de son fonctionnement.

S’il est un sujet qui n’est pratiquement plus abordé par les fabricants, c’est bien celui du bruit de fond. On trouve en effet rarement ces données dans les fiches techniques aujourd’hui, alors qu’elles y figuraient encore systématiquement il y a… finalement longtemps ! (longtemps = + de 10ans en audiologie prothétique…). Et pourtant, l’importante amplification des circuits WDRC, voire FDRC actuels est susceptible d’amener ce bruit « brownien » électronique à un niveau perceptible, voire gênant.

Peut-on avoir une base quantitative fiable pour savoir si un bruit de fond se situe dans une limite tolérable ? Encore mieux : en fonction du seuil à chaque fréquence, comment déterminer si un bruit de fond risque d’être perceptible ?

Il est en effet difficile de savoir si 35dB SPL de bruit de fond est un niveau tolérable par un patient. Et même pour un audioprothésiste qui écoute (« L’Art perdu de l’écoute des aides auditives », repris de A. Rosette 😉 ), ou qui mesure ce BDF, où fixer la limite acceptable de qualité des composants électroniques à partir de cette mesure (ou de cette écoute) ?

Une mesure de BDF la plus utilisée en audioprothèse est la mesure du Bruit Equivalent en Entrée, ou en bon anglais « Equivalent Input Noise » ou EIN. La définition de ce terme m’a toujours parue « perchée », mais à la réflexion, elle est robuste (donc c’est moi qui ne suis pas assez perché) :

EIN = Bruit Equivalent  à l’Entrée :

  1. On suppose (c’est fictif) une aide auditive qui ne présenterait aucun BDF, avec un réglage équivalent (gain/fréquence) à celle (réelle) que l’on veut tester
  2. EIN = quantité de bruit qu’il faudrait envoyer à l’entrée de l’aide auditive fictive sans bruit pour avoir le même niveau de sortie (qui comprend l’amplification ET le bruit de fond mélangés) que l’aide auditive testée

Bref, trêve de bavardages, une bonne formule « et pi c’est tout ! » :

BDF dans le silence – Gain max. = EIN

Pourquoi faire intervenir une « aide fictive silencieuse » et donc exprimer le bruit « à l’entrée » plutôt qu’à « la sortie » ? Macrae & Dillon (2001) voient plusieurs intérêts à cela :

  • dans la plupart des aides auditives de bonne qualité de conception (pas les trucs faits en Chine et vendus en pharmacies), le BDF vient en majorité des micros, et le reste, du circuit
  • le BDF s’il était exprimé à la sortie, varierait en fonction de la position du potentiomètre (s’il y en a un); ce n’est pas la cas quand le BDF est exprimé en entrée
  • si le bruit était exprimé en sortie, les aides auditives à faible gain auraient toujours moins de BDF que les aides auditives à gain important

Ce qui veut dire :

  • que tester le BDF en entrée pour des appareils avec un potentiomètre (ou un réglage de gain) permet de s’affranchir du problème de l’augmentation de BDF avec l’augmentation du gain : en effet, si le BDF était testé en sortie, plus le gain serait élevé, plus le BDF le serait aussi. Le fait de retrancher le gain du BDF dans le silence permet de décorréler le BDF du niveau de l’amplification.
  • de même pour les appareils très puissants : s’ils étaient testés en sortie, leur amplification très importante (y compris dans un caisson de mesure très silencieux, mais jamais totalement silencieux) ferait croire à un bruit de fond très important. Le fait de le mesurer en entrée (donc de déduire le gain max.) permet de pouvoir comparer le BDF en entrée d’un « petit » appareil open et d’un surpuissant.

Donc en quelque sorte, la mesure de l’EIN « relativise » le bruit de fond par la soustraction du gain…

Pour calculer l’EIN, la chaîne de mesure va faire deux mesures successives dans chaque bande de tiers d’octave :

  1.  première passe : mesure du gain, en général à bas niveau d’entrée (40/50dB SPL par exemple) pour chaque bande de 1/3 d’octave
  2. deuxième passe : mesure du BDF dans chaque bande de 1/3 d’octave. Donc là, c’est le silence (relatif) dans le caisson, d’où l’intérêt d’avoir un bon caisson de mesures

Et donc ensuite, 2 – 1 = EIN. C’est la courbe bleue que vous voyez sur cette mesure :

Capture

Bon, maintenant que l’on a cette mesure d’un bruit de fond équivalent en entrée, qui est ici comprise entre 20 et 35dB, qu’en faire ? Bien ou pas bien dans ce cas ? Audible par le patient ou inaudible ? Mieux : potentiellement gênant ou non ?

La suite au prochain épisode….

~Entracte~

~Chocolats glacés, Eskimos, cacahuètes, Treets, …~

Un peu pour information, un peu pour une question, voici le résultat de mesures audiométriques (tonale/vocale) et acoustiques sur un patient présentant une cavité d’évidement et des cryptes à droite.

Séquelles de coups dans l’enfance… OD et OG opérées à de multiples reprises (7 fois en tout).

L’audiométrie tonale (merci les inserts: pas de masking nécessaire même sur ces seuils, en tonale):

CA

La nature étant bien faite, ce patient réussit quand même (OG masquée) à obtenir ce score en listes cochléaires de LAFON:

Voc

Les mesures acoustiques des CAE mettent en évidence des valeurs totalement atypiques à droite, liées à l’évidement (longueur et volume hors norme).

La mesure oreille nue (REUG):

REUG

On a à droite un pic à 1600Hz, ce qui donne une approximation de longueur de conduit de (340000/1600)/4 = 53,1mm !!!

5 cm de conduit, ou plutôt de cavité(s)…

La mesure RECD:

RECD

Le coupleur fait 2cc. Un RECD HA1 « standard » (courbe bleue en pointillés) est à environ 12dB à 4KHz, ce qui fait une différence de volume de facteur 4 entre le coupleur et le conduit auditif bouché par la mousse (volume conduit 4 fois plus petit que le volume coupleur, soit 0,5/0,6cc, valeurs admises chez l’adulte).

Ici à droite, le RECD est d’environ -6dB, voire moins encore, ce qui signifie que le volume résiduel (résiduel, façon de parler !) du « conduit » ou de ce qu’il en reste est 2 fois plus important que le volume coupleur, donc entre 4 et 5cc, dû aux 3 cryptes que j’ai pu y voir.

Il est évident que si un appareillage était nécessaire à droite (ce que je ne ferai pas), toute approximation statistique logicielle serait totalement à la rue.

Je conclurai par une question simple : en sachant qu’il n’est pas recommandé de fermer l’oreille gauche, toujours plus ou moins humide et que ce patient a perdu depuis bien longtemps la localisation spatiale, appareilleriez-vous cette oreille gauche, de 2K à 3KHz, et qui présente 90% d’intelligibilité à 40dB HL ?

That is the question…

La mesure in vivo est souvent vue comme une mesure du spectre à long terme d’un signal après son amplification par l’appareil auditif. Donc une mesure spectrale.

Les cibles de gain ou de niveau de sortie nous donnent des indications afin, dans chaque bande de tiers d’octave, de fournir tel ou tel gain ou niveau de sortie.

Mais si un bruit blanc ou rose est constant dans le temps (que son spectre soit mesuré sur 1 ou 30″, il est le même), cela fait bien longtemps que l’on ne teste plus les appareils avec ce genre de signal. Aujourd’hui, le signal de test le plus utilisé est l’ISTS, au caisson ou in vivo. Ce signal est un signal de parole, très fluctuant dans le temps et dont le spectre dans les premières secondes n’est pas forcément représentatif du spectre à long terme (sur 1 minute par exemple) :

istsLorsque l’on regarde ce signal, plusieurs interrogations :

  • Combien de temps mesurer ? la minute complète du signal ou 5 secondes ?
  • Comment avoir une idée de la répartition de l’énergie dans le temps ? (en clair, est-il possible d’avoir une représentation temporelle et non spectrale du signal)
  • Doit-on faire la mesure sur la moyenne des derniers événements acoustiques qui se sont passés dans la seconde ? Des 5 dernières secondes ? Plus ?

 

  • La mesure du spectre à « long » terme :

En mesure in-vivo du niveau de sortie appareillé (REAR) la cible (DSL ou NAL) correspond au spectre moyenné sur le long terme. Mais « long terme » combien ? Si vous mettez « 1 seconde », le spectre va changer en permanence en fonction de la composition fréquentielle au cours du temps, et si vous mettez « 30 secondes » votre courbe sera certes être très stable, mais après un changement de réglage pendant la mesure, il vous faudra 30 secondes pour en voir l’effet…

L’astuce consiste alors à effectuer une moyenne glissante : la mesure se fait en continu (case « Mesure continue » cochée), mais, par exemple ici, seuls les événements des 8 dernières secondes comptent dans la moyenne (« Temps de mesure 8s. » + « Mesure continue » = temps d’intégration (moyenne) glissant(e) sur 8 secondes) :

RéglagesREAR65

  • Combien de temps mesurer :

Là, ce n’est pas paramétrable, ou alors il faut définir le paramètre « Temps de mesure » et décocher « Mesure continue » : la mesure s’arrêtera quand le temps sera atteint. Dans ce cas, le spectre à long terme serait intégré sur 8 secondes puis la mesure s’arrêterait.

Une autre solution consiste à laisser le signal tourner en boucle avec « Mesure continue », et à arrêter ni trop tôt ni trop… quoi ? J’en avais déjà parlé : il est important de laisser la mesure en niveau de sortie appareillé (REAR) se faire au moins 18 secondes, et laisser passer le phonème /ch/ présent dans l’ISTS et qui fait littéralement exploser le niveau de sortie à 2/4KHz avec certains appareils dont le premier TK dans la zone 2/4kHz est un peu trop haut; il est présent vers 12/15 secondes.

En conséquence, une mesure sur 15 à 20 secondes semble bien et permet de modifier un ou deux réglages et d’avoir le temps d’en visualiser l’effet (8 secondes après dans l’illustration ci-dessus). Le temps de mesure se fait au jugé par l’audioprothésiste, et en général, on peut se fixer un repère d’arrêt, par exemple vers ce qui ressemble à « poderos » dans l’ISTS (env. 18 secondes).

AN: bien sûr, en mesure de gain d’insertion, le temps n’est pas aussi important puisqu’en général le REIG est le même au cours du temps (à 1 ou 2dB près). Les premières secondes de la mesure donnent la « bonne » mesure. Compter donc 5 à 10 secondes de mesure en REIG pour laisser à l’appareil le temps de se stabiliser.

  • Analyse temporelle « de base » = min/max :

Jusqu’à maintenant c’est du spectral (niveau/fréquence), mais la chaîne de mesure peut analyser, dans le temps et dans chaque tiers d’octave, les événements les plus forts (les crêtes du signal, niveaux dépassés seulement 1% du temps) et de plus faibles intensités (les vallées du signal, niveaux dépassés 70% du temps).

Case à cocher: « Afficher min. -max », sans cocher aucune des autres cases (très important). Vous obtiendrez alors la dynamique du signal de parole (à environ +12/-18dB du spectre à long terme). Cette dynamique n’est pas calculée avec la même moyenne que « Temps de mesure » (ici les 8 dernières secondes du signal mesuré en sortie), mais elle a sa propre constante de mesure, qui est d’environ 5 secondes. Donc vous pouvez avoir une constante de mesure pour le spectre à long terme, alors que les événements « min/max » (vallées/crêtes) ont leur propre constante de temps de 4,6 secondes. Pourquoi 4,6 secondes ? parce que la fenêtre temporelle d’analyse est de 23ms, mais que le câble USB ne pouvant pas transporter autant d’informations, deux blocs d’analyse de 23ms sont moyennés, ce qui donne une fenêtre globale de 46ms (information reprise brute d’Interacoustics). Et comme il faut faire au minimum 100 mesures pour faire une analyse percentile a minima, on a donc 100*46ms= environ 4,6 secondes, temps minimal d’intégration.

Cet affichage vous donne la dynamique du signal avec une résolution fréquentielle de 43Hz.

  • Analyse temporelle « renforcée » :

Au lieu de cocher « Afficher min. _max », qui correspond à des valeurs « percentile 30<–>percentile 99 », vous souhaitez définir vous même l’analyse percentile du signal. Vous allez donc cocher et définir les zones qui vous intéressent dans « Analyse percentile ». En passant, si vous cochez 30% et 99%, ça revient au même que «  »Afficher min. _max »…

Donc à réserver à ceux d’entre nous qui veulent plus… pointu, genre analyse du 39ème percentile !

Cette analyse se fait sur les mêmes constantes que « min/max. »= 4,6 secondes, quelle que soit la constante de temps utilisée pour l’intégration du LTASS, et pour les mêmes raisons citées précédemment.

 

  • Analyse percentile « idéale » (normalisée IEC 60118-15) :

Toutes les chaînes de mesure analysent le signal par fenêtres temporelles successives. La fenêtre temporelle est fonction de la fréquence d’échantillonnage du signal, et du nombre de FFT chaque secondes. Par exemple, en échantillonnant à 44100Hz avec 1024 échantillons (FFT), on obtient une résolution temporelle de 1024/44100=23ms. C’est le cas de l’Affinity qui peut réaliser une analyse toutes les 23ms, mais dont le port USB limite en réalité la vitesse à 46ms. Deux blocs de 23ms sont donc « moyennés » afin de pouvoir être transmis par la connexion USB. Comme son nom ne l’indique pas vraiment, l’analyse percentile analyse le signal dans le temps (ce n’est plus du spectral) afin d’en donner la répartition des différents niveaux en pourcentage, par tranches de 1%.

Après une analyse percentile en règle, la chaîne de mesure sera capable de vous dire que 37% du temps, le signal a dépassé telle valeur; que 2% du temps il a dépassé telle valeur, etc.

Donc, pour faire une analyse percentile correcte, il faut faire 100 mesures, au minimum. C’est ce à quoi correspond la case à cocher « Centiles pour mesure complète ». Certes, vous le remarquerez, la chaîne de mesure affichera bien la dynamique du signal sous forme de petits rectangles dans chaque bande de tiers d’octave (voir graphique ci-dessous pour analyse percentile 30/99) avant d’avoir atteint 18 secondes, mais cette analyse percentile ne sera complète (et donc fiable) qu’à partir de 46 secondes, car 100 perceptibles x 10 échantillons de chaque x une fenêtre temporelle de 46ms = 46 secondes (les crêtes et vallées se figent alors progressivement au cours de la mesure):

REAR65

Ce qui implique que si vous décidez de cocher cette option (recommandée…), vous avez alors deux constantes de temps en jeu: le spectre à long terme qui évolue ici dans une fenêtre glissante de 8 seconde, et l’analyse percentile qui elle, évolue dans un autre espace-temps (Igor et Grichka BOGDANOV, sortez de ce corps !!!!!), de 15 à 46 secondes. Vous l’avez peut être expérimenté: vos changements de réglages se voyaient relativement vite sur le LTASS, mais très lentement sur les crêtes/vallées en cochant « Centiles pour mesure complète » ou « Régler les paramètres sur IEC 60118-15 ». Mais peut être n’aviez-vous pas osé…

AN: sans cocher cette option, il ne sera pas possible de cocher et donc d’obtenir la valeur suivante « Ratio de compression de la dynamique vocale ».

A l’écran, la zone dynamique donne progressivement la sensation de se « figer » au fur et à mesure que le test progresse. Une modification de réglage ne se visualisera alors quasiment pas sur la dynamique (à moins de refaire une mesure) alors qu’elle se visualise plus rapidement sur le spectre à long terme.

***Astuce quand même : vous pouvez relancer la moyenne glissante sans relancer la mesure en cliquant pendant le test sur « l’ascenseur de niveau » (sous 65dB) à la droite du graphique !!!***

  • 1/3 octave and overlapping time windows:

Paramètre modifiant la zone temporelle d’analyse, en l’élargissant sur une fenêtre de 92ms, ce qui se rapproche de la norme de mesure IEC 60118-15. Cette norme définit les paramètres de mesure permettant une analyse percentile standardisée, mais également, pour ce qui suit, le calcul du ratio de compression de la dynamique vocale. Surtout, elle définit une fenêtre temporelle de 125ms, qui en l’état technique actuel, est très difficilement atteignable à un coût raisonnable avec nos chaînes de mesure, si on veut conserver une fréquence d’échantillonnage de 44100Hz. En effet, pour obtenir une résolution fréquentielle de 125ms, il faudrait recueillir 0,125ms x 44100Hz = 5512,5 échantillons.

L’overlapping consiste à effectuer un chevauchement de plusieurs fenêtres temporelles afin de se rapprocher au plus près de la fenêtre idéale normalisée de 125ms. Si on raisonne par blocs temporels de 46ms, deux blocs successifs forment bien un  bloc de 92ms, mais entre deux FFT, le convertisseur est « aveugle ». Le chevauchement (« overlapping ») consiste donc à appliquer un fenêtrage temporel de manière à ce que deux blocs temporels successifs se chevauchent de 50%. On ne perd donc pas d’informations comme avec deux blocs successifs.

Vous trouverez des informations sur ces points dans ce document de travail qui a précédé la norme IEC 60118-15.

Cet affichage vous donne la dynamique du signal avec une résolution fréquentielle d’un tiers d’octave (bandes d’analyse de 43Hz à l’origine, mais pondérées par calcul en 1/3 d’octaves).

  • Ratio de compression de la dynamique vocale:

Ca c’est encore une autre histoire et je vous en avais déjà parlé.

Il s’agit de la case à cocher « Show dynamic compression ratio » qui vous donne dans chaque tiers d’octave la compression de la dynamique vocale entre l’entrée et la sortie sous forme de chiffres de 0.xx à plus de 2 (mais rarement plus de 2 quand même). Ce calcul n’est pas possible sans avoir modifié la fenêtre temporelle d’analyse à 92ms par le paramètre « 1/3 octave and overlapping time window ».

Afin de pouvoir mesurer le ratio de compression du signal à la sortie par rapport au signal à l’entrée, il va falloir que la chaîne de mesure les aligne temporellement de façon très précise (précision du décalage inférieure à 10ms), afin d’être sûr que l’on compare bien les même échantillons temporels:

T_shift_speech_signalSans cet alignement, les mêmes zones temporelles (et donc spectrales) ne seraient pas analysées avant/après, ne permettant pas un calcul fiable du ratio de compression de la dynamique vocale.

AN: ce calcul de ratio nécessitant de connaître le signal à l’entrée pour le comparer au signal de sortie (d’où l’alignement des deux signaux), la chaîne de mesure crée alors un fichier .spectra avant la mesure. Il n’est donc pas possible d’effectuer ce calcul « à la volée », c’est à dire en live avec le Visible Speech.

Cet alignement est absolument nécessaire également au calcul du gain.

Pour aller plus loin dans la compréhension de ces analyseurs spectraux et temporels que sont nos chaînes de mesure, je vous conseille la lecture de ce document passionnant in french dans le texte pour une fois (merci Franck 😉 ).

 

Bons paramétrages !

Et bon WE à tous !!

Merci à Dennis Mistry (Interacoustics) pour ses explications.

J’avais déjà évoqué la possibilité sur Affinity d’activer le microphone de référence opposé à la mesure in-vivo, et de l’intérêt de cette technique de mesure dans l’évaluation de l’ombre de la tête et de sa compensation par un système CROS.

Voici un cas clinique de validation de la mesure avec un patient appareillé dans un premier temps avec un Widex DREAM Fusion 330 à gauche, et cophose à droite:

Aud_CROS

Ce monsieur, très actif dans sa commune, participe à de nombreuses réunions et autres joyeuses activités associatives à base de canard gras dont Les Landes ont le secret…

Bref, sans surprise, il n’entend pas son voisin de droite, et ça l’embête bien. Donc une adaptation est programmée pour l’essai d’un système CROS Widex, qui en l’occurrence dans ce cas est un système BiCROS puisque son côté « bon » nécessite un appareillage.

La mise en évidence de l’ombre de la tête et le réglage de la balance microphonique se fait en trois étapes:

  1. Mesure in-vivo de la bonne oreille (Cas du CROS) ou de l’oreille appareillée (cas du BiCROS) avec HP à 90° (pile face à l’oreille)
  2. On laisse la sonde dans l’oreille et on fait tourner le patient de manière à présenter son oreille cophotique face au HP (mesure à 270°), MAIS on active le micro de référence opposé à la mesure =  mesure in-vivo oreille OK, mais micro de référence activé oreille cophotique –> on obtient l’ombre de la tête.
  3. Même mesure que 2 (toujours avec micro de référence activé à l’opposé de la mesure in-vivo), mais on place et on active le système CROS: si tout va bien on doit revenir à la mesure 1, sinon on ajuste le niveau de transmission dans le logiciel Compass GPS (ou Target 😉 ).

Démonstration pour ce patient:

REM_shadow

La partie colorée en jaune correspond pour ce patient à l’ombre de la tête.

On active le micro:

CROS_REM

La courbe bleue montre la captation de la bonne oreille/de l’oreille appareillée lorsque le son arrive du côté cophotique : l’ombre de la tête a été compensée.

Eventuellement, la balance microphonique permettra d’ajuster le niveau de la courbe bleue, jusqu’à coller à la noire:

CROX Dex

CQFD. Il restera à savoir si le patient en tire un bénéfice dans sa vie sociale.

Donc en résumé:

  • ça semble fonctionner et c’est un des rares moyens de mesurer cet « effet ombre »
  • ça permet d’ajuster la sensibilité du micro CROS avec précision et en connaissance de cause
  • permet de démontrer au patient le problème et la solution proposée…
  • attention aux appareils adaptatifs dans le cas du BiCROS, qui ont tendance, à l’opposé du HP, à augmenter l’amplification et donc à « gommer » l’ombre de la tête

Vous trouverez sous ce lien le fichier .iax pour Affinity permettant cette mesure. Attention: l’activation du micro de réf. opposé (en orange sur les copies d’écran) est à faire manuellement pour les étapes 2 et 3.

Mesures et création du test: Xavier DELERCE et Gilles ASSOULANT.

 

* The Pink CROS …

En audioprothèse, nous nous sommes longtemps contentés d’un affichage en « 2D », c’est à dire Gain/Fréquence ou Niveau de sortie/fréquence.

Exemple classique:

noeud 6K

Les spécialistes reconnaitront le type de mesure… et son erreur !

Ces représentations graphiques étaient valables pour des signaux stables en intensité à une fréquence donnée, c.à.d. ne fluctuant pas au cours du temps. Mais intégrer la « troisième dimension », le temps, ne rendrait pas les choses très faciles non plus; nous aurions accès aux variations temporelles, en perdant les informations spectrales (ici le famous fabricant 1…):

AC9_ISTS_OVG_RSB0_temporal domain

L’utilisation de la parole comme signal de test, fluctuant en intensité, change la donne. Pour s’en convaincre, la mesure du premier graphique à été réalisée avec un signal de parole (l’ISTS). Ce signal, normalisé, présente des fluctuations d’intensité de plus de 30dB. La mesure du graphique ci-dessus également avec le même signal. Nous avons donc deux représentations différentes qui présentent toutes deux des informations intéressantes, mais chacune incomplète.

Comment concilier spectral et temporel en quelque sorte ? Comment obtenir la classique représentation spectrale mais en intégrant le traitement des fluctuations d’intensité par l’aide auditive ?

Les fabricants de matériel de mesure nous apportent aujourd’hui des réponses à ce problème.

En reprenant le premier graphique: la mesure de l’amplification (en gain) par l’oreille nue donnera un gain identique (le REUG) quelle que soit l’intensité de la voix « normale ». La voix « moyenne » (prenons 65dB SPL) peut fluctuer entre 40 et 65dB SPL à 2KHz:

Capture2

L’ensemble Torse/Tête/Pavillon/Conduit présente une amplification linéaire pour les niveaux d’entrée, c’est à dire que les niveaux faibles (vallées) et plus forts (crêtes) sont autant amplifiés les uns que les autres. Donc toujours dans cet exemple à 2KHz, la dynamique d’entrée du signal est de 25dB, en fond de conduit on retrouve bien la même dynamique, on peut considérer que l’on a un facteur de compression de 1.0 (amplitude du signal d’origine = amplitude en fond de conduit).

Dans quel cas aurions-nous une altération ? lors du passage dans une aide auditive, typiquement.

Imaginons une aide auditive dont un point de compression serait à 30dB SPL et un second à 55dB SPL, linéaire de 30 à 55dB SPL et de facteur de compression 1.3 de 55 à 75dB SPL par exemple, lorsque que l’on utilise des systèmes capables de vous donner le gain pour des régions spécifiques en intensités (les percentiles d’intensité), on obtient non pas la première courbe, mais celle-ci (attention ça pique !):

ISTS Gain Fonix

Difficile à croire, mais cette mesure de gain est faite avec le même signal que le premier graphique (l’ISTS), mais passé par une aide auditive, puis analyse séparée pour chaque percentile d’intensité.

La courbe verte est le « LTASS », niveau à long terme moyenné sur le temps de mesure (20 sec. ici). Cette courbe verte correspond à la courbe rouge du premier et du troisième graphique.

La courbe jaune correspond à l’amplification des 30èmes percentiles, c’est à dire en gros, des niveaux environ 18dB moins élevés que le niveau moyen (le LTASS), ou autrement, des niveaux dépassés 70% du temps, que l’on nomme habituellement « les vallées » de la parole.

La courbe bleue correspond à l’amplification des percentiles 99 d’énergie, les niveaux les plus élevés de la voix moyenne, ses crêtes, les niveaux atteints et dépassés 1% du temps.

Que constate t-on: que les vallées de la parole sont plus amplifiées que ses niveaux moyens (en rouge et en vert) que ses crêtes. Si on considère la parole « non-traitée » (comme les oranges après récolte…) comme ayant une dynamique standardisée de 30dB à laquelle on attribue un facteur 1.0 de compression (non comprimée donc), dans ce cas mesuré ici par la chaîne de mesure, les « vallées » ont été remontées et les crêtes, lissées. Sa dynamique de sortie est donc réduite (ce qui est quand même bien dommage pour de la voix moyenne) et donc à la louche elle subit une compression de 1.3 jusqu’à 2KHz dans l’exemple mesuré par la Fonix ci-dessus.

En connaissant donc le gain appliqué à chaque tranche de percentiles d’énergie, vous pouvez alors avoir une action sur une zone de compression bien définie:

  • l’expansion et son mystérieux et jamais renseigné point d’enclenchement…
  • la première compression en entrée (premier TK) qui peut être trop haut (vallées échappant à l’amplification) ou trop bas (plus rare) comme l’exemple ci-dessus
  • la seconde compression au TK mal placé (quasiment pas réglable) ou tranche trop comprimée (percentiles 65 à 99 trop comprimés)
  • Un AGCo trop bas et qui lisse tout

Beaucoup de chaînes de mesure vont aujourd’hui vous donner ces renseignements soit sous la forme d’un gain appliqué à chaque niveau (la Fonix ci-dessus), soit sous la forme d’un taux de compression:

Capture

Ce taux varie de zéro et quelques (rarement sous 0.8) si les niveaux bas ne sont pas assez amplifiés (le plus souvent) à plus de 1 (rarement plus de 1.8) si les niveaux de crête ou les niveau moyens (percentiles 65) sont réduits par la compression ou un système de compression en sortie très agressif et très (trop ?) bas.

Il est très hasardeux de comparer ces taux compression de dynamique aux taux de compressions affichés dans les logiciels de réglage, bien qu’il y ait évidemment un rapport. Sachez cependant qu’il ne serait pas franchement normal de trop comprimer la dynamique de la voix moyenne.

On est donc passé en quelques années d’un affichage en « 2D » (gain ou niveaux de sortie moyen/Fréquence) à un « presque 3D » dans le sens où les systèmes de mesure nous donnent une indication sur la façon dont le signal a été traité au cours du temps, dans ses fluctuations.

Une petite gymnastique de lecture et d’interprétation, mais au final, beaucoup plus d’informations à disposition et d’actions possibles sur les réglages.

Une dernière chose: bonne année 2014 à tous !

Bienvenu

Bienvenu chez Blog-Audioprothesiste.fr !

Qui Sommes nous ?

Contactez nous !

Je contacte Sébastien
Je contacte Xavier
Je contacte Jean Michel