Qui sommes nous ?

Nous sommes un collectif d'audioprothésistes, depuis 2006, qui cherchent à améliorer l'image et la diffusion de connaissances techniques à destination des audioprothésistes ! L'exercice nous permet de commenter et également d'améliorer nos connaissances. Il faut bien le dire ce blog bouillonne de bonnes idées !!!! Si toi aussi tu as envie de partager ton expérience ! Alors rejoins nous !

Archives de l’auteur

3 – Le Saint Graal de l’audioprothèse : mesurer le RSB en sortie d’aide auditive – Test 2

Suite du premier et second billet. Second test après celui ci.

Deuxième candidat : BERNAFON JUNA 9 CP. Couleur beige… mais ça, bon…

Il s’agit d’un contour d’oreille pile 13, successeur de l’ACRIVA 9, appareil que je trouvait assez difficile à mesurer en in-vivo car ultra-réactif au « chirp » de pré-calibration. Les appareils de la marque peuvent paraître entourés d’un certain mystère quant à leur fonctionnement « sans canaux » (en Schwyzerdütsch on dit « Channel Free »). Si vous avez la patience d’attaquer un bouquin pareil, leur anatomie est un peu dévoilée par leur créateur, Arthur Schaub, dans Digital Hearing Aids. L’Acriva était réputé pour un réducteur de bruit très très efficace, mais une pointe d’agressivité aux bruits impulsionnels. Son successeur le JUNA propose désormais deux modes de détection de la parole dans le bruit, basés soit sur la structure fine, soit sur l’enveloppe (mode testé ici) qui est, selon le fabricant, moins générateur d’inconfort pour les personnes les plus sensibles à des transitoires « explosifs ». Appareil testé sur un pré-réglage avec méthodologie propriétaire (Bernafit NL), base audiogramme KS100, réducteur de bruit au max (mais pas « ultra confort ») et microphone directionnel fixe, et priorité « parole dans le bruit » + « enveloppe ». Ouf !

Les résultats « visuels » à RSB -10dB :

JUNA9_RBmax_MicDir_env_Beyer Il ne faut que 3 à 4 secondes au RB pour intervenir (zone entourée noire). Rappelons que dans cette configuration, la parole (ISTS) est envoyée à 65dBA (Leq sur 30sec.) et le bruit (IFNoise) est à 75dBA (idem). Ce qui frappe, c’est la conservation, voire même le réhaussement, des crêtes du signal : les 8.5 premières secondes (ISTS seul) n’atteignent pas 0.5 d’amplitude relative puis l’apparition du bruit « efface » totalement les crêtes jusqu’à ce que le RB s’enclenche totalement; les crêtes ré-apparaissent, nettement plus amplifiées qu’au début de la mesure.

On écoute ?

Contrairement à l’appareil testé précédemment (le STARKEY), on sent moins le réducteur de bruit, mais le signal vocal semble (c’est une sensation) plus audible. Quand même pour comparaison, voici ce qui se passe en cabine en même temps, capté par le micro de référence : Qui a dit qu’en 2015 un appareil auditif ne fonctionne pas dans le bruit ? Il faudra penser un jour à arrêter le « Hearing Aid Bashing« , accepter un minimum de payer une recherche qui aboutit à ces résultats…

Des chiffres :

JUNA9_env_beyer Cela confirme l’écoute : quand le Starkey diminuait le signal vocal de plus de 7dB avec l’augmentation du bruit, le JUNA 9 le diminue très peu (env. 3dB de G3 à G7), et ce, quel que soit le niveau du RSB. On est donc en présence plus d’un « extracteur » de parole que d’un « réducteur de bruit ». Lorsque l’on regarde les enregistrements, on constate assez nettement ce renforcement du contraste temporel (réhaussement des pics de la parole). Bernafon communique depuis des années sur cette technologie, qui semble donc effective. Voici, pour s’en convaincre, l’enregistrement fait en parallèle par le micro de référence, celui en écoute plus haut (à RSB -10dB) : 5_DPA_ref_JUNA9_env_beyer_SNRm10_Aligned_Signals … difficile de distinguer la parole dans ce « magma » de bruit…   Et au même RSB, l’enregistrement du JUNA : 5_JUNA9_env_beyer_SNRm10_Aligned_Signals … les crêtes ré-apparaissent. Merci le micro directionnel (mais on a vu que ce n’était pas suffisant avec des modèles d’il y a plusieurs années) et surtout merci les algorithmes ! AN : Les deux enregistrements plus haut sont les signaux « SpN » des graphiques ci-dessus.

Voici sa progression :

JUNA9 L’amélioration du RSB est constante dans cette configuration de réglages, d’environ +6.7dB en moyenne, quel que soit le RSB en entrée.

Emergence du message

Voici l’émergence du signal par rapport au bruit, calculé sur 30sec. (merci Franck) sans passer par l’appareil (capté par le micro de référence), à RSB 0dB : SII_DPA_ref_JUNA9_RSB0dB Et avec l’appareil : SII_JUNA9_RSB0dB On obtient bien une émergence améliorée de 15% du signal par rapport au bruit.  

Conclusion(s)

On le voit, deux marques, deux stratégies totalement différentes. La première (STARKEY) est axée sur le confort (avec tout de même 5dB d’amélioration constante du RSB), quand BERNAFON avec le JUNA recherche une extraction constante de la parole, que que soit le RSB en apportant quasiment 7dB d’amélioration du RSB. Deux fonctionnements très différents, deux typologies de clientèles ? On finira par entendre mieux dans le bruit avec un appareil auditif que sans ! Quels progrès depuis 5 à 10ans, ne boudons pas notre plaisir.   Formule d’usage : l’auteur ne signale aucun lien d’intérêt avec le fabricant testé. N’y voyez aucune malice, ne déduisez rien d’absolu au vu des seuls résultats. L’appareillage auditif est une alchimie entre l’audioprothésiste, son patient et la technologie la plus appropriée qu’ils choisissent en commun.   Où s’arrêteront les fabricants ? jusqu’où vont les performances actuelles ? Vous le saurez (peut-être) dans une troisième et dernier épisode fin septembre…   Allez, zou ! en vacances !! Vous lisez trop le blog 😉

3 – Le Saint Graal de l’audioprothèse : mesurer le RSB en sortie d’aide auditive – Test 1

Suite du premier et second billet.

Premier candidat : STARKEY Z Series i110, BTE pile 13.

Pourquoi ? parce qu’il s’agit de tester un « saut technologique » puisque à ma connaissance, ce fabricant était encore le seul à utiliser sur ses générations précédentes un microphone directionnel simple à deux entrées; technologie désormais obsolète, car réellement plus performante (potentiellement) en utilisant deux micros séparés. C’est donc le cas avec le Z Series testé ici qui inaugure une technologie microphonique « MEMS », supérieure à la précédente selon le fabricant, et mise sur le marché par Knowles en 2002 dans ses premières versions. L’appareil est ici testé en version directionnelle fixe (pour les raisons citées dans les posts précédents) avec le réducteur de bruit mis à -15dB (préconisé par le logiciel).

Voici par exemple la sortie à RSB -5dB et l’action dans le temps du réducteur de bruit :

Z110_RSB-5 Il a fallu environ 15 secondes au réducteur de bruit pour atteindre sa réduction maximale après l’apparition du bruit (zone entourée en noir). Le voir c’est bien, l’entendre c’est encore mieux…

Voici la mesure en question (ré-échantillonnage en 16bits@44.1kHz pour gagner en taille ici) :

Quel ressenti ? Le réducteur de bruit est efficace, et rend la scène sonore confortable. On sent quand même une nette diminution du signal « utile » (l’ISTS) dans le temps avec une sonorité un poil artificielle.

Comment quantifier ces résultats ?

Z110_data La colonne G3<–>G7 donne le niveau relatif de la parole de RSB +10 à RSB -10dB. De +10 à 0dB le niveau de la parole (ISTS) est relativement stable (-27dB environ). Dès que le bruit va dominer, le niveau du signal utile va décroitre progressivement, « emporté » par le réducteur de bruit (pas par la compression, insuffisante pour justifier cette baisse). Le bruit, lui, augmente de 20dB entre H3 et H7 dans le champ libre, l’appareil le maintiendra à 14dB de variation. L’amélioration du RSB est constante, d’environ +5dB dans cette configuration de réglages, quel que soit le RSB en entrée, mais encore une fois, la patient perd 7dB de signal utile lorsque le bruit augmente de 20dB. C’est donc potentiellement plus confortable qu’efficace. Mais qui resterait dans une ambiance à RSB -10dB ??? Il faut certainement relativiser la notion de test dans le bruit. Un individu « normal » fuira une ambiance sonore dès qu’elle sera inférieure à RSB 0dB, et la majeure partie de la vie sociale « normale » se situe aux alentours de +20 à 0dB de RSB. C’est là que nous devons attendre les meilleurs résultats possibles des aides auditives. Au-delà, on peut effectivement s’attendre à ce que le fabricant privilégie le confort (le cas ici), plus que la performance pure.

Voici sa progression :

Z110A RSB +10dB en entrée, le RSB en sortie est de +15dB environ. Il semble donc que l’apport de la directionalité soit déterminante dans ce cas, et ce, jusqu’à RSB 0dB en entrée. La technologie microphonique semble efficace. Le réducteur intervient ensuite progressivement, sans améliorer le RSB de sortie, mais certainement en améliorant le confort.

Conclusion(s)

Donc OUI, en 2015, les aides auditives AMELIORENT le RSB. C’est quasiment (presque…) toujours le cas avec les appareils actuels à condition que directivité et réducteurs de bruit multi-canaux soient présents. On note donc une réelle différence avec ce qui se faisait ces dernières années; on parlait alors plutôt de « conservation du RSB » plus que d’amélioration… J’en profite d’ailleurs pour rebondir et dénoncer un certain « moins disant tarifaire » poussé par la plupart des OCAM aujourd’hui (la fameuse « offre déprime l’audio ») : proposer de manière systématique en second choix au patient l’appareil le moins évolué (= le moins cher possible). Ce sera au détriment du confort et de la performance dans le bruit ! Une sorte de « perte de chance » proposée dans 100% de devis alternatifs… Le patient aura peut être oublié qu’il a payé moins cher, il n’oubliera jamais qu’il n’est ni confortable, ni efficace. Bref, je ferme la parenthèse. Mes confrères auront compris !   Formule d’usage : l’auteur ne signale aucun lien d’intérêt avec le fabricant testé. N’y voyez aucune malice, ne déduisez rien d’absolu au vu des seuls résultats. L’appareillage auditif est une alchimie entre l’audioprothésiste, son patient et la technologie la plus appropriée qu’ils choisissent en commun.   A plus tard pour de prochaines aventures… Bronzez bien 😉

2 – Le Saint Graal de l’audioprothèse : mesurer le RSB en sortie d’aide auditive – Mise en place d’un test

La technique d’extraction du signal et du bruit à la sortie d’une aide auditive proposée par Hagerman&Olofsson est fréquemment utilisée en mastering audio, sous le nom de « NULL TEST« . Elle permet entre autres, de quantifier la perte de qualité liée à un ré-échantillonage du signal d’origine. Comme nous l’avons vu précédemment, Miller (2013) utilise 4 signaux pour l’extraction et l’estimation du facteur de qualité de cette extraction, permettent une analyse du RSB assez robuste à la sortie d’une aide auditive : (+S+N) + (+S-N) extrait le signal (+S+N) + (-S+N) extrait le bruit et (+S+N) + (-S-N) extrait… rien !, ou plutôt devrait tendre vers -∞ mais en réalité doit être 20dB plus faible que le plus faible extrait des deux précédents. C’est un critère de qualité/d’erreur. La difficulté majeure de ce type de test vient de l’alignement de tous ces signaux : plus elle est rigoureuse et précise, plus le calcul fera « disparaître » les signaux se retrouvant en opposition de phase. Et ça se joue quelques échantillons près (un échantillon avec une fréquence d’échantillonnage de 96kHz dure… 10μs !).  Les éléments technologiques présents dans les aides auditives actuelles rendent très difficile cet alignement : les anti-larsen notamment ont tendance à inverser la phase du signal pendant le test, et bien sûr, jamais au même moment… Les systèmes « d’aide à la décision » analysant également la scène sonore ont tendance à ne jamais faire exactement la même chose au même moment entre deux mesures. Enfin, entre autres joyeusetés, les appareils peuvent présenter un phénomène de « Time shifting », c’est à dire qu’ils allongent (certes de quelques ms) le signal, mais jamais non plus aux mêmes endroits des tests… Bref, une solution s’impose : se méfier des anti-larsen ( = les désactiver) et fixer les appareils dans un mode programme défini. De là à dire qu’il faudrait faire pareil avec les appareils de nos patients… mais ça pourrait des fois se discuter pour des raisons de qualité sonore ! Alignement précis = élimination précise de la parole ou du bruit = besoin d’un enregistrement « HiRes », c’est à dire en 96kHz/24bits = de bon gros fichiers .wav pour 45′ environ d’enregistrement (RSB testés +10/+5/0/-5/-10dB, pour 4 configurations différentes +S+N, -S-N, +S-N et -S+N). Bien aligner ensuite tout le monde, pour bien éliminer ce qui doit l’être. Exemple avec l’ISTS et l’IFnoise à RSB -4dB :   SpN+SmN   Le signal +S+N à l’écoute :   Le signal +S-N à l’écoute (aucune différence à l’oreille) :     Ici deux fichiers +S+N et +S-N se retrouvant strictement synchronisés (configuration Hagerman & Olofsson de 2004), l’addition des deux va donner la parole + 6dB, le bruit, en opposition de phase dans +S-N, s’annulant avec +S+N :   Parole extraite   Pour ceux qui voudraient écouter le signal extrait (extraction médiocre… non conservée) ci-dessus, non trafiqué, même si ça a un petit côté magique :     Et si vous ne me croyez pas, vous pouvez télécharger ces +S+N et +S-N et les fusionner dans Audacity, vous retrouverez bien la voix extraite ! Et si vous avez tout suivi, et que vous maîtrisez un peu Audacity, avec ces deux extraits, vous pourriez même, connaissant le RSB à l’entrée (-4dB), reconstituer le RSB à la sortie de ce Widex Dream Fashion 440 😉 Allez, je vous aide ! On n’a rien sans rien… Cet alignement est très long et fastidieux. Si vous avez eu le courage de tenter la manip ci-dessus, vous avez dû comprendre. Et encore, les signaux sont déjà alignés et tous prêts à l’emploi ! Une solution mise en place par Franck LECLERE et avant lui, l’institut Fraunhofer, a été un traitement par lots (batch processing) des divers fichiers enregistrés à divers RSB avec « alignement automatique » basé sur la structure fine ou bien l’enveloppe du signal (au choix, selon les appareils) :   Décomposition signal_Seewave   Pourquoi des signaux mesurés à la sortie de certains appareils s’alignent mieux avec l’enveloppe (une majorité) ou d’autres par la structure fine ? cela reste un mystère… Donc pour faire court, on obtient un « train » de 4 signaux à 5 RSB différents (20 combinaisons), enregistrés en 96kHz/24bits qu’il va falloir découper, puis aligner entre eux afin d’en extraire la substantifique moelle (y’a pas que l’audio dans la vie… vous lisez trop le blog !) :   TrainH&O C’est un algorithme qui va découper ce train, aligner les signaux (ici sur l’enveloppe) et extraire signal et bruit. Il ne restera plus qu’à recalculer le RSB à la sortie. Conditions de test :
  • Signal ISTS, bruit IFnoise (même densité spectrale de niveau), téléchargeables sur le site de l’EHIMA
  • Appareil réglé selon méthodologie fabricant, dont le niveau de sortie pour l’ISTS à 65dB SPL d’entrée a été fixé dans un coupleur 2cc sur cible DSL 5.0a (EAR + RECD HA2) sur la base d’un audiogramme normalisé KS100 (sans inconfort entré)
  • Cabine : TR 0,23s et BDF 27dBA
  • HP : 1 à l’avant (émission de l’ISTS) à 0.70m et 2 à l’arrière (émission de l’IFnoise) à 135 et 225°, à 1,5m chacun
  • Etalonnage du niveau d’émission de l’ISTS par sonomètre au niveau du micro de l’AA par Leq 30s en dBA; étalonnage identique pour l’IFnoise
  • enregistrement en fond de coupleur par un microphone DPA 4061 en 96kHz/24bits, en acquisition sur carte Echo 2 en USB et Audacity en mode natif sous Mac
  • enregistrement en parallèle par enregistreur Roland R26 afin de vérifier la RSB à l’entrée
  • Découpage, extraction par un code Matlab sur les 30 dernières secondes de chaque mesure (afin de laisser les algos se stabiliser) pour l’enregistrement de l’appareil, et pour l’enregistrement de référence
Le premier testé sera un appareil qui ne prêtera pas à polémique, puisqu’il n’est plus diffusé : un Widex Inteo 19, de 2006 si j’ai bonne mémoire. Il y a eu 3 générations de circuits après cet appareil (puces Mind, Clear puis Dream). On obtient, par exemple à RSB -10dB, la séparation des signaux :   Exemple fig extraction RSB-10dB   Voici sa progression :   IN19   Pas d’amélioration du RSB, sauf à -10dB (lissage du bruit par la compression WDRC, j’en avais parlé dans l’article précédent) et détérioration (légère) du RSB à +10dB par l’effet inverse (= un lissage des crêtes du signal utile). On retrouve tout à fait les résultats décrits par Taylor & Johannesson en 2009 (le Widex Inteo avait un temps de retour variable, comme le lièvre, mais plutôt long) :   Capture   Par la même occasion, si vous avez eu la patience de lire la thèse de Miller (2013), les résultats étaient quasi identiques avec son successeur, le Widex Mind 440. Je précise : les autres fabricants ne faisaient pas mieux à l’époque, voire plutôt moins bien.   A suivre…

1 – Le Saint Graal de l’audioprothèse : mesurer le RSB* en sortie d’aide auditive – Historique

*RSB = Rapport Signal sur Bruit :   RSBfreq   Ces articles sont le fruit d’un cheminement intellectuel (le grand mot !) démarré avec Alexandre GAULT et Jean-Baptiste DELANDE (Advanced Bionics), puis continué (et brillamment finalisé !) par Franck LECLERE pour la partie systématisation et précision de la mesure. Je me suis décidé aussi à communiquer un peu sur le sujet à la suite (et c’est nouveau dans l’histoire de la profession) d’affirmations de plus en plus nettes de fabricants mettant en avant les performances dans le bruit de leurs appareils auditifs. Car vous l’aviez peut être remarqué, jusqu’à maintenant si les arguments de discrétion, joliesse, communication, confort, couleur, design, fiabilité, consommation, dynamique, épilation du maillot, bonheur absolu, etc, etc, pleuvaient sur nous et nos patients concernant ces beaux et nouveaux modèles, une donnée cruciale manquait : « Et ça améliore le rapport signal/bruit, un appareil auditif ? ». Vous ne vous étiez peut être jamais posé la question, pensant que, bien sûr, avec les progrès des appareils actuels et depuis l’invention du microphone directionnel adaptatif, le bruit était atténué et la parole était mise en évidence ( = la rapport signal/bruit s’améliorait donc). Bien sûr… Et pourtant, jamais jusqu’à aujourd’hui, nous n’avions lu ou entendu telle affirmation… ni son contraire. Ni son contraire ???? Un appareil auditif pourrait-il détériorer le RSB ??? Arff… Nous profitons de ce moment de doute pour ouvrir une « séquence histoire » :

Première époque

En 2004, Hagerman & Olofsson décrivent une méthode d’extraction de la parole du bruit à la sortie d’aides auditives en deux mesures successives : en connaissant le RSB à l’entrée d’une aide auditive il était donc possible de reconstituer le RSB à la sortie de l’aide auditive. Ils créent pour cela deux signaux :
  • un signal « classique » qu’il nomment SplN. C’est un fichier mono sur lequel on trouve le signal « utile » (ICRA) et le bruit dont le niveau varie au cours du temps afin de tester divers RSB
  • un signal inversé en phase qu’ils nomment SmN identique au premier, sauf que le bruit (N) a subit une rotation de 180° de sa phase, avec toujours une variation identique du RSB
Deux mesures successives sont réalisées avec chaque modèle d’appareil testé (anonymes dans l’article). SplN et SmN sont ensuite récupérés à la sortie de l’aide auditive. Une fois ces signaux vectorisés, deux calculs permettent d’extraire bruit et parole séparément : SplN + SmN = 2S (ou signal +6dB, les signaux s’additionnant en phase), puis SplN – SmN = 2N (ou bruit +6dB, idem). On connaissait le RSB à l’entrée, par reconstruction, on peut reconstituer le RSB à la sortie… magique ! Verdict en 2004 : aucun appareil testé n’améliore le RSB, tous le dégradent… Oui… mais ça c’était avant !

Seconde époque

Nous faisons un bond dans le temps pour arriver en 2009. Les appareils ont bien changé. Des automatismes de tous crins font leur apparition, les multicanaux sont la norme et les anti-larsen entrent sérieusement dans la partie. Tout cela constitue un indéniable progrès pour la précision de l’adaptation et le confort du patient (j’ai bien dit « confort », pas performance…), mais, croyez-moi sur parole, il devient de plus en plus difficile d’appliquer la procédure de séparation de signaux de Hagerman & Olofsson, pour des raisons que vous ne lirez jamais dans les articles de l’époque, mais qui sont, pour faire simple, un « time shifting » (allongement du signal entre deux mesures par l’appareil, de quelques ms ou plus), rotations de phases des anti-larsen rendant le calcul à partir de SplN et SmN très aléatoire dans le temps de mesure, automatismes de RB et mic. dir. s’enclenchant de manière aléatoire pendant la mesure… Bref, c’était beaucoup plus facile en 2004 avec les appareils « simples » de l’époque ! Cette mesure est essentiellement une mesure de labo, faite par des gens qui peuvent désactiver à loisir telle ou telle fonction, comme le montre l’article de Taylor & Johannesson dont j’avais parlé à un EPU. Ils démontrent qu’une compression trop rapide détériore le RSB lorsque qu’il est positif, par lissage des crêtes de la parole, et inversement dans beaucoup de bruit par lissage des crêtes du bruit; que le nombre de canaux n’améliore pas le RSB à la sortie de l’AA (ah bon ! on nous l’avais pourtant promis !), etc. Nous sommes là dans des conditions de tests à coeur ouvert, où les ingénieurs peuvent à loisirs inhiber tous les automatismes et les isoler afin d’en tester l’efficacité séparément. Mais en tout cas on en est toujours au même point : pas de franche amélioration du RSB en sortie de l’aide auditive… Et plutôt une dégradation.

Troisième époque

Une thèse (ici dans sa version préliminaire) : Miller, en 2013. Les appareils testés sont ici plus proches de nous (Widex Mind-440, Phonak Ambra, Oticon Acto Pro) et la méthode utilisée est dérivée de celle de Hagerman & Olofsson, en utilisant 4 signaux +S+N, -S+N, -S-N et +S-N. La parole est extraite par le processus mathématique (+S+N) + (+S-N) et le bruit (+S+N) + (-S+N). Un facteur de qualité de l’extraction, ou « erreur » est obtenu par (+S+N) + (-S-N) dont le niveau RMS doit rester 20dB inférieur au plus faible niveau des deux signaux extraits (bruit et parole), et ce, à chaque RSB testé. Comme toujours lors de la lecture de ces tests, on reste surpris (quand on connait la difficulté de l’extraction due à l’imprévisibilité des appareils) de l’absence d’évocation des moyens employés pour « fixer » les appareils, surtout ces derniers testés, dans un état stable. C’est à dire, en gros, en désactivant l’anti-larsen et le choix automatique du mode (parole, parole dans le bruit, bruit seul, musique, TV, etc.). Mais bon, tout le monde a sa petite combine qu’il veut garder secrète, c’est normal… Résultats ? AUCUN de ces appareils testés n’améliore de plus de 0,5dB le RSB à la sortie… Là j’entends un grand silence, je ressens une angoisse, je vois déjà le trouble nous envahir… C’était il y a…trois ans pour ces modèles, voire un peu plus. Deux générations se sont succédées depuis, avec moult promesses, certes, mais aussi ne boudons pas notre plaisir, la « sensation » que la technologie devient plus confortable dans le bruit, voire des fois, plus efficace. « Plus efficaces dans le bruit », le mot est lâché. En utilisant les travaux de Miller, avec un processus d’alignement des signaux permettant une extraction plus facile et précise, en reprenant en en essayant de pousser un peu plus les superbes travaux de Franck LECLERE réalisés dans ce sens lors de son mémoire de D.E., nous essaierons au fil du temps de vous faire profiter de ces mesures sur des appareils dernier cri, dans ce blog. Pour que l’argument technique des fabricants ne se résume pas à une soirée petits-fours 😉 Prochain sur la sellette : oh puis non, on verra bien selon l’humeur ! A plus !

Faire du bruit pendant le test ou un test dans le bruit ? That is the question…

Dans un souci légitime de réaliser en cabine des tests en conditions « comme pour de vrai », les audioprothésistes se dotent depuis quelques années de systèmes de reproduction sonore 5.1, 7.1, etc., immergeant le patient sur le quai d’une gare, au restaurant ou autre, tout en lui demandant de répéter un message. C’est louable, et c’est ce pourquoi il vient nous voir le plus souvent (intelligibilité en milieux bruyants). Mais après ? Qu’en conclure ? Faire un « sans/avec » ou un « avant/après » (RB, mic. dir.,) est à la rigueur possible, puisqu’il s’agit de comparer deux conditions de test différentes… Mais en aucun cas nous ne pourrons dire à un patient « Vous êtes dans la norme », ou « Plutôt mieux que la moyenne », car nous ne pourrons pas nous référer aux valeurs absolues de référence établies pour un test dans le bruit particulier. Pourquoi ? Parce qu’à l’heure actuelle, il n’existe en France aucun test dans le bruit « clinique », c’est à dire appliqué tel qu’il a été conçu ! Certes, nous pouvons faire du/des bruit(s) pendant un test d’audiométrie vocale, par exemple lors de l’ANL et du HINT qui ont été conçus pour être administrés en milieu bruyant, mais c’est oublier que ces tests, dans leurs versions d’origine, n’utilisent pas n’importe quels bruits. Et c’est là que réside tout leur intérêt et leur robustesse : le bruit utilisé en parallèle au message a été spécifiquement créé en fonction du matériel vocal utilisé. Un audioprothésiste français souhaitant aujourd’hui faire un test dans le bruit va, par exemple, émettre les phrases du HINT (Hearing In Noise Test) dans leur version française à un niveau fixe de 65dB SPL, et envoyer en même temps l’OVG (Onde Vocale Globale) dont le niveau variera au cours du test par paliers de 5dB autour du niveau des phrases à répéter. Si cet audioprothésiste possède un système plus élaboré de reproduction sonore avec un logiciel lui permettant de choisir son bruit dans une banque de données, il décidera peut être d’utiliser un bruit qu’il jugera plus réaliste : par exemple une simulation de restaurant sur le même principe de variation du rapport signal/bruit.

Rapport signal/bruit (RSB) ?

  • Ls est l’énergie du signal à comprendre (ANL) ou répéter (HINT),
  • Lb l’énergie du bruit qui va être émis à divers niveaux en parallèle,
  • l’usage courant se base sur les niveaux à long terme (RMS) de chaque signal pour déterminer le RSB:
RSBglobal   Donc, si on suit bien cette équation, les phrases du HINT, le texte de l’ANL ou les listes dissyllabiques de Fournier émises à 65dB SPL, plus l’OVG (Bruit de « cocktail »), un bruit de restaurant ou un bruit blanc à 65dB SPL donneraient pour chaque condition un RSB = 0dB ? Vous pressentez bien à la lecture de cette phrase que quelque chose cloche… Comment des signaux de bruit aussi différents qu’un bruit blanc (WN), l’OVG ou une ambiance de restaurant pourraient-ils donner un RSB identique parce qu’ils sont « juste » émis au même niveau que la parole ? C’est de la simplification de ce calcul de RSB que vient l’erreur des « tests dans le bruit faits maison », car ils ne sont alors plus utilisés dans leurs versions d’origine. Dans l’équation ci dessus, il manque « juste » un petit quelque chose : RSBfreq   C’est le ! Pour faire un « vrai » test d’audiométrie vocale dans le bruit, le RSB doit être identique à chaque fréquence entre le signal et le bruit ! Ce qui veut dire en clair que si vous administrez un test à un RSB de +5dB (le bruit est 5dB plus faible que le signal), vous devrez retrouver cette différence entre les deux signaux à 251Hz, 1356Hz, 4800Hz, etc. et non pas uniquement entre le niveau global du signal et du bruit car dans ce cas, il est possible que le RSB réel soit de +13dB à 6000Hz et -1dB à 800Hz, etc. Un signal de bruit doit donc être spécifiquement créé pour les listes vocales avec lesquelles il est émis. Exemple: sur le graphique ci-dessous ont été représentées les densités spectrales de niveau (le niveau en dB pour chaque fréquence, en Hz) des listes dissyllabiques de Fournier (en bleu, voix d’homme) concaténées (élimination des silences) face à l’OVG (en rouge):
ComparaisonSignaux

Comparaison de signaux de test et de l’OVG – Cliquez sur le graphe pour l’agrandir.

 
  • Déjà une chose : les audios ayant encore de bonnes oreilles ont certainement dû ressentir ce vague bruit de couverts renversés au loin (excusez l’image !) lors de l’émission de l’OVG… c’est le méchant pic à 18KHz !
  • Ensuite : le niveau des listes de Fournier a été aligné sur celui de l’OVG (donc RSB = 0dB pour leur niveau global), mais on voit bien que leur niveau n’est pas égal à toutes les fréquences. Deux marqueurs (violet, en pointillés et ligne continue) ont été placés à environ 7000Hz et la différence de niveau entre les deux signaux est d’environ 7dB (donc RSB = -7dB à cette fréquence…). Jusqu’à 5000Hz les deux signaux sont tout de même assez proches, mais « assez » n’est pas suffisant…
Pour les phrases du HINT (Hearing In Noise Test), concaténées elles aussi, mais qui n’ont pas été mises au même niveau que l’OVG, on constate quand même que leur DSN (Densité Spectrale de Niveau) n’est pas identique à celle de l’OVG, ce qui, là aussi, entraînera un RSB non homogène en fréquence entre ces deux signaux. Comment ne plus « bidouiller » ? Comment passer du « bruit pendant le test » au « test clinique dans le bruit » ? Les auteurs de la version française du HINT nous livrent les secrets de l’élaboration du signal de bruit utilisé dans ce test (p361, traduction maison) :
  • toutes les phrases du test ont été mises au même niveau RMS après suppression des silences
  • ces phrases ont ensuite été regroupées en un seul fichier
  • le spectre à long terme de ce fichier a été calculé
  • un filtre (FIR) correspondant à ce spectre à long terme sur 256 fréquences a été créé
  • un bruit blanc a été filtré sur la base de ce filtre, dont la différence d’amplitude avec le LTASS des phrases n’excédait pas 0,6dB
Ceci permet donc d’être certain que le RSB est le même à toutes les fréquences, et à partir de là, d’établir des moyennes cliniquement robustes pour ce test. Voici le résultat d’un bruit blanc (WN) filtré sur le spectre à long terme des phrases du HINT : Et à l’écoute, un extrait de ce bruit blanc filtré sur le spectre à long terme (LTASS) des phrases (la courbe rouge – 2,2sec) : Donc pour chaque test dans le bruit (HINT, QuickSIN, ANL), existe un bruit masquant spécifique au matériel vocal se trouvant en face. Les différences de résultats entre différents tests dans le bruit s’expliquant alors par le niveau d’abstraction du matériel vocal employé et non pas par la « difficulté du bruit ». Dans leurs versions d’origine, le HINT doit être administré avec un bruit blanc filtré et l’ANL avec un « babble ». Ils n’ont pas été prévus pour être utilisés avec d’autres bruits, ou alors il ne s’agit plus des mêmes tests… Un exemple du « babble » pour l’ANL (3sec.) : Je ne sais pas si l’ANL a été développé pour être utilisé en français (mais c’est probable, car issu de recherches canadiennes), mais utilisé avec un texte enregistré quelconque et l’OVG ou un autre bruit non spécifiquement filtrés en face, ce test ne peut vous donner aucun résultat cohérent, car vous ne pourrez pas le rapprocher des grilles de notation de Nabelek, déterminées avec un texte bien spécifique ET un bruit bien spécifiquement filtré. Le HINT existe pour sa partie phrases sur le CD n°3 du CNA. Le bruit sur la piste stéréo B de ce CD est l’OVG, et n’a pas été filtré spécifiquement pour ce test. Sachez pour la petite histoire que l’achat du HINT dans sa version d’origine, avec semble t-il un matériel spécifique d’administration du test, coûte plusieurs milliers de dollars ! Une solution (script) identique à celle présentée plus haut pour le HINT peut être utilisée afin de filtrer n’importe quel signal de bruit. Elle consiste tout d’abord à filtrer le matériel vocal selon le spectre vocal international (masculin, féminin, enfant) de Byrne & Al. Exemple ci dessous, les listes de Fournier (voix d’homme) sont d’abord filtrées sur le ILTASS (International Long Term Average Speech Spectrum) « mâle » de Byrne :   Puis ensuite, l’OVG est filtré sur le résultat précédent (courbe noire avant filtrage/courbe rouge après filtrage) :   Ce qui donne d’assez bons résultats jusqu’à 12000Hz, malgré (ou à cause) ce … de pic présent dans l’OVG qui perturbe le filtrage dès 15000Hz. On pourrait également faire la même manip. avec les phrases du HINT et l’OVG, selon le principe vu plus haut pour le bruit blanc. Bref, avec une telle méthode mathématique, on peut créer tous les bruits que l’on veut, qui seront de même DSN/même RSB à toutes les fréquences que les listes. Attention cependant : on s’éloigne de la version d’origine du test… Ce design de bruit n’est pas réservé qu’aux tests d’intelligibilité dans le bruit. On le retrouve également le même souci d’un RSB constant sur 1024 points fréquentiels dans l’élaboration de l’IFNoise (International Female Noise) par l’EHIMA (téléchargeable dans la section « Technical documents » de cette page) qui est en tous points identique en DSN avec l’ISTS (testez, vous verrez !). Donc ce qui vaut au casque ou en champ libre, vaut également pour les tests au caisson lors de recherches de performances des aides auditives avec variations du RSB. Utiliser du bruit blanc filtré ou un babillage filtré ne vous semble pas très « réaliste » ? Certes, mais c’est à ce prix que nous pourrons harmoniser toutes nos mesures, avoir des courbes de références solides, les comparer, et comparer de façon correcte des résultats obtenus dans divers endroits, par différentes équipes. Le début des « vrais » tests cliniques dans le bruit. Je terminerai par un test dans le bruit qui semble intéressant, distribué par l’université d’Oldenburg, le « Framatrix » ou « French Matrix Test » permettant de réaliser des tests dans le bruit de façon scientifiquement robuste. Si quelqu’un a un retour sur ce test, je pense que cela pourrait vivement intéresser la communauté.. et moi en premier, avant d’investir  😉 .   Un (TRES) grand merci à deux activateurs de mes neurones : Franck LECLERE (Audioprothésiste D.E.) et François-Xavier NSABIMANA (chercheur à l’institut Fraunhofer).