Je voulais vous faire partager deux cas intéressants, qui ne sont absolument pas une exception et confirment une règle générale que nous pourrions oublier facilement.
Dans le cadre de tests sur des sujets normo-entendants, j’ai été amené à mesurer la « résistance de l’intelligibilité au bruit » de deux personnes à l’audition normale en dégradant progressivement le RSB lors d’un test FRAMATRIX.
Je vous avais présenté le FRAMATRIX dans ce billet. Ce test est constitué de listes de 10 ou 20 phrases de 5 mots chacune. Ici, c’est la version 20 phrases qui a été testée, soit une notation sur 5×20 = 100 items testés.
La procédure de test du FRAMATRIX insiste sur la nécessité d’une, ou deux listes d’entraînement avant de comptabiliser les résultats. C’est d’ailleurs le cas pour le HINT (deux listes d’entraînement), et je n’en sais pas plus sur l’ANL.
Les sujets testés ici doivent avoir un PTA (Pure Tone Average = Moyenne de l’audition en sons purs) inférieur ou égal à 15dB HL sur 250/500/1000/2000/4000Hz, sans pondération fréquentielle. Les sujets testés ont moins de 55 ans. On peut donc considérer qu’ils sont « jeunes », ont une audition dans les limites de la normale, et sont suffisamment vifs intellectuellement pour passer ce test.
Le test FRAMATRIX, ou FRench MATRIX test est un test d’intelligibilité clinique, dans le bruit. Il est « clinique », car il n’est pas « drôle », c’est à dire qu’il doit être administré de manière stricte, que le bruit masquant correspond au spectre à long terme des phrases, que sa calibration doit faire l’objet d’une procédure de calibration approuvée par l’institut Hörtech, etc.
Le FRAMATRIX n’est pas un test dans le bruit censé placer le patient dans de multiples situations sonores proches de la vie réelle. Il comptabilise et compare les performances du sujet testé, éventuellement en fonction de moyennes européennes, mais surtout en fonction des performances de traitement du signal de son appareillage auditif.
Donc si avec tout ça vous avez encore envie d’administrer ce test, ces lignes peuvent vous intéresser. Le FRAMATRIX peut être considéré, blague à part, comme « re-loaded » car il est sorti assez récemment de sa version pure laboratoire. Il a été repensé pour être administré de façon plus conviviale, et sa passation est quasi-automatisée bien que tout soit très paramétrable.
Matériel vocal
Il s’agit de listes de phrases, que vous pouvez configurer par 10 ou 20 phrases (recommandé). Contrairement au HINT ou la phrase est juste ou fausse dans son ensemble, le FRAMATRIX compte chaque mot juste dans chaque phrase :
On a donc un test qui va comptabiliser 5 mots dans chacune des 20 phrases = 100 items, ce qui est très robuste statistiquement pour un test en une passe.
Il est également possible de tester en 10 phrases, bien que ce ne soit pas la procédure recommandée. La structure des phrases est toujours de type Prénom/Verbe/Nombre/Complément/Couleur.
Les phrases peuvent être « fermées », c’est à dire toujours identiques d’une session à l’autre, ou bien construites de manière aléatoire.
Configuration
Tout est paramétrable :
angles du bruit (bruit vocal stationnaire) et de la voix
Adaptativité du niveau des phrases ou du bruit
Rapport signal/bruit progressif croissant ou décroissant
Recherche automatique du SRT (50% d’intelligibilité)
Vous pouvez créer, en plus des tests existants, vos propres tests pour les retrouver ensuite das votre liste de tests les plus courants (ici, les deux derniers ont été créés).
Entraînement et durée du test
Il est vivement conseillé de procéder à (au moins) une liste complète d’entraînement avant de comptabiliser réellement la performance. Ici, la première liste administrée au patient : le RSB nécessaire à 50% était médiocre au départ (entre 0 et 5dB), pour diminuer progressivement au cours du test. Le SRT est obtenu pour cette liste à un RSB moyen de -5,9dB, ce qui est très bon :
La deuxième liste :
On voit que le patient, avec entraînement, améliore encore son score : il passe à un SRT à -7,5dB de RSB… les aides auditives fonctionnent quand même bien aujourd’hui !
Vous remarquerez la variabilité des réponses en début de test, effet de surprise qui s’estompe après quelques phrases.
La synthèse :
Configuration des niveaux d’émission et de variation du RSB
paramétrage du type de signal fixé et variable : choix du bruit ou des phrases
paramétrage du niveau de départ et du RSB de départ : ici la voix est fixée à 68dB SPL, et le RSB de départ est de 0dB
test dans le bruit ou sans le bruit
recherche de pente de courbe psychomotrice
etc.
Recherche de SRT automatique
A mon humble avis, c’est la fonction la plus intéressante du test : si le patient répète plus de 2 mots justes, le RSB se dégrade de moins de 5dB; s’il ne répète rien, il s’améliore, et tout ceci en permanence. On obtient donc en permanence une fluctuation du RSB autour de 50% d’intelligibilité. Au final, le logiciel calcule automatiquement le SRT (Speech Reception Threshold = 50% d’intelligibilité) à un RSB moyen calculé lui aussi.
Durée
Une liste d’entraînement puis une liste de comptage durent au total 4min 57s… Si vous effectuez une liste d’entraînement + 1 liste en programme automatique et enfin 1 liste en programme dédié bruit, la durée est d’environ 8min. Ca reste très raisonnable, mais fatiguant sur 3 listes. Sachez quand même que l’idéal se situe à trois listes.
Consignes et public visé
Les consignes doivent être explicites : le patient doit savoir à quoi s’attendre, autant sur le plan syntaxique (« Sophie attrape deux vélos bleus ») que sur le plan de la difficulté du test, qui ne sera jamais facile (si recherche du SRT). Il faut bien l’expliquer au patient avant de débuter, sous peine de très rapidement se retrouver face à une sensation d’échec bloquant.
Tous les patients, a priori, s’ils peuvent maintenir une attention soutenue de 5 à 8′, sont testables, à condition aussi que leur appareillage ou leur surdité permettent une amélioration de l’intelligibilité dans le bruit
Le vocabulaire très simple des phrases en fait un test administrable aux enfants
Comparaison par rapport à la normale statistique
Hörtech fournit une courbe psychomotrice normale des résultats au FRAMATRIX. Le SRT est atteint à -6dB de RSB (ici en rouge, une recherche de SRT avec pente de courbe psychomotrice) :
Attention cependant : cette courbe normale n’est fournie par Hörtech que pour la situation « Phrases + Bruit de face ». Il est tout à fait possible (plus logique ?) d’administrer le test avec phrases en face et bruit arrière, mais dans ce cas, Hörtech se refuse à fournir une courbe d’intelligibilité moyenne, car la diversité des locaux de test est alors trop importante pour obtenir une moyenne raisonnable. Rigueur germanique…
Installation(s)
Le test est proposé à l’achat (ce n’est pas un abonnement)
Une calibration du champ libre, du casque et des inserts (possibilité de le faire autrement qu’en champ libre) est OBLIGATOIRE et exigée par HörTech afin de garder un agrément « clinique »
S’installe en module complémentaire pour les possesseurs d’Affinity
Peut s’installer en module StandAlone sous Windows pour ceux qui n’ont pas Affinity
Distribution : Interacoustics France
Voilà, je pense qu’un test dans le bruit de plus, robuste et clinique, et en français, n’est pas inutile. Il est très simple en usage quotidien et montre très rapidement les performances de tel ou tel programme ou réglage de réduction du bruit.
Je vous mets en lien la description du test. Je mettrai régulièrement à jour ce billet pour rajouter quelques unes des innombrables publications sur le sujet (le MATRIX Test existe dans une multitude de langues).
Dans un souci légitime de réaliser en cabine des tests en conditions « comme pour de vrai », les audioprothésistes se dotent depuis quelques années de systèmes de reproduction sonore 5.1, 7.1, etc., immergeant le patient sur le quai d’une gare, au restaurant ou autre, tout en lui demandant de répéter un message.
Dans un souci légitime de réaliser en cabine des tests en conditions « comme pour de vrai », les audioprothésistes se dotent depuis quelques années de systèmes de reproduction sonore 5.1, 7.1, etc., immergeant le patient sur le quai d’une gare, au restaurant ou autre, tout en lui demandant de répéter un message.
C’est louable, et c’est ce pourquoi il vient nous voir le plus souvent (intelligibilité en milieux bruyants). Mais après ? Qu’en conclure ?
Faire un « sans/avec » ou un « avant/après » (RB, mic. dir.,) est à la rigueur possible, puisqu’il s’agit de comparer deux conditions de test différentes…
Mais en aucun cas nous ne pourrons dire à un patient « Vous êtes dans la norme », ou « Plutôt mieux que la moyenne », car nous ne pourrons pas nous référer aux valeurs absolues de référence établies pour un test dans le bruit particulier.
Pourquoi ?
Parce qu’à l’heure actuelle, il n’existe en France aucun test dans le bruit « clinique », c’est à dire appliqué tel qu’il a été conçu !
Certes, nous pouvons faire du/des bruit(s) pendant un test d’audiométrie vocale, par exemple lors de l’ANL et du HINT qui ont été conçus pour être administrés en milieu bruyant, mais c’est oublier que ces tests, dans leurs versions d’origine, n’utilisent pas n’importe quels bruits. Et c’est là que réside tout leur intérêt et leur robustesse : le bruit utilisé en parallèle au message a été spécifiquement créé en fonction du matériel vocal utilisé.
Un audioprothésiste français souhaitant aujourd’hui faire un test dans le bruit va, par exemple, émettre les phrases du HINT (Hearing In Noise Test) dans leur version française à un niveau fixe de 65dB SPL, et envoyer en même temps l’OVG (Onde Vocale Globale) dont le niveau variera au cours du test par paliers de 5dB autour du niveau des phrases à répéter. Si cet audioprothésiste possède un système plus élaboré de reproduction sonore avec un logiciel lui permettant de choisir son bruit dans une banque de données, il décidera peut être d’utiliser un bruit qu’il jugera plus réaliste : par exemple une simulation de restaurant sur le même principe de variation du rapport signal/bruit.
Rapport signal/bruit (RSB) ?
Ls est l’énergie du signal à comprendre (ANL) ou répéter (HINT),
Lb l’énergie du bruit qui va être émis à divers niveaux en parallèle,
l’usage courant se base sur les niveaux à long terme (RMS) de chaque signal pour déterminer le RSB:
Donc, si on suit bien cette équation, les phrases du HINT, le texte de l’ANL ou les listes dissyllabiques de Fournier émises à 65dB SPL, plus l’OVG (Bruit de « cocktail »), un bruit de restaurant ou un bruit blanc à 65dB SPL donneraient pour chaque condition un RSB = 0dB ?
Vous pressentez bien à la lecture de cette phrase que quelque chose cloche… Comment des signaux de bruit aussi différents qu’un bruit blanc (WN), l’OVG ou une ambiance de restaurant pourraient-ils donner un RSB identique parce qu’ils sont « juste » émis au même niveau que la parole ?
C’est de la simplification de ce calcul de RSB que vient l’erreur des « tests dans le bruit faits maison », car ils ne sont alors plus utilisés dans leurs versions d’origine. Dans l’équation ci dessus, il manque « juste » un petit quelque chose :
C’est le f !
Pour faire un « vrai » test d’audiométrie vocale dans le bruit, le RSB doit être identique à chaque fréquence entre le signal et le bruit ! Ce qui veut dire en clair que si vous administrez un test à un RSB de +5dB (le bruit est 5dB plus faible que le signal), vous devrez retrouver cette différence entre les deux signaux à 251Hz, 1356Hz, 4800Hz, etc. et non pas uniquement entre le niveau global du signal et du bruit car dans ce cas, il est possible que le RSB réel soit de +13dB à 6000Hz et -1dB à 800Hz, etc.
Un signal de bruit doit donc être spécifiquement créé pour les listes vocales avec lesquelles il est émis.
Exemple: sur le graphique ci-dessous ont été représentées les densités spectrales de niveau (le niveau en dB pour chaque fréquence, en Hz) des listes dissyllabiques de Fournier (en bleu, voix d’homme) concaténées (élimination des silences) face à l’OVG (en rouge):
Comparaison de signaux de test et de l’OVG – Cliquez sur le graphe pour l’agrandir.
Déjà une chose : les audios ayant encore de bonnes oreilles ont certainement dû ressentir ce vague bruit de couverts renversés au loin (excusez l’image !) lors de l’émission de l’OVG… c’est le méchant pic à 18KHz !
Ensuite : le niveau des listes de Fournier a été aligné sur celui de l’OVG (donc RSB = 0dB pour leur niveau global), mais on voit bien que leur niveau n’est pas égal à toutes les fréquences. Deux marqueurs (violet, en pointillés et ligne continue) ont été placés à environ 7000Hz et la différence de niveau entre les deux signaux est d’environ 7dB (donc RSB = -7dB à cette fréquence…). Jusqu’à 5000Hz les deux signaux sont tout de même assez proches, mais « assez » n’est pas suffisant…
Pour les phrases du HINT (Hearing In Noise Test), concaténées elles aussi, mais qui n’ont pas été mises au même niveau que l’OVG, on constate quand même que leur DSN (Densité Spectrale de Niveau) n’est pas identique à celle de l’OVG, ce qui, là aussi, entraînera un RSB non homogène en fréquence entre ces deux signaux.
Comment ne plus « bidouiller » ? Comment passer du « bruit pendant le test » au « test clinique dans le bruit » ?
toutes les phrases du test ont été mises au même niveau RMS après suppression des silences
ces phrases ont ensuite été regroupées en un seul fichier
le spectre à long terme de ce fichier a été calculé
un filtre (FIR) correspondant à ce spectre à long terme sur 256 fréquences a été créé
un bruit blanc a été filtré sur la base de ce filtre, dont la différence d’amplitude avec le LTASS des phrases n’excédait pas 0,6dB
Ceci permet donc d’être certain que le RSB est le même à toutes les fréquences, et à partir de là, d’établir des moyennes cliniquement robustes pour ce test.
Voici le résultat d’un bruit blanc (WN) filtré sur le spectre à long terme des phrases du HINT :
Et à l’écoute, un extrait de ce bruit blanc filtré sur le spectre à long terme (LTASS) des phrases (la courbe rouge – 2,2sec) :
Donc pour chaque test dans le bruit (HINT, QuickSIN, ANL), existe un bruit masquant spécifique au matériel vocal se trouvant en face. Les différences de résultats entre différents tests dans le bruit s’expliquant alors par le niveau d’abstraction du matériel vocal employé et non pas par la « difficulté du bruit ».
Dans leurs versions d’origine, le HINT doit être administré avec un bruit blanc filtré et l’ANL avec un « babble ». Ils n’ont pas été prévus pour être utilisés avec d’autres bruits, ou alors il ne s’agit plus des mêmes tests…
Un exemple du « babble » pour l’ANL (3sec.) :
Je ne sais pas si l’ANL a été développé pour être utilisé en français (mais c’est probable, car issu de recherches canadiennes), mais utilisé avec un texte enregistré quelconque et l’OVG ou un autre bruit non spécifiquement filtrés en face, ce test ne peut vous donner aucun résultat cohérent, car vous ne pourrez pas le rapprocher des grilles de notation de Nabelek, déterminées avec un texte bien spécifique ET un bruit bien spécifiquement filtré.
Le HINT existe pour sa partie phrases sur le CD n°3 du CNA. Le bruit sur la piste stéréo B de ce CD est l’OVG, et n’a pas été filtré spécifiquement pour ce test. Sachez pour la petite histoire que l’achat du HINT dans sa version d’origine, avec semble t-il un matériel spécifique d’administration du test, coûte plusieurs milliers de dollars !
Exemple ci dessous, les listes de Fournier (voix d’homme) sont d’abord filtrées sur le ILTASS (International Long Term Average Speech Spectrum) « mâle » de Byrne :
Puis ensuite, l’OVG est filtré sur le résultat précédent (courbe noire avant filtrage/courbe rouge après filtrage) :
Ce qui donne d’assez bons résultats jusqu’à 12000Hz, malgré (ou à cause) ce … de pic présent dans l’OVG qui perturbe le filtrage dès 15000Hz.
On pourrait également faire la même manip. avec les phrases du HINT et l’OVG, selon le principe vu plus haut pour le bruit blanc. Bref, avec une telle méthode mathématique, on peut créer tous les bruits que l’on veut, qui seront de même DSN/même RSB à toutes les fréquences que les listes. Attention cependant : on s’éloigne de la version d’origine du test…
Ce design de bruit n’est pas réservé qu’aux tests d’intelligibilité dans le bruit. On le retrouve également le même souci d’un RSB constant sur 1024 points fréquentiels dans l’élaboration de l’IFNoise (International Female Noise) par l’EHIMA (téléchargeable dans la section « Technical documents » de cette page) qui est en tous points identique en DSN avec l’ISTS (testez, vous verrez !). Donc ce qui vaut au casque ou en champ libre, vaut également pour les tests au caisson lors de recherches de performances des aides auditives avec variations du RSB.
Utiliser du bruit blanc filtré ou un babillage filtré ne vous semble pas très « réaliste » ? Certes, mais c’est à ce prix que nous pourrons harmoniser toutes nos mesures, avoir des courbes de références solides, les comparer, et comparer de façon correcte des résultats obtenus dans divers endroits, par différentes équipes. Le début des « vrais » tests cliniques dans le bruit.
Je terminerai par un test dans le bruit qui semble intéressant, distribué par l’université d’Oldenburg, le « Framatrix » ou « French Matrix Test » permettant de réaliser des tests dans le bruit de façon scientifiquement robuste. Si quelqu’un a un retour sur ce test, je pense que cela pourrait vivement intéresser la communauté.. et moi en premier, avant d’investir 😉 .
Un (TRES) grand merci à deux activateurs de mes neurones : Franck LECLERE (Audioprothésiste D.E.) et François-Xavier NSABIMANA (chercheur à l’institut Fraunhofer).