Catégorie : Débruiteur

La technique d’extraction du signal et du bruit à la sortie d’une aide auditive proposée par Hagerman&Olofsson est fréquemment utilisée en mastering audio, sous le nom de « NULL TEST« . Elle permet entre autres, de quantifier la perte de qualité liée à un ré-échantillonage ou compression « lossy » du signal d’origine.

Comme nous l’avons vu précédemment, Miller (2013) utilise 4 signaux pour l’extraction et l’estimation du facteur de qualité de cette extraction, permettent une analyse du RSB assez robuste à la sortie d’une aide auditive :

  • (+S+N) + (+S-N) extrait le signal (+6dB)
  • (+S+N) + (-S+N) extrait le bruit (+6dB)
  • et (+S+N) + (-S-N) extrait… rien !, ou plutôt devrait tendre vers -∞ mais en réalité « doit être 20dB plus faible que le plus faible extrait des deux précédents (parole ou bruit) ». C’est un critère de qualité/d’erreur décrit dans la thèse de Taylor (voir post précédent).

La difficulté majeure de ce type de test vient de l’alignement de tous ces signaux : plus elle est rigoureuse et précise, plus le calcul fera « disparaître » les signaux se retrouvant en opposition de phase. Et ça se joue quelques échantillons près (un échantillon avec une fréquence d’échantillonnage de 96kHz dure… 10μs !).  Les éléments technologiques présents dans les aides auditives actuelles rendent très difficile cet alignement :

  • les anti-larsen notamment ont tendance à inverser la phase du signal pendant le test, et bien sûr, jamais au même moment…
  • Les systèmes « d’aide à la décision » analysant également la scène sonore ont tendance à ne jamais faire exactement la même chose au même moment entre deux mesures.
  • Enfin, entre autres joyeusetés, les appareils peuvent présenter un phénomène de « Time shifting », c’est à dire qu’ils allongent (certes de quelques pouillèmes de sec…) le signal, mais jamais non plus aux mêmes endroits des tests…

Bref, une solution s’impose : se méfier des anti-larsen ( = les désactiver) et fixer les appareils dans un mode programme défini. De là à dire qu’il faudrait faire pareil avec les appareils de nos patients… mais ça pourrait des fois se discuter pour des raisons de qualité sonore !

Alignement précis = élimination précise de la parole ou du bruit = besoin d’un enregistrement « HiRes », c’est à dire en 96kHz/24bits = de bon gros fichiers .wav pour 45′ environ d’enregistrement (RSB testés +10/+5/0/-5/-10dB, pour 4 configurations différentes +S+N, -S-N, +S-N et -S+N).

Bien aligner ensuite tout le monde, pour bien éliminer ce qui doit l’être. Exemple avec l’ISTS et l’IFnoise à RSB -4dB :

 

SpN+SmN

 

Le signal +S+N à l’écoute :

 

Le signal +S-N à l’écoute (aucune différence à l’oreille) :

 

 

Ici deux fichiers +S+N et +S-N se retrouvant strictement synchronisés (configuration Hagerman & Olofsson de 2004), l’addition des deux va donner la parole + 6dB, le bruit en opposition de phase dans +S-N, s’annulant avec +S+N :

 

Parole extraite

 

Pour ceux qui voudraient écouter le signal extrait (extraction médiocre… non conservée) ci-dessus, non trafiqué, même si ça a un petit côté magique :

 

 

Et si vous ne me croyez pas, vous pouvez télécharger ces +S+N et +S-N et les fusionner dans Audacity, vous retrouverez bien la voix extraite ! Et si vous avez tout suivi, et que vous maîtrisez un peu Audacity, avec ces deux extraits, vous pourriez même, connaissant le RSB à l’entrée (-4dB), reconstituer le RSB à la sortie de ce Widex Dream Fashion 440 😉

Allez, je vous aide ! On n’a rien sans rien…

Cet alignement est très long et fastidieux. Si vous avez eu le courage de tenter la manip ci-dessus, vous avez dû comprendre. Et encore, les signaux sont déjà alignés et tous prêts à l’emploi !

Une solution :

mise en place par Franck LECLERE et avant lui, l’institut Fraunhofer (François-Xavier NSABIMANA), a été un traitement par lots (batch processing) des divers fichiers enregistrés à divers RSB avec « alignement automatique », basé soit sur la structure fine, soit l’enveloppe du signal (au choix, selon les appareils) :

 

Décomposition signal_Seewave

 

Pourquoi des signaux mesurés à la sortie de certains appareils s’alignent mieux avec l’enveloppe (une majorité) ou d’autres par la structure fine ? cela reste un mystère…

Donc pour faire court, on obtient :

  • un « train » de 4 signaux à 5 RSB différents (20 combinaisons),
  • enregistrés en 96kHz/24bits,
  • qu’il va falloir découper,
  • puis aligner entre eux afin d’en extraire la substantifique moelle (y’a pas que l’audio dans la vie… vous lisez trop le blog !) :

 

TrainH&O

C’est un algorithme Matlab qui va découper ce train, aligner les signaux (ici sur l’enveloppe) et extraire signal et bruit. Il ne restera plus qu’à recalculer le RSB à la sortie.

Conditions de test :

  • Signal ISTS, bruit IFnoise (même densité spectrale de niveau), téléchargeables sur le site de l’EHIMA
  • Appareil réglé selon méthodologie fabricant, dont le niveau de sortie pour l’ISTS à 65dB SPL d’entrée a été fixé dans un coupleur 2cc sur cible DSL 5.0a (EAR + RECD HA2) sur la base d’un audiogramme normalisé KS100 (sans inconfort entré)
  • Cabine : TR 0,23s et BDF 27dBA
  • HP : 1 à l’avant (émission de l’ISTS) à 0.70m et 2 à l’arrière (émission de l’IFnoise) à 135 et 225°, à 1,5m chacun
  • Etalonnage du niveau d’émission de l’ISTS par sonomètre au niveau du micro de l’AA par Leq 30s en dBA; étalonnage identique pour l’IFnoise
  • Emission du signal numérisé par lecteur Cowon PLENUE 1 relié en optique au convertisseur D/A d’un ampli NAD C375 BEE
  • enregistrement en fond de coupleur HA1 ou HA2 par un microphone DPA 4061 en 96kHz/24bits, en acquisition sur enregistreur Roland R26
  • enregistrement en parallèle (micro de référence) par un microphone BEHRINGER ECM8000 afin de vérifier la RSB à l’entrée
  • Calibration des deux microphones avant enregistrements par calibrateur B&K 4231
  • Découpage, extraction et calcul du RSB à la sortie de l’AA par un code Matlab sur les 30 dernières secondes de chaque mesure (afin de laisser les algos se stabiliser) pour l’enregistrement de l’appareil, et pour l’enregistrement de référence

Le premier testé sera un appareil qui ne prêtera pas à polémique, puisqu’il n’est plus diffusé : un Widex Inteo 19, de 2006 si j’ai bonne mémoire. Il y a eu 3 générations de circuits après cet appareil (puces Mind, Clear puis Dream).

On obtient, par exemple à RSB -10dB, la séparation des signaux :

 

Exemple fig extraction RSB-10dB

 

Voici sa progression :

 

IN19

 

Pas d’amélioration du RSB, sauf à -10dB (lissage du bruit par la compression WDRC, j’en avais parlé dans l’article précédent) et détérioration (légère) du RSB à +10dB par l’effet inverse (= un lissage des crêtes du signal utile).

On retrouve tout à fait les résultats décrits par Taylor & Johannesson en 2009 (le Widex Inteo avait un temps de retour variable, comme le lièvre, mais plutôt long) :

 

Capture

 

Par la même occasion, si vous avez eu la patience de lire la thèse de Miller (2013), les résultats étaient quasi identiques avec son successeur, le Widex Mind 440.

Je précise : les autres fabricants ne faisaient pas mieux à l’époque, voire plutôt moins bien.

 

A suivre…

*RSB = Rapport Signal sur Bruit :

 

RSBfreq

 

Ces articles sont le fruit d’un cheminement intellectuel (le grand mot !) démarré avec Alexandre GAULT et Jean-Baptiste DELANDE (Advanced Bionics), puis continué (et brillamment finalisé !) par Franck LECLERE pour la partie systématisation et précision de la mesure.

Je me suis décidé aussi à communiquer un peu sur le sujet à la suite (et c’est nouveau dans l’histoire de la profession) d’affirmations de plus en plus nettes de fabricants mettant en avant les performances dans le bruit de leurs appareils auditifs. Car vous l’aviez peut être remarqué, jusqu’à maintenant si les arguments de discrétion, joliesse, communication, confort, couleur, design, fiabilité, consommation, dynamique, épilation du maillot, bonheur absolu, etc, etc, pleuvaient sur nous et nos patients concernant ces beaux et nouveaux modèles, une donnée cruciale manquait : « Et ça améliore le rapport signal/bruit, un appareil auditif ? ».

Vous ne vous étiez peut être jamais posé la question, pensant que, bien sûr, avec les progrès des appareils actuels et depuis l’invention du microphone directionnel adaptatif, le bruit était atténué et la parole était mise en évidence ( = la rapport signal/bruit s’améliorait donc). Bien sûr…

Et pourtant, jamais jusqu’à aujourd’hui, nous n’avions lu ou entendu telle affirmation… ni son contraire.

Ni son contraire ???? Un appareil auditif pourrait-il détériorer le RSB ??? Arff…

Nous profitons de ce moment de doute pour ouvrir une « séquence histoire » :

Première époque

En 2004, Hagerman & Olofsson décrivent une méthode d’extraction de la parole du bruit à la sortie d’aides auditives en deux mesures successives : en connaissant le RSB à l’entrée d’une aide auditive il était donc possible de reconstituer le RSB à la sortie de l’aide auditive. Ils créent pour cela deux signaux :

  • un signal « classique » qu’il nomment SplN. C’est un fichier mono sur lequel on trouve le signal « utile » (ICRA) et le bruit dont le niveau varie au cours du temps afin de tester divers RSB
  • un signal inversé en phase qu’ils nomment SmN identique au premier, sauf que le bruit (N) a subit une rotation de 180° de sa phase, avec toujours une variation identique du RSB

Deux mesures successives sont réalisées avec chaque modèle d’appareil testé (anonymes dans l’article). SplN et SmN sont ensuite récupérés à la sortie de l’aide auditive. Une fois ces signaux vectorisés, deux calculs permettent d’extraire bruit et parole séparément : SplN + SmN = 2S (ou signal +6dB, les signaux s’additionnant en phase), puis SplN – SmN = 2N (ou bruit +6dB, idem). On connaissait le RSB à l’entrée, par reconstruction, on peut reconstituer le RSB à la sortie… magique !

Verdict en 2004 : aucun appareil testé n’améliore le RSB, tous le dégradent… Oui… mais ça c’était avant !

Seconde époque

Nous faisons un bond dans le temps pour arriver en 2009. Les appareils ont bien changé. Des automatismes de tous crins font leur apparition, les multicanaux sont la norme et les anti-larsen entrent sérieusement dans la partie. Tout cela constitue un indéniable progrès pour la précision de l’adaptation et le confort du patient (j’ai bien dit « confort », pas performance…), mais, croyez-moi sur parole, il devient de plus en plus difficile d’appliquer la procédure de séparation de signaux de Hagerman & Olofsson, pour des raisons que vous ne lirez jamais dans les articles de l’époque, mais qui sont, pour faire simple, un « time shifting » (allongement du signal entre deux mesures par l’appareil, de quelques ms ou plus), rotations de phases des anti-larsen rendant le calcul à partir de SplN et SmN très aléatoire dans le temps de mesure, automatismes de RB et mic. dir. s’enclenchant de manière aléatoire pendant la mesure…

Bref, c’était beaucoup plus facile en 2004 avec les appareils « simples » de l’époque !

Cette mesure est essentiellement une mesure de labo, faite par des gens qui peuvent désactiver à loisir telle ou telle fonction, comme le montre l’article de Taylor & Johannesson dont j’avais parlé à un EPU. Ils démontrent qu’une compression trop rapide détériore le RSB lorsque qu’il est positif, par lissage des crêtes de la parole, et inversement dans beaucoup de bruit par lissage des crêtes du bruit; que le nombre de canaux n’améliore pas le RSB à la sortie de l’AA (ah bon ! on nous l’avais pourtant promis !), etc.

Nous sommes là dans des conditions de tests à coeur ouvert, où les ingénieurs peuvent à loisirs inhiber tous les automatismes et les isoler afin d’en tester l’efficacité séparément. Mais en tout cas on en est toujours au même point : pas de franche amélioration du RSB en sortie de l’aide auditive… Et plutôt une dégradation.

Troisième époque

Une thèse (ici dans sa version préliminaire) : Miller, en 2013. Les appareils testés sont ici plus proches de nous (Widex Mind-440, Phonak Ambra, Oticon Acto Pro) et la méthode utilisée est dérivée de celle de Hagerman & Olofsson, en utilisant 4 signaux +S+N, -S+N, -S-N et +S-N. La parole est extraite par le processus mathématique (+S+N) + (+S-N) et le bruit (+S+N) + (-S+N). Un facteur de qualité de l’extraction, ou « erreur » est obtenu par (+S+N) + (-S-N) dont le niveau RMS doit rester 20dB inférieur au plus faible niveau des deux signaux extraits (bruit et parole), et ce, à chaque RSB testé.

Comme toujours lors de la lecture de ces tests, on reste surpris (quand on connait la difficulté de l’extraction due à l’imprévisibilité des appareils) de l’absence d’évocation des moyens employés pour « fixer » les appareils, surtout ces derniers testés, dans un état stable. C’est à dire, en gros, en désactivant l’anti-larsen et le choix automatique du mode (parole, parole dans le bruit, bruit seul, musique, TV, etc.).

Mais bon, tout le monde a sa petite combine qu’il veut garder secrète, c’est normal…

Résultats ? AUCUN de ces appareils testés n’améliore de plus de 0,5dB le RSB à la sortie…

Là j’entends un grand silence, je ressens une angoisse, je vois déjà le trouble nous envahir… C’était il y a…trois ans pour ces modèles, voire un peu plus. Deux générations se sont succédées depuis, avec moult promesses, certes, mais aussi ne boudons pas notre plaisir, la « sensation » que la technologie devient plus confortable dans le bruit, voire des fois, plus efficace. « Plus efficaces dans le bruit », le mot est lâché.

En utilisant les travaux de Miller, avec un processus d’alignement des signaux permettant une extraction plus facile et précise, en reprenant en en essayant de pousser un peu plus les superbes travaux de Franck LECLERE réalisés dans ce sens lors de son mémoire de D.E., nous essaierons au fil du temps de vous faire profiter de ces mesures sur des appareils dernier cri, dans ce blog.

Pour que l’argument technique des fabricants ne se résume pas à une soirée petits-fours 😉

Prochain sur la sellette : oh puis non, on verra bien selon l’humeur !

A plus !

Dans son livre « La machine à écouter » (Masson, 1977), l’acousticien E. LEIPP décrivait un cas (p. 166) rapporté par un certain RADAU en… 1867:
(je cite) « Une dame, assez sourde pour ne pas comprendre la parole normale, se faisait accompagner par sa bonne qui jouait du tambourin pendant qu’on lui parlait: elle percevait alors chaque mot ! ». A l’époque, cette dame passait au mieux, pour une « originale », au pire, pour une folle !
Le cas avait cependant intrigué ce monsieur RADAU, au point qu’il le cite dans son ouvrage « Acoustique », en 1867 donc.
A partir des années 60, quand l’usage des sonagrammes s’est répandu, il est devenu possible de « voir » la parole et du même coup, l’effet du bruit sur la perception de la parole. LEIPP à cette époque décrit la perception dans le bruit qui dégrade le message vocal, mais se demande si dans certains cas, notamment pour les sujets présentant une baisse du seuil d’audition, le bruit de fond, à faible niveau, ne « comblerait pas les vides entre les syllabes », évitant à ces personnes une perception hachée quasi-inintelligible.
Je m’explique: l’enchainement des syllabes, très variable en intensité se situe tantôt au-dessus du seuil, tantôt au-dessous, créant ainsi des « micro-interruptions » du signal; très pénalisantes pour le malentendant. LEIP se demandait alors si le tambourin de la vieille dame, avec son spectre large, ne comblait pas ces vides, le cerveau se chargeant de faire le reste…
Sans aller jusqu’à rajouter du bruit, on pourrait obtenir le même phénomène d’interruptions (temporelles) avec des compressions agissant dans la gamme énergétique du signal vocal. On ferait alors plus de mal que de bien !
Bien entendu, on ne connaissait pas encore à l’époque l’importance des transitions de formants, permettant de percevoir certains phonèmes même sans les entendre, mais l’hypothèse audacieuse s’est révélée juste: la vieille dame n’était pas folle !
Pourquoi je vous dis tout ça: car je viens de recevoir « Essentiel D6 » n° 22 – juin 2009 de SIEMENS (bientôt téléchargeable sur France Audiologie), et oh, surprise ! en page 2 on y parle des effets néfastes de l’interruption syllabique par des réducteurs de bruit inappropriés.
Merci, vieille dame inconnue !

Xavier DELERCE.

Bienvenu

Bienvenu chez Blog-Audioprothesiste.fr !

Qui Sommes nous ?

Contactez nous !

Je contacte Sébastien
Je contacte Xavier
Je contacte Jean Michel