Dé-crêter* est-il toujours bien ?

* Vous le savez maintenant, les jeux de mots débiles à la Achille Talon sont ma spécialité… (sinon vous ne lisez pas !)

* Vous le savez maintenant, les jeux de mots débiles à la Achille Talon sont ma spécialité… (sinon vous ne lisez pas !)

J’avais évoqué il y a quelques temps la mort de l’écrêtage avec la mort de l’amplification analogique. Pour cause, toute amplification numérique ayant un délai de traitement du signal, même minime, les sons impulsionnels mettaient un certain temps à être pris en compte par le système (alors qu’un écrêtage de « old school » analogique est instantané). Certains patients sont sensibles à cela (« les couverts et les assiettes » !), et lorsque le circuit présente ce genre d’imperfection, l’enclenchement plus bas des compressions, la diminution du MPO ou l’augmentation des CR n’y changeront pas grand chose…

La parade a donc consisté à concevoir des systèmes de « gestion des bruits impulsionnels en entrée », à savoir, ne pas faire entrer dans le système certains bruits. A ce jour, beaucoup de fabricants proposent ce type de système ou cette fonction « réduction des bruits impulsionnels ».

Un exemple très frappant dernièrement a été donné par le Chronos de BERNAFON. Ce système, à l’écoute, est tout bonnement stupéfiant: les bruits d’impact et notamment l’over-shoot (pic lié au temps d’enclenchement du système) sont réellement réduits.

L’efficacité de ce système peut être mesurée par les chaînes de mesure.

Je me suis demandé si cette fonction était:

  1. efficace (tout simplement)
  2. non-destructrice (on verra ça ensuite)

Trois modèles ont été programmés « logiciel » sur une audiométrie à dynamique « pincée » (40dB max.). Il s’agit:

  1. du BERNAFON Chronos 7 CP
  2. du PHONAK Ambra micro P
  3. du WIDEX Clear 3 Fusion (éc. M)

Ces trois modèles sont censés réduire les bruits impulsionnels et cette fonction a été testée sur « off », « moyen » et « max ». La séquence de test consiste en l’émission d’un son à 40dB SPL avec une montée brutale à 100dB SPL, puis relâchement:

 

 

Principe du test

Le graphe ci-dessus illustre le principe du test et une mesure (avec un très vilain AA dont je tairai la marque).

Le but du test est de vérifier si l’over-shoot (le pic à la montée en intensité du signal) est diminué, et quelles sont les conséquences éventuelles (dommages collatéraux) de ce traitement.

Pour BERNAFON:

 


Déjà, le pic (over-shoot) est important lorsque le système est désenclenché (courbe fine du haut). L’activation « moyenne » (proposée par défaut, courbe grasse) le réduit très efficacement de quasiment 20dB mais laisse apparaître un tout petit temps de latence du système pour revenir au gain optimal après enclenchement. L’activation « maxi » ne réduit pas plus l’over-shoot, mais en plus, retarde la remonté en gain sur quasiment 150ms. A déconseiller en « maxi » semble t-il, et déjà très efficace en « moyen », donc.

Pour PHONAK:

 


L’over-shoot est très présent en « off »: le système est vraiment nécessaire. De fait, il s’avère très efficace en « moyen » (courbe grasse) en réduisant de plus de 20dB le pic, pas nettement mieux en « max », mais sans temps de latence de retour.

Pour WIDEX:

 


Là, on a un cas d’école, puisque d’emblée (système en « off »), l’appareil ne présente pas d’over-shoot, donc théoriquement pas besoin de ce traitement de signal. De fait, l’enclenchement du système ne fait pas varier le pic, puisqu’il n’y en a pas. On introduit juste une latence de retour là où il n’y en avait pas. La technique de réduction de bruits impulsionnels en entrée (ne pas les faire entrer dans le système) semble déjà bien marcher.

 

Donc ces systèmes fonctionnent bien (ouf !), voire n’ont pas lieu d’être (la classe !).

Mais attention aux limites: ces systèmes sont très performants. A utiliser en toute connaissance de cause, voire, à brider par les fabricants (les enclenchements « max » semblent n’apporter rien de mieux sur les modèles testés). Le « super -écrêtage », semble, dans certains cas, introduire une latence de retour à l’équilibre, avec des conséquences potentielles sur l’intelligibilité.

Priver le malentendant des informations « extrêmes » de la parole n’est pas sans conséquences sur la perception de la parole: une voix considérée comme « moyenne » véhicule des informations utiles dont l’intensité varie dans une gamme très large de niveaux sonores. Une fois amplifiés, les pics (pour parler d’eux) seront souvent les seules informations vraiment accessibles à un malentendant, et plus encore en situation bruitée.

Imaginons un malentendant dans un restaurant: des voix et des fourchettes dans les assiettes… Les fabricants nous promettent de différencier les bruits d’impacts de la parole. On espère pour les plosives !

Pour tenter d’apporter une réponse à la question première « faut-il écrêter ? », je pense qu’il faut rester prudent avec ces systèmes, qui sont, faut-il le rappeler, ici pour palier aux imperfections des circuits. En cherchant à tout prix à « lisser » le signal, on risque en supprimer les contrastes avec des systèmes poussés à leurs maxima.

Les crêtes d’un signal vocal sont d’ailleurs considérées comme les informations les plus utiles, y compris chez le normo-entendant, voir cet article de Drullman.

L'écrêtage est mort: vive l'écrêtage !

Pour faire suite au billet de Sébastien concernant le PC, je voulais apporter mon point de vue et faire un petit récapitulatif de ces petites merveilles de traitement du signal que l’on voit fleurir depuis quelques années dans les aides auditives sous les noms de SoundSmooth (Siemens), AntiShock (Unitron), SoundRelax (Phonak) Compression tZéro (Widex), etc… Derrière ces noms très étudiés par les bureaux de marketing se cachent vraiment des systèmes qui améliorent la vie des malentendants appareillés.

Pour faire suite au billet de Sébastien concernant le PC, je voulais apporter mon point de vue et faire un petit récapitulatif de ces petites merveilles de traitement du signal que l’on voit fleurir depuis quelques années dans les aides auditives sous les noms de SoundSmooth (Siemens), AntiShock (Unitron), SoundRelax (Phonak) Compression tZéro (Widex), etc… Derrière ces noms très étudiés par les bureaux de marketing se cachent vraiment des systèmes qui améliorent la vie des malentendants appareillés.

Avant (toujours cette fameuse préhistoire d’il y a une 10aine d’années !), lorsque les aides auditives étaient analogiques, les choses étaient simples : soit les aides auditives étaient pourvues d’un réglage spécifique de l’écrêtage et l’audio déterminait son « MPO », soit ce réglage n’était pas disponible et le système atteignait sa propre limite, dictée par le circuit ou l’écouteur. Par contre, cet écrêtage avait le mérite d’être quasi-instantané, et tellement efficace… qu’il en créait des distorsions.

Donc, sur les dernières années de l’analogique (et les premières du numérique) sont apparues les compressions en sortie de facteur élevé (AGCo de facteur 10, par exemple) qui avaient le mérite de ne pas créer de distorsions, comme tout AGC qui se respecte, mais qui a vu les plaintes de gêne aux bruits impulsionnels (couverts, assiettes, interrupteurs, etc…) augmenter.

Pourquoi ? Car tout système de compression fonctionne avec un temps d’attaque (et de retour), et même si les niveaux forts étaient maîtrisés, le temps que le système se mette en marche, le bruit avait déjà généré une gêne :

Temps d'attaque d'un AGCo et d'un système d'écrêtage en entrée
Comparaison des TA d'un système AGCo et d'un système à détection de bruits impulsionnels en entrée (Widex MIND)

La courbe verte en gras d’une aide auditive avec limitation par AGCo (une aide auditive récente), génère un artefact de plus de 10dB (le « pic » à plus de 115dB SPL) avant que la compression d’attaque ne régule le signal : il peut y avoir gêne chez certains patients.

Est-il possible d’installer un « vrai » écrêtage sur les aides auditives numériques ? Non, au sens montage électronique du terme, mais également à cause du temps de traitement du signal du processeur, qui varie de 1 à plus de 5ms, et induit donc un décalage temporel entre le bruit impulsionnel et son traitement par l’appareil. Et s’il y a délai de traitement, on ne peut pas parler strictement d’écrêtage.

Mais les fabricants ont trouvé la parade, en traitant les sons impulsionnels AVANT leur entrée dans le processeur. Il me semble que le premier à avoir abordé le problème sur les AA numériques est Philips avec sa gamme D61 et dérivés il y a une dizaine d’années. Il y avait bien des réglages appelés PC chez les différents fabricants mais il aura fallu attendre ces dernières années pour que le problème soit en passe d’être réglé avec la démocratisation de ces systèmes de détection des bruits impulsionnels.

La mesure faite avec une ce ces aides auditives de dernière génération, un Widex MIND avec système « tZéro » (courbe fine du graphique du dessus,) montre que le passage de 40 à 100dB SPL ne génère pas d’artefact dû au temps d’attaque (le système est instantané) : pas de gêne, on retrouve un fonctionnement de type Peak Clipping, les distorsions en moins.

Le schéma simplifié de ce traitement donne :

Schéma de la compression tZéro de Widex
Schéma du principe de fonctionnement de la compression tZéro du Widex MIND

L’avantage d’un tel système, on le comprend facilement, est de ne même pas faire rentrer les sons impulsionnels dans le circuit de traitement du signal. L’inconvénient induit serait de faire n’importe quoi si le système n’était pas « bridé » par les fabricants.

En conclusion, les notions d’écrêtage ou de PC (Peak Clipping), bien qu’historiquement ancrées dans nos têtes d’audioprothésistes, ne sont plus adaptées au traitement numérique du signal, pour des raisons pratiques (montage électronique) ou temporelles (temps de traitement du signal par le processeur). L’écrêtage tel que nous l’avons appris est bien mort: vive la « détection des bruits impulsionnels en entrée » ! Ca fait plus classe… et des patients contents !

XD. Merci à Alexandre GAULT pour son infographie du schéma tZéro de Mind.