La mesure in vivo est souvent vue comme une mesure du spectre à long terme d’un signal après son amplification par l’appareil auditif. Donc une mesure spectrale.
Les cibles de gain ou de niveau de sortie nous donnent des indications afin, dans chaque bande de tiers d’octave, de fournir tel ou tel gain ou niveau de sortie.
Mais si un bruit blanc ou rose est constant dans le temps (que son spectre soit mesuré sur 1 ou 30″, il est le même), cela fait bien longtemps que l’on ne teste plus les appareils avec ce genre de signal. Aujourd’hui, le signal de test le plus utilisé est l’ISTS, au caisson ou in vivo. Ce signal est un signal de parole, très fluctuant dans le temps et dont le spectre dans les premières secondes n’est pas forcément représentatif du spectre à long terme (sur 1 minute par exemple) :
Lorsque l’on regarde ce signal, plusieurs interrogations :
- Combien de temps mesurer ? la minute complète du signal ou 5 secondes ?
- Comment avoir une idée de la répartition de l’énergie dans le temps ? (en clair, est-il possible d’avoir une représentation temporelle et non spectrale du signal)
- Doit-on faire la mesure sur la moyenne des derniers événements acoustiques qui se sont passés dans la seconde ? Des 5 dernières secondes ? Plus ?
- La mesure du spectre à « long » terme :
En mesure in-vivo du niveau de sortie appareillé (REAR) la cible (DSL ou NAL) correspond au spectre moyenné sur le long terme. Mais « long terme » combien ? Si vous mettez « 1 seconde », le spectre va changer en permanence en fonction de la composition fréquentielle au cours du temps, et si vous mettez « 30 secondes » votre courbe sera certes être très stable, mais après un changement de réglage pendant la mesure, il vous faudra 30 secondes pour en voir l’effet…
L’astuce consiste alors à effectuer une moyenne glissante : la mesure se fait en continu (case « Mesure continue » cochée), mais, par exemple ici, seuls les événements des 8 dernières secondes comptent dans la moyenne (« Temps de mesure 8s. » + « Mesure continue » = temps d’intégration (moyenne) glissant(e) sur 8 secondes) :
- Combien de temps mesurer :
Là, ce n’est pas paramétrable, ou alors il faut définir le paramètre « Temps de mesure » et décocher « Mesure continue » : la mesure s’arrêtera quand le temps sera atteint. Dans ce cas, le spectre à long terme serait intégré sur 8 secondes puis la mesure s’arrêterait.
Une autre solution consiste à laisser le signal tourner en boucle avec « Mesure continue », et à arrêter ni trop tôt ni trop… quoi ? J’en avais déjà parlé : il est important de laisser la mesure en niveau de sortie appareillé (REAR) se faire au moins 18 secondes, et laisser passer le phonème /ch/ présent dans l’ISTS et qui fait littéralement exploser le niveau de sortie à 2/4KHz avec certains appareils dont le premier TK dans la zone 2/4kHz est un peu trop haut; il est présent vers 12/15 secondes.
En conséquence, une mesure sur 15 à 20 secondes semble bien et permet de modifier un ou deux réglages et d’avoir le temps d’en visualiser l’effet (8 secondes après dans l’illustration ci-dessus). Le temps de mesure se fait au jugé par l’audioprothésiste, et en général, on peut se fixer un repère d’arrêt, par exemple vers ce qui ressemble à « poderos » dans l’ISTS (env. 18 secondes).
AN: bien sûr, en mesure de gain d’insertion, le temps n’est pas aussi important puisqu’en général le REIG est le même au cours du temps (à 1 ou 2dB près). Les premières secondes de la mesure donnent la « bonne » mesure. Compter donc 5 à 10 secondes de mesure en REIG pour laisser à l’appareil le temps de se stabiliser.
- Analyse temporelle « de base » = min/max :
Jusqu’à maintenant c’est du spectral (niveau/fréquence), mais la chaîne de mesure peut analyser, dans le temps et dans chaque tiers d’octave, les événements les plus forts (les crêtes du signal, niveaux dépassés seulement 1% du temps) et de plus faibles intensités (les vallées du signal, niveaux dépassés 70% du temps).
Case à cocher: « Afficher min. -max », sans cocher aucune des autres cases (très important). Vous obtiendrez alors la dynamique du signal de parole (à environ +12/-18dB du spectre à long terme). Cette dynamique n’est pas calculée avec la même moyenne que « Temps de mesure » (ici les 8 dernières secondes du signal mesuré en sortie), mais elle a sa propre constante de mesure, qui est d’environ 5 secondes. Donc vous pouvez avoir une constante de mesure pour le spectre à long terme, alors que les événements « min/max » (vallées/crêtes) ont leur propre constante de temps de 4,6 secondes. Pourquoi 4,6 secondes ? parce que la fenêtre temporelle d’analyse est de 23ms, mais que le câble USB ne pouvant pas transporter autant d’informations, deux blocs d’analyse de 23ms sont moyennés, ce qui donne une fenêtre globale de 46ms (information reprise brute d’Interacoustics). Et comme il faut faire au minimum 100 mesures pour faire une analyse percentile a minima, on a donc 100*46ms= environ 4,6 secondes, temps minimal d’intégration.
Cet affichage vous donne la dynamique du signal avec une résolution fréquentielle de 43Hz.
- Analyse temporelle « renforcée » :
Au lieu de cocher « Afficher min. _max », qui correspond à des valeurs « percentile 30<–>percentile 99 », vous souhaitez définir vous même l’analyse percentile du signal. Vous allez donc cocher et définir les zones qui vous intéressent dans « Analyse percentile ». En passant, si vous cochez 30% et 99%, ça revient au même que « »Afficher min. _max »…
Donc à réserver à ceux d’entre nous qui veulent plus… pointu, genre analyse du 39ème percentile !
Cette analyse se fait sur les mêmes constantes que « min/max. »= 4,6 secondes, quelle que soit la constante de temps utilisée pour l’intégration du LTASS, et pour les mêmes raisons citées précédemment.
- Analyse percentile « idéale » (normalisée IEC 60118-15) :
Toutes les chaînes de mesure analysent le signal par fenêtres temporelles successives. La fenêtre temporelle est fonction de la fréquence d’échantillonnage du signal, et du nombre de FFT chaque secondes. Par exemple, en échantillonnant à 44100Hz avec 1024 échantillons (FFT), on obtient une résolution temporelle de 1024/44100=23ms. C’est le cas de l’Affinity qui peut réaliser une analyse toutes les 23ms, mais dont le port USB limite en réalité la vitesse à 46ms. Deux blocs de 23ms sont donc « moyennés » afin de pouvoir être transmis par la connexion USB. Comme son nom ne l’indique pas vraiment, l’analyse percentile analyse le signal dans le temps (ce n’est plus du spectral) afin d’en donner la répartition des différents niveaux en pourcentage, par tranches de 1%.
Après une analyse percentile en règle, la chaîne de mesure sera capable de vous dire que 37% du temps, le signal a dépassé telle valeur; que 2% du temps il a dépassé telle valeur, etc.
Donc, pour faire une analyse percentile correcte, il faut faire 100 mesures, au minimum. C’est ce à quoi correspond la case à cocher « Centiles pour mesure complète ». Certes, vous le remarquerez, la chaîne de mesure affichera bien la dynamique du signal sous forme de petits rectangles dans chaque bande de tiers d’octave (voir graphique ci-dessous pour analyse percentile 30/99) avant d’avoir atteint 18 secondes, mais cette analyse percentile ne sera complète (et donc fiable) qu’à partir de 46 secondes, car 100 perceptibles x 10 échantillons de chaque x une fenêtre temporelle de 46ms = 46 secondes (les crêtes et vallées se figent alors progressivement au cours de la mesure):
Ce qui implique que si vous décidez de cocher cette option (recommandée…), vous avez alors deux constantes de temps en jeu: le spectre à long terme qui évolue ici dans une fenêtre glissante de 8 seconde, et l’analyse percentile qui elle, évolue dans un autre espace-temps (Igor et Grichka BOGDANOV, sortez de ce corps !!!!!), de 15 à 46 secondes. Vous l’avez peut être expérimenté: vos changements de réglages se voyaient relativement vite sur le LTASS, mais très lentement sur les crêtes/vallées en cochant « Centiles pour mesure complète » ou « Régler les paramètres sur IEC 60118-15 ». Mais peut être n’aviez-vous pas osé…
AN: sans cocher cette option, il ne sera pas possible de cocher et donc d’obtenir la valeur suivante « Ratio de compression de la dynamique vocale ».
A l’écran, la zone dynamique donne progressivement la sensation de se « figer » au fur et à mesure que le test progresse. Une modification de réglage ne se visualisera alors quasiment pas sur la dynamique (à moins de refaire une mesure) alors qu’elle se visualise plus rapidement sur le spectre à long terme.
***Astuce quand même : vous pouvez relancer la moyenne glissante sans relancer la mesure en cliquant pendant le test sur « l’ascenseur de niveau » (sous 65dB) à la droite du graphique !!!***
- 1/3 octave and overlapping time windows:
Paramètre modifiant la zone temporelle d’analyse, en l’élargissant sur une fenêtre de 92ms, ce qui se rapproche de la norme de mesure IEC 60118-15. Cette norme définit les paramètres de mesure permettant une analyse percentile standardisée, mais également, pour ce qui suit, le calcul du ratio de compression de la dynamique vocale. Surtout, elle définit une fenêtre temporelle de 125ms, qui en l’état technique actuel, est très difficilement atteignable à un coût raisonnable avec nos chaînes de mesure, si on veut conserver une fréquence d’échantillonnage de 44100Hz. En effet, pour obtenir une résolution fréquentielle de 125ms, il faudrait recueillir 0,125ms x 44100Hz = 5512,5 échantillons.
L’overlapping consiste à effectuer un chevauchement de plusieurs fenêtres temporelles afin de se rapprocher au plus près de la fenêtre idéale normalisée de 125ms. Si on raisonne par blocs temporels de 46ms, deux blocs successifs forment bien un bloc de 92ms, mais entre deux FFT, le convertisseur est « aveugle ». Le chevauchement (« overlapping ») consiste donc à appliquer un fenêtrage temporel de manière à ce que deux blocs temporels successifs se chevauchent de 50%. On ne perd donc pas d’informations comme avec deux blocs successifs.
Vous trouverez des informations sur ces points dans ce document de travail qui a précédé la norme IEC 60118-15.
Cet affichage vous donne la dynamique du signal avec une résolution fréquentielle d’un tiers d’octave (bandes d’analyse de 43Hz à l’origine, mais pondérées par calcul en 1/3 d’octaves).
- Ratio de compression de la dynamique vocale:
Ca c’est encore une autre histoire et je vous en avais déjà parlé.
Il s’agit de la case à cocher « Show dynamic compression ratio » qui vous donne dans chaque tiers d’octave la compression de la dynamique vocale entre l’entrée et la sortie sous forme de chiffres de 0.xx à plus de 2 (mais rarement plus de 2 quand même). Ce calcul n’est pas possible sans avoir modifié la fenêtre temporelle d’analyse à 92ms par le paramètre « 1/3 octave and overlapping time window ».
Afin de pouvoir mesurer le ratio de compression du signal à la sortie par rapport au signal à l’entrée, il va falloir que la chaîne de mesure les aligne temporellement de façon très précise (précision du décalage inférieure à 10ms), afin d’être sûr que l’on compare bien les même échantillons temporels:
Sans cet alignement, les mêmes zones temporelles (et donc spectrales) ne seraient pas analysées avant/après, ne permettant pas un calcul fiable du ratio de compression de la dynamique vocale.
AN: ce calcul de ratio nécessitant de connaître le signal à l’entrée pour le comparer au signal de sortie (d’où l’alignement des deux signaux), la chaîne de mesure crée alors un fichier .spectra avant la mesure. Il n’est donc pas possible d’effectuer ce calcul « à la volée », c’est à dire en live avec le Visible Speech.
Cet alignement est absolument nécessaire également au calcul du gain.
Pour aller plus loin dans la compréhension de ces analyseurs spectraux et temporels que sont nos chaînes de mesure, je vous conseille la lecture de ce document passionnant in french dans le texte pour une fois (merci Franck 😉 ).
Bons paramétrages !
Et bon WE à tous !!
Merci à Dennis Mistry (Interacoustics) pour ses explications.
MAJ