Efectos de la frecuencia de estimulación en la percepción del habla en pacientes con prótesis coclear con estrategia cis

Leonor Aronson (Departamento De Implante Coclear – Fundación Arauz)
Licenciada Norma Pallares MA (Centro de Implantes Cocleares Profesor Diamante y Universidad del Salvador Buenos Aires, Argentina)


Abstract
Se midió la percepción del habla en 8 pacientes adultos postlinguales que utilizan la estrategia CIS del sistema Combi 40+, variando la frecuencia de repeticion por canal (FRC) desde 1515 a 200 pulsos por segundo por canal (pps/c). Se utilizó una batería que incluye identificación de consonantes, reconocimientos de monosílabos, transiciones vocálicas, oraciones de uso cotidiano y habla fluída. Asimismo se evaluó la sonoridad en función de la FRC de estímulo. El objetivo es mediante el estudio de los porcentajes de respuestas correctas que se obtienen, ver si existe una FRC óptima. A pesar de las variaciones en las características de los pacientes, se observa que al disminur la FRC se produce un decremento en los scores, para todos los tests administrados. El análisis de los resultados parece indicar que para test que involucran una mayor dificultad para la comprensión, consonantes, monosílabos, transiciones vocálicas, la FRC juega un rol más preponderante que para aquellos tests, oraciones de uso cotidiano, velocidad de comunicación, en los cuales el contexto semántico compensa el decremento de las pistas temporales provistas por la estimulación. En los tests de mayor dificultad, (los tres primeros mencionados), los scores más elevados se obtienen para 1300 y 1200 pps/c. Aumentando a 1515 pps/c, máxima freuencia de repetición por canal posible del sistema, no se obtiene un incremento en los scores. Para los tests de oraciones y habla fluída, los mayores scores se obtienen para 1515 pps/c. Es interesante observar los altos porcentajes obtenidos para FRC de 200 pps/c para todos los tests efectuados, especialmente aquellos que llamamos de baja dificultad. Asimismo, para todos los pacientes, la FRC esta directamente asociada a la sonoridad. Podría concluirse que la máxima frecuencia de estimulación por canal provista por un sistema no tiene que ser necesariamente la más adecuada. Variaciones en las características individuales como resto neuronal, etiología, antigüedad de la sordera, podrían influir en el valor de la óptima FRC para cada individuo.


Introducción
La incorporación de las estrategias de procesamiento del habla de alta velocidad de estimulación en las prótesis cocleares, significó un cambio muy importante en los beneficios que obtienen los pacientes implantados.
El número óptimo de electrodos y su relación con la velocidad de estimulación ha sido estudiado por Brill y colaboradores (1) quienes investigaron la interrelación entre el número de electrodos activos y la velocidad de estimulación por canal en pacientes que utilizan la estrategia CIS (Continuous Interleaved Sampling) (2-3). En un trabajo realizado sobre 4 pacientes adultos ellos reportaron que la inteligibilidad del habla no estaba necesariamente relacionada con el máximo número de canales posibles de utilizar y sugirieron que se podría elegir los aproximadamente 6 mejores electrodos para cada paciente y estimularlos a altas velocidades de repetición.
Arndt y colaboradores (4) realizaron un estudio comparativo entre sujetos que utilizan estrategias rápidas de estimulación con el sistema Nucleus 24 y evaluaron los resultados obtenidos en la percepción del habla, variando las velocidades de estimulación por canal en las estrategias CIS y ACETM (Advance Combination Encoders). Algunos pacientes mejoran los porcentajes de respuestas correctas al aumentar la velocidad de estimulación pero la velocidad óptima no es la misma para todos los pacientes. Para pacientes que utilizaron la estrategia CIS con 12 canales, la frecuencia de estimulación óptima resultó ser de 900 pps/c para algunos y de 1200 pps/c para otros (siendo esta última la máxima frecuencia de repetición por canal que posee el sistema Nucleus 24).
Skinner y colaboradores (5) estudiaron los efectos producidos por la velocidad de estimulación en los umbrales de percepción y niveles máximos de confort, en pacientes con prótesis Nucleus 24. Los autores afirman que los umbrales de percepción son sustancialmente menores a altas velocidades de estimulación, 1615 y 1800 pps/c (pulsos por segundo /canal) que a bajas velocidades de stimulación, 250 y 720 pps/c , para valores absolutos del nivel de corriente de estimulación menores a 190. Para valores más altos que 190 niveles de corriente, la dependencia de los umbrales con la frecuencia de repetición por canal es mucho menor.
En pacientes de habla hispana implantados con el sistema Combi 40+, Aronson y colaboradores estudiaron la influencia del número de canales activos y de la frecuencia de repetición por canal, en la percepción del habla (6),
En este trabajo se estudia la influencia que la velocidad de estimulación por canal ó frecuencia de estimulación por canal (FEC) ejerce sobre la percepción del habla, en pacientes adultos postlinguales que utilizan la estrategia CIS en el sistema COMBI40+ (C40+) (7-8). El propósito es evaluar el comportamiento de los pacientes cuando se varía unicamente la velocidad de estimulación por canal de su procesador de sonidos entre 200 y 1515 pulsos por segundo por canal. La percepción de la sonoridad es influenciada por la frecuencia de repetición por canal (Skinner ibid). En este trabajo se determina, asimismo, los efectos de la FEC sobre la sonoridad. Adicionalmente, se trata de determinar si existe para cada uno de los pacientes una FEC óptima y observar cómo influye el material de habla empleado en los resultados obtenidos.
La estrategia CIS está basada en una estimulación no simultánea, que ofrece una representación espectral de la señal del habla a una alta velocidad de estimulación sobre cada electrodo. En los sistemas Combi40+ se libran pulsos bifásicos a 12 electrodos a una frecuencia máxima de estimulación de 1515 pps/c por electrodo lo que significa una estimulación total de 18180 pps.
La alta velocidad de estimulación podría ofrecer una mejor resolución temporal de la señal lo que significa una mejor representación de las variaciones temporales finas del habla.
Lo que no es posible determinar a priori es cual es la frecuencia de repetición por canal óptima para cada paciente. No está claro si un aumento de velocidad implica mejoras en la percepción del habla. Podría ocurrir que para pacientes con un resto neuronal muy pobre, un aumento en la velocidad de estimulación signifique una " exigencia" que el sistema neuronal residual no puede resolver. Esto tal vez podría traducirse en un " empastamiento" de la señal recibida y en una desmejora en la percepción del paciente. Pudiera resultar que el aumento en la velocidad de estimulación no implica necesariamente un aumento en el rendimiento del paciente.
No poseemos elementos que nos permitan anticipar la condición de estimulación óptima para cada paciente y sólo podemos basarnos en la experimentación psicoacústica para buscar esa condición.


Material y Método
Sujetos

En este estudio participaron 8 sujetos adultos postlinguales, implantados con el sistema Combi 40+, utilizando la estrategia CIS. Los pacientes utilizan el procesador CIS PRO+ ó TEMPO+. Todos tenían reconocimiento del habla en formato abierto aproximadamente 1-2 meses después del primer ajuste del procesador de sonidos. Las características de cada paciente figuran en la Tabla 1.
Los tests comenzaron cuando los pacientes tenían una experiencia en el uso del procesador de sonidos de no menos de 4 meses, los valores de umbral mínimo de percepción y nivel máximo de confort para todos los electrodos activos se hallaban en valores estables y utilizaban su prótesis en forma regular. Durante el tiempo que duró este estudio, no se realizaron cambios en los niveles de estimulación del procesador de sonidos de ningún paciente. Esto es, los valores de umbral y niveles de máximo confort aceptable se mantuvieron fijos.
La frecuencia de repetición por canal (FRC) habitual, para casi todos los sujetos es de 1515 pps/c lo que implica un ancho de pulso de 26,7 µseg/fase y gap interestímulo de 1,7 µs. La excepción corresponde al paciente No8 al que fue necesario colocarle un ancho de pulso de 60 µseg/fase por lo que la máxima FRC es de 700 pps/c.
Para el filtro pasa bajo de 2º orden. detector de envolvente se utilizó el valor default de la frecuencia de corte: 400 Hz. Material de habla
El material de habla que se utilizó para estimular a los pacientes, es una batería que se diseñó especialmente para este estudio. La batería, BatteCoch (9), consta de cinco items: reconocimiento de monosílabos: se utilizaron cinco listas de 20 palabras cada una; identificación de consonantes: dieciseis consonantes /s, f, j, p, b, t, d, c, g, l, m, n, r, rr, y, ch/ en contexto /VCV/ con V = /a/; identificación de transiciones vocálicas (transiciones de formantes ): incluye 18 combinaciones usadas en nuestro idioma, /ae, ai, ao, au, ea, ei, eo, eu, ia, ie, io, iu, oa, oe, oi, ua, ue, ui/. Se utilizaron 20 listas de 18 palabras cada una, conteniendo las transiciones mencionadas; reconocimiento de oraciones de uso diario: se utilizaron 20 listas de 12 oraciones afirmativas e interrogativas cada una; habla fluida (velocidad de comunicación): se midió como palabras por minuto usando 100 textos de aproximadamente 90 palabras cada uno. Cada test se realizó con un texto completamente desconocido para el paciente según la descripción de De Filippo y Scott (10).
Para cada una de los experimentos, los pacientes fueron evaluados utilizando una sola lista de cada item. Se utilizó un material muy variado de modo de brindar a los pacientes tests no redundantes excepto, para la identificación de las consonantes.

Método

Los sujetos fueron medidos utilizando el procesador de sonidos con el programa de uso habitual colocando el nivel de volumen y sensibilidad a un nivel de audición confortable, en una habitación tranquila sin tratamiento acústico especial, utilizando voz femenina, a 2 metros de distancia del paciente. Los estímulos se presentaron una vez, sin ningún tipo de apoyo visual ni entrenamiento. Se midieron las respuestas de los pacientes a 12 diferentes FRC: 1515, 1315, 1200 y desde 1000 hasta 200 en pasos de 100 pps/c. Los tests fueron suministrados a los pacientes utilizando estas velocidades al azar, para minimizar los efectos de entrenamiento. Sin embargo, la primera serie de mediciones se realizó utilizando el mapa regular del paciente, o sea con una velocidad de estimulación de 1515 pps/c, con excepción del paciente No8 para el que, como se mencionó, se utilizó como velocidad de estimulación regular, 700 pps/c.
La secuencia de los tests fue de menor a mayor dificultad: oraciones de uso cotidiano, transiciones vocálicas, monosílabos e identificación de consonantes. El test de habla fluída se realizó en último lugar para permitir al paciente experimentar por algunos minutos, la condición de estimulación. Al finalizar cada serie de mediciones, se solicitó de cada paciente que asociara la sonoridad del programa usado, con un número, tomando como referencia el programa de uso corriente al que se le asignó arbitrariamente el número 10. De este modo se obtuvo una gráfica de sonoridad en función de la FRC del estímulo.

Resultados
En las figuras siguientes pueden visualizarse los porcentajes de aciertos obtenidos en función de la FRC y las variaciones standard para cada test. En las abcisas se disponen las FRC y en las ordenadas los scores. Las figuras 1 a 4, representan el valor medio de los porcentajes de aciertos obtenidos para los 8 pacientes, en los tests de identificación de consonantes, identificación de monosílabos, transiciones vocálicas y oraciones de uso cotidiano respectivamente. La figura 5 presenta los valores medios del test de habla fluída (velocidad de comunicación) medido en ppm en función de la FRC. En la figura 6, se muestran los valores medios de sonoridad asociada a las diferentes FRC. En este gráfico, la ordenada representa un número asignado por el paciente, asociado a la sonoridad de cada situación de estimulación referido al nivel de sonoridad 10, asignado a su mapa de uso cotidiano.
En el test de identificación de consonantes (Fig 1) los scores van de 78% para 1515 pps/c a 60% a 200 pps/c. El valor de máximo score, 87%, se logra estimulando a 1300 y 1200 pps/c. El test de identificación de consonantes en nuestro idioma es, junto con el test de identificación de monosílabos, de alta dificultad, por lo que llama la atención el alto porcentaje de aciertos obtenidos a 200 pps/c.
Para el test de identificación de monosílabos puede verse (Fig 2) que los scores van de 80% con 1515 pps/c a 52% a 200 pps/c. Nuevamente, el máximo, 84% se da para FRC de 1300 pps/c y para 1200 pps/c se obtiene un score de 83% . Aunque en relación al test de identificación de consonantes no hay una diferencia tan marcada entre los scores obtenidos para 1515 pps/c y los obtenidos para 1300 y 1200 pps/c, se ve que el máximo rendimiento no corresponde con la máxima frecuencia de estimulación provista por el sistema.
El comportamiento de los valores obtenidos para el test de transiciones vocálicas es similar a los analizados anteriormente. Para una FRC de 1515 pps hay 93% de aciertos; para 200 pps hay 70% de aciertos. El máximo score, 97 % se logra para una FRC de 1300 pps.
Para los test analizados hasta aquí, identificación de consonantes y reconocimiento de monosílabos, tests de máxima dificultad, vimos que los máximos scores se obtienen para frecuencia de repetición de 1300 ó 1200 pps/c. Esto también se puede ver en el tests de identificación de transiciones vocálicas considerado de mediana dificultad. Este resultado fue reportado también por otros autores, quienes a pesar de estudiar poblaciones e idiomas diferente a los presentados aquí, observaron que la velocidad de estimulación que produce los mejores niveles de reconocimiento no es necesariamente la más alta velocidad provista por la prótesos (1,4).
En el reconocimiento de oraciones de uso cotidiano y test de velocidad de comunicación, ambos de menor dificultad para la comprensión del habla, esta característica de máximo scores alrededor de 1300-1200pps no se observa. Para reconocimiento de oraciones, se obtienen muy altos porcentajes de respuestas correctas tanto para 1515 pps, 99% , como para 200 pps, 80%.
La Figura 5, donde se visualizan los resultados de los tests de habla fluida muestra una tendencia a la disminución de los scores obtenidos con la reducción de la FRC. Se obtienen 69 palabras por minuto estimulando con 1515 pps/c, descendiendo a 41 ppm estimulando a 200 pps/c. Esta tendencia es menos regular que para los otros tests efectuados. Esto podría deberse al cuestionado control que se puede lograr sobre la dificultad que el material utilizado ofrece al paciente. Pudiera ocurrir que los textos utilizados al evaluar la velocidad de comunicación no fueran todos de igual dificultad a lo largo del estudio, a pesar de haberlo tomado en cuenta al seleccionarlos. Es bien conocida la influencia del material que se utiliza en la determinación del número de palabras por minuto que el paciente es capaz de repetir: nivel del vocabulario utilizado en el texto en relación al nivel de lenguaje del paciente, etc.
Todos los sujetos reportaron variaciones de la sonoridad relacionadas con la FRC; los valores que se consignan en la Figura 6, dan cuenta de esto. La sonoridad asociada a la FRC varía marcadamente desde el valor 10 asignado arbitrariamente como referencia al mapa de uso cotidiano en 1515 pps/c (y 700 pps/c para el paciente No8) hasta el valor de 5,5 unidades para una FRC de 200 pps/c. Ningún paciente reportó necesidad de aumentar el volumen de su procesador para realizar los tests, aun cuando el nivel de sonoridad disminuía.
La variabilidad entre sujetos en relación a los porcentajes de aciertos para las distintas condiciones de estimulación no es significativa, lo que se ve de las desviaciones standard representadas en todas las figuras. Dentro de la población que se midió no se encontraron apreciables variaciones intersujetos. Podría decirse que la mayoría de los sujetos estudiados respondió mejor cuando se utilizaba la FRC de 1200-1300 pps/c.


Discusión y Conclusiones
Una observación general e interesante es que para todos los tests administrados, los resultados obtenidos muestran una dependencia de la frecuencia de repetición por canal utilizada para estimular al paciente. Los porcentajes de aciertos decrecen al disminuir la frecuencia de repetición del estímulo, indicando la influencia de este parámetro en la percepción del habla. Esta influencia parece estar relacionada con el tipo de test administrado a los pacientes.
El análisis de los resultados estaría indicando que para tests que involucran una mayor dificultad para la decodificación, consonantes, monosílabos, transiciones vocálicas, la FRC juega un rol más preponderante que para aquellos tests, oraciones de uso cotidiano, velocidad de comunicación, en los cuales el contexto semántico compensa el decremento de las pistas temporales provistas por la estimulación.
Las variaciones de la sonoridad asociada a la FRC están indicando claramente que el aumento en la frecuencia de repetición por canal se traduce en un aumento en la sonoridad para el paciente. Es muy importante recordar que este estudio se realizó sin cambiar los valores de umbral de percepción y máximo nivel de confort en los programa de los pacientes. En el estudio realizado por Skinner (5) se observa, como se mencionó, que los niveles de corriente requeridos para producir umbral y máximo nivel de confort, dependen fuertemente de la FRC hasta cierto valor de corriente de estímulo. Skinner sugiere que hay una integración temporal con el aumento de la FRC, observación hecha también por Shannon (11) en 1985 . Se infiere, por lo tanto, que la disminución de la FRC, sin alteraciones de los valores de umbral y máximo de percepción, debiera ejercer influencia sobre el nivel de sonoridad percibido por el paciente y por lo tanto sobre la comprensión del lenguaje. No obstante, ningún paciente reportó ser incapaz de realizar los test debido al nivel de la sonoridad del estímulo aun cuando este varió marcadamente con la FRC. Los comentarios de los pacientes se centran, más que en el nivel de la sonoridad, en la calidad de la señal recibida al variar la FRC. Los posibles cambios en los niveles de sonoridad no parecen afectar la comprensión del habla, pero sí la calidad.
Es interesante notar los altos niveles de respuestas correctas obtenidos para todos los test, utilizando bajas FRC. Tests de alta dificultad como identificación de consonantes y reconocimiento de monosílabos, muestran porcentajes de 60 y 50 % respectivamente a valores de FRC tan bajos como 200 pps. En el tests de identificación de oraciones de uso cotidiano, en el que el contexto semántico facilita la comprensión, se alcanzan porcentaje de 80% para 200 pps/canal.
Podría concluirse que la máxima FRC provista por un sistema no tiene que ser necesariamente la más adecuada para un paciente. Variaciones en las características individuales como tal vez, resto neuronal, patología , antigüedad de la sordera, podrían influir en el valor de la óptima FRC para cada individuo, la que le proveería de un mayor y mejor acceso a la información contenida en el habla. Contando con el hecho de que los sitemas de implante actualmente tienen la posibilidad de acceder a distintos programas de estimulación, una correcta actitud clínica podría ser la de que el paciente pueda experimentar mapas con distintas FRC eligiendo aquellos de los que, de acuerdo a sus características particulares, pueda obtener mayor claridad y confort en la recepción de las señales del habla.
Posiblemente sea necesario estudiar un número mayor de pacientes y caracterizarlos por sus individualidades, para poder predecir las condiciones óptimas de estimulación para diferentes situaciones del entorno, tranquilo y ruidoso.

Referencias
1. Brill S, Gstöttner W, Helms J, Ilberg C, Baumgartner W, Müller J and KieFER J. Optimization of Electrode Number and Stimulation Rate for the Fast Continuous Interleaved Sampling Strategy in the COMBI 40+. The American Journal of Otology 1997; 18:S104-S106.
2. Wilson B, Lawson DT, Zerbi M, and Finlet C, Recent Development with the CIS strategies. In Hochmair – Desoyer IJ, Hochmair ES, eds. Advances in Cochlear Implants. Vienna: Manz, 1994:103-112.
3. Wilson BS, Lawson DT, Finley CC and Wolford RD. New processing strategies in cochlear implantation. American Journal of Otology 1995; 16: 669-675.
4. Arndt P, Staller S, Arcaroli J, Hines A y Ebinger K. Within subjets conparison of advanced coding strategies in the Nucleus 24 cochlear implant. Cochlear Corporation 1999.
5. Skinner M, Holden K H, Holden T A and Demorest M E. Effect of stimulation rate on cochlear implant recipients’thresholds and maximum acceptable loudness levels. A Am Acad Audiol 2000; 11: 203-213.
6. Aronson L, Cansler A y Alietti M. Percepción del habla variando el número de electrodos activos y la velocidad de estimulación por canal en pacientes con prótesis coclear con estrategia CIS. Otolaringológica XXII, Diciembre 2000, pp: 21-29.
7. Zierhofer C, Hochmair-Desoyer I and Hochmair E. Electronic design of a cohlear implant for multielectrode high-rate pulsatile stimulation strategies. IEEE Trans Rehab Eng 1995;3:112-116.
8. Zierhofer C, Hochmair-Desoyer I and Hochmair E. The advanced COMBI 40+ cochlear implant. Am J Otol 1997.
9. Aronson L, Estienne P. Battecoch. Batería para evaluación de pacientes con implante coclear. No publicada.
10. De Filippo C and Scott BL. A method for training and evaluationg the reception of ongoing speech. Journal Acoustical Societe of America 1978 ; 63(4): 186-192.
11. Shannon RV. Threshold and loudness function for pulsatil stimulation of cochlear implants. Hearing Research 1985; 18:135-143.

Tabla I. Detalles de los pacientes
Paciente/edad
en años
Etiología Años de
sordera
Número de
electr. activos
Encendido
año
Rangos dinámicos medios en dB
No1 / 50 progresiva 10 12 98 23
No2 / 59 otosclerosis 10 10 97 25
No3 / 44 meningitis 2 12 98 27
No4/ 33 progresiva 7 12 00 22
No5/34 ototoxicidad 19 12 00 24
No6/32 progresiva 12 12 00 21
No7/43 meningitis 1 12 00 20,5
No8/53 progresiva 7 12* 00 21,7

* paciente calibrado con anchos de pulso de 60µs/fase. Se le suministraron los tests desde 700 pps.


Figura 1. Identificación de consonantes en función de la FRC y desviación standard.
Valor medio para 8 pacientes.
Figura 2. Idem para identificación de monosílabos en función de la FRC.

 

Figura 3.
Idem para identificación de transiciones vocálicas en función de la FRC
Figura 4.
Idem para reconocimiento de oraciones de uso cotidiano en función de la FRC.

 

Figura 5.
Idem para la velocidad de comunicación medida en ppm en función de la FRC.
Figura 6.
Sonoridad en función de la FRC y desviación standard.

El nivel de referencia se tomó en 10 (ver texto). Valor medio para 8 pacientes.

Abstract
The speech perception of 8 patients implanted with the Combi 40+ system fitted with the CIS strategy was measured by varying the repetition rate per channel (RRch) from 1515 to 200 pps. The tests included consonant identification in /VCV/ context with V = /a/, monosillabic words recognition, vowel transitions, every-day use sentences and fluent speech. Besides, loudness related to the RRch was evaluated. The purpose was to find, by means of the scores obtained, the best RRch for each patient. In spite of the individual patients ‘s characteristic, it was observed that decrement in the RRch also produces decrement in the scores for all the performed tests. The analysis of the results seem to indicate that for the high dificulty tests as consonant identification, monosillabic words and vowel transitions, the RRch play a more important role than that for the more simple test as every-day use sentences and fluent speech, for which the semantic context compensate the decrement in the temporal cues provided by the stimulation. For the high dificulty tests the higher scores have obtained for RRcg of 1300 and 1200 pps. For sentences and fluent speech tests, higher scores were for 1515 pps. It is interesting to observe that very high level of performances, are obtained for RRch of 200 pps for all the administered tests, specillay for those of low dificulties. For all the patients, increasing RRch let to increasing loudness. The results sugget that the maximum RRch provide by a system, is not necessarly the best condition for a patient. Individual features as survival neural tissue, years of deafness, etc, could influence the optimum value of the RRch for each patient.