¿Cómo se ve afectado el reconocimiento de voz por las máscaras faciales?


News-Medical habla con el Dr. Joe Toscano de la Universidad de Villanova sobre su última investigación que investigó el impacto que tienen las mascarillas en el reconocimiento de voz.

¿Qué provocó sus esfuerzos de investigación sobre la pandemia de COVID-19 en curso?

Nuestra investigación se centra en cuestiones sobre la percepción del habla y el procesamiento del lenguaje de manera más amplia.

Estábamos interesados ​​en estudiar los efectos de las máscaras faciales, en particular, dado el uso generalizado de máscaras para ayudar a prevenir la propagación de COVID-19 y las posibles preocupaciones sobre cómo podrían afectar el reconocimiento de voz.

Máscaras faciales

Máscaras faciales. Haber de imagen: Maridav / Shutterstock.com

¿Puede dar una descripción general de los diferentes tipos de mascarillas disponibles?

En nuestro estudio, analizamos cuatro tipos de máscaras: una máscara quirúrgica, un respirador N95 y dos máscaras de tela caseras (una con un diseño ajustado y otra con un diseño plisado). El público en general ha utilizado máscaras de tela durante la pandemia, mientras que los profesionales sanitarios utilizan máscaras N95.

Estábamos particularmente interesados ​​en los efectos de las máscaras caseras, ya que muchas personas usan este tipo de máscaras todos los días y solo hubo una investigación previa limitada sobre cómo podrían afectar el reconocimiento de voz.

¿Cómo afecta el ruido de fondo a la audición?

El ruido de fondo puede tener un gran impacto en la audición, aunque los oyentes con audición normal son generalmente muy buenos para reconocer el habla incluso con ruido de fondo. El tipo de ruido que observamos en nuestro estudio se llama balbuceo de varios hablantes, que consiste en varios hablantes hablando al mismo tiempo (seis hablantes en nuestro estudio). Suena similar a lo que podría escuchar en un restaurante lleno de gente.

Además, es importante tener en cuenta que, para los oyentes con dificultades auditivas, el ruido de fondo puede tener un efecto aún mayor. En nuestro estudio, solo analizamos los efectos para los oyentes con audición normal.

¿Puede describir cómo llevó a cabo su última investigación sobre máscaras faciales y reconocimiento de voz?

Presentamos a los oyentes con oraciones habladas y les pedimos que escribieran la oración que escucharon. Las oraciones se presentaron en el ruido de balbuceo de varios hablantes, ya sea en una condición relativamente fácil con bajos niveles de ruido o en una condición difícil con altos niveles de ruido. Grabamos frases mientras usábamos cada una de las cuatro máscaras y cuando no usábamos máscara.

En todas las condiciones, los oyentes solo escucharon las oraciones; no había información visual como la que obtendría en la comunicación cara a cara. Como resultado, el estudio solo se centró en los efectos auditivos de las máscaras. La pérdida de información visual podría desempeñar un papel adicional en los entornos cara a cara.

¿Qué descubriste?

Descubrimos que, en niveles bajos de ruido de fondo, típicos de los niveles de ruido en muchos entornos cotidianos, los oyentes eran muy buenos para reconocer el habla producida sin una máscara, como esperábamos. Reconocieron correctamente el 94,3% de las palabras en las oraciones para esta condición.

Para el habla producida con las máscaras, también lo hicieron bastante bien, particularmente para el habla producida con la máscara quirúrgica, donde tenían un 93,5% de precisión. En general, las máscaras tuvieron efectos relativamente pequeños en esta condición.

Por el contrario, cuando el ruido de fondo era muy alto, los oyentes tenían solo un 45,2% de aciertos para el habla producida sin máscara, lo que demuestra que se trataba de una condición auditiva muy difícil. Aquí, encontramos mayores diferencias entre las máscaras. La mascarilla quirúrgica condujo de nuevo al mejor rendimiento entre las máscaras, y los oyentes fueron menos precisos para el N95 y las máscaras de tela.

Personas hablando con máscaras.

Personas hablando con máscaras. Haber de imagen: Sabrina Bracher / Shutterstock.com

Se han realizado investigaciones anteriores sobre el reconocimiento de voz con máscaras, pero el tamaño de las muestras ha sido limitado y otras limitaciones. ¿Cómo superó su investigación algunas de estas limitaciones?

Usamos un tamaño de muestra grande (181 participantes) en este estudio. También probamos condiciones que eran relativamente fáciles (bajos niveles de ruido de fondo) y más desafiantes (altos niveles de ruido de fondo).

Estudios anteriores habían analizado algunas de estas condiciones para ciertos tipos de máscaras por sí solas y, en general, los efectos que encontramos en el estudio actual coincidían con lo que esperaríamos en base a esa investigación anterior.

¿Cuáles son los próximos pasos en su investigación?

Nos gustaría investigar una variedad más amplia de máscaras y observar los efectos del doble enmascaramiento. También nos gustaría saber cómo las personas se han adaptado a escuchar el habla mientras usan una máscara durante el último año.

Los oyentes son muy buenos para adaptarse a las nuevas condiciones auditivas y es posible que con el tiempo hayan mejorado en la comprensión del habla que se produce al usar una máscara.

¿Dónde pueden los lectores encontrar más información?

Este material se basa en el trabajo respaldado por la National Science Foundation bajo la subvención No. 1945069. Las opiniones, hallazgos y conclusiones o recomendaciones expresadas en este material pertenecen al autor o autores y no reflejan necesariamente los puntos de vista de la National Science Foundation. Fundación de Ciencias.

Sobre el Dr. Joe Toscano

El Dr. Toscano es Profesor Asistente en el Departamento de Ciencias Psicológicas y Cerebrales de la Universidad de Villanova y Director del Programa de Ciencias Cognitivas de Villanova, donde también dirige el Laboratorio de Reconocimiento de Palabras y Percepción Auditiva.Dr. Joe Toscano

Antes de su nombramiento en Villanova, fue Beckman Postdoctoral Fellow en el Instituto Beckman de Ciencia y Tecnología Avanzadas de la Universidad de Illinois. Completó su Ph.D. en Psicología en la Universidad de Iowa y completó su Licenciatura en Ciencias Cerebrales y Cognitivas en la Universidad de Rochester.

.



Source link