¡¡¡ BIENVENIDOS !!!

Fonoaudiología activa desde 2000... con el ánimo de proveer información a los Fonoaudiólogos y estudiantes. Minibiblioteca de artículos recientes. Fonoaudiologos trabajando la deglución desde hace mas de 70 años...

jueves, 19 de marzo de 2020

Disartria y disfluencia

La disartria es un trastorno del habla causado por dificultades para controlar los músculos, como la lengua y los labios, que se necesitan para producir el habla. Estas diferencias en las habilidades motoras hacen que el habla sea arrastrada, murmurada y hablada con relativa lentitud, y también puede aumentar la probabilidad de disfluencia. Esto incluye sonidos que no son de habla y "tartamudeo", definidos aquí como una interrupción en la fluidez del habla manifestada por prolongaciones, interrupciones y repeticiones. Este artículo investiga diferentes tipos de características de entrada utilizadas por las redes neuronales profundas (DNN) para detectar automáticamente la tartamudez de repetición y las disfunciones no habladas dentro del habla disártrica. Los experimentos prueban los efectos de la dimensionalidad dentro de los coeficientes cepstrales de frecuencia Mel (MFCC) y los coeficientes cepstrales predictivos lineales (LPCC), y exploran las capacidades de detección en diártico versus habla no disártrica. Los resultados obtenidos con las funciones MFCC y LPCC produjeron precisiones de reconocimiento similares; la tartamudez de repetición en el habla disártrica se identificó correctamente en aproximadamente 86% y 84% para el habla no disártrica. Los sonidos que no son del habla se reconocieron con aproximadamente un 75% de precisión en hablantes disartricos.
Muchos estudios han investigado formas de mejorar la inteligibilidad del habla disártrica, incluidos los métodos que se enfocan en aspectos particulares del habla para modificar. Kain y col. [1] implementó un sistema de transformaciones que se centró estrictamente en mapear vocales de individuos con disartria en vocales más características del habla no disártrica. Esos experimentos mostraron un aumento de inteligibilidad del 6%. En 2013, Rudzicz [2] propuso un método que agregó la corrección de otros errores de pronunciación y un tempo ajustado. Entre una cohorte de oyentes que no están familiarizados con el habla de personas con parálisis cerebral, las tasas de reconocimiento de palabras aumentaron en un 19,6%. Crucialmente, la detección basada en Levenshtein de las repeticiones de fonemas y las disfunciones no habladas en ese trabajo dependía de la segmentación completa de fonemas, lo que en sí mismo puede ser bastante desafiante para el habla disártrica.
Chee y col. [3] proporcionó una visión general de la detección automática de la tartamudez, enfatizando su dificultad en varios métodos de clasificación. Czyzewski y col. [4], p. Ej., Implementaron redes neuronales artificiales (ANN) y 'conjuntos aproximados' para detectar tres tipos de 'tartamudeo': interrupciones, prolongaciones vocales y repeticiones de sílabas, obteniendo precisiones de hasta 73.25% con ANN y 91% con conjuntos ásperos. Wisniewski ´ y col. [5, 6] realizaron dos estudios que utilizaron modelos ocultos de Markov con coeficientes cepstrales de Melfrecuencia (MFCC) para detectar la tartamudez...

No hay comentarios:

Publicar un comentario

Déjanos tu comentario, nos interesa