Catálogo de publicaciones - tesis
Título de Acceso Abierto
Medidas de información multiresolución aplicadas al procesamiento de señales de habla
Analía Soledad Cherniz Hugo Leonardo Rufiner Patricia Pelle Juan Carlos Gómez Marcelo Risk
acceptedVersion.
Resumen/Descripción – provisto por el repositorio digital
La parametrización de la señal de habla es un paso fundamental en múltiples sistemas de procesamiento de voz. Esto permite representar la señal con unos pocos coeficientes en donde se resaltan las características acústicas más relevantes, disminuyendo la dimensionalidad de los datos a procesar y haciendo que el procesamiento posterior sea más eficiente. En esta tesis se proponen nuevas parametrizaciones basadas en medidas de información multiresolución, a fin de obtener nuevas dimensiones que proporcionen información acerca de los cambios en la dinámica subyacente de la señal de voz. Para ello, se calculó la transformada ondita continua de la señal de voz y se evaluó la evolución temporal del grado de complejidad de los coeficientes utilizando las entropías de Shannon y Tsallis, con sus correspondientes entropías relativas asociadas, y la divergencia de Jensen-Shannon. A partir de este procesamiento se plantearon codificaciones de la señal de voz, que luego se utilizaron en dos tipos de tareas: reconocimiento automático del habla y segmentación automática de fonemas. Los resultados obtenidos muestran que las parametrizaciones propuestas permiten destacar características acústicas relacionadas con los cambios dinámicos del tracto vocal, lo cual es clave para realizar el reconocimiento, incluso en presencia de ruido aditivo. Además, la divergencia multiresolución continua proporciona información valiosa que tiene en cuenta las transiciones fonéticas, lo cual es de vital importancia al momento de realizar la tarea de segmentación.Palabras clave – provistas por el repositorio digital
Entropy; Divergence; Multiresolution analysis; Speech parameterization; Robust speech recognition; Automatic phone segmentation; Entropía; Divergencia; Análisis multiresolución; Parametrización de la señal de voz; Reconocimiento robusto del habla; Segmentación automática de fonemas
Disponibilidad
Institución detectada | Año de publicación | Navegá | Descargá | Solicitá |
---|---|---|---|---|
No requiere | 2017 | Biblioteca Virtual de la Universidad Nacional del Litoral (SNRD) |
Información
Tipo de recurso:
tesis
Idiomas de la publicación
- español castellano
País de edición
Argentina
Fecha de publicación
2017-07-26