Catálogo de publicaciones - tesis

Compartir en
redes sociales

Título de Acceso Abierto

Generación automática inteligente de resúmenes de textos con técnicas de soft computing

Augusto Villa Monte Laura Cristina Lanzarini José Ángel Olivas Varela Marcelo Naiouf Guillermo Leguizamón Francisco Pascual Romero

acceptedVersion.

Resumen/Descripción – provisto por el repositorio digital

Hoy en día, Internet es el medio elegido para difundir información que luego se utiliza para resolver una amplia gama de problemas. Sin embargo, a medida que aumenta la cantidad de datos almacenados, su administración se hace más difícil y los usuarios comienzan a sufrir la llamada sobrecarga de información. Muchos son los sectores que, afectados por este fenómeno, no encuentran una solución al problema. El uso, la disponibilidad y el desarrollo de la tecnología en las últimas décadas han facilitado la recopilación de información y han permitido la generación de grandes depósitos de datos. En los últimos años, los repositorios de documentos de texto, como la Web, por ejemplo, han recibido más atención. Dado el crecimiento exponencial del volumen de información textual, se hizo imprescindible disponer de herramientas automáticas que, a partir de la información original, diferencien lo esencial de lo que no lo es. No toda la información tiene el mismo nivel de relevancia. No sólo en términos de contenido, sino también en términos de intereses. Obtener resúmenes de texto automáticamente puede constituir la solución a este problema, especialmente en aquellas áreas de la ciencia, como la medicina, en las que la investigación y la difusión de la información son fundamentales para su desarrollo. Esta tesis desarrolla dos estrategias diferentes para construir resúmenes automáticos de textos utilizando técnicas de Soft Computing. La primera utiliza una técnica de Optimización mediante Cúmulo de Partículas que, a partir de la representación vectorial de los textos, construye un resumen extractivo combinando adecuadamente varias métricas de puntuación. La segunda estrategia está relacionada con el estudio de la causalidad inspirado en el manejo de la incertidumbre por parte de la Lógica Borrosa o Difusa. Aquí, el análisis de los textos se realiza a través de la construcción de un grafo mediante el cual se obtienen las relaciones causales más importantes y las restricciones temporales que afectan a su interpretación. Ambas estrategias implican fundamentalmente la clasificación de la información y reducen el volumen del texto considerando al receptor del resumen construido en cada caso. El énfasis de esta tesis está puesto en la combinación de enfoques. Por un lado, se identifican los criterios que utiliza el usuario para seleccionar las partes relevantes de un documento. Por el otro, se construye un grafo a partir de patrones textuales útiles para la toma de decisiones. Para llevar a cabo los casos de estudio, se obtuvieron varios documentos médicos de Internet, un área para la cual se desarrolló una aplicación móvil que previene errores comunes en la administración de medicamentos dependientes del tiempo.

Palabras clave – provistas por el repositorio digital

Ciencias Informáticas; Text analysis; resúmenes automáticos, procesamiento del lenguaje natural, lógica borrosa o difusa, cúmulos de partículas, causalidad, inteligencia artificial; Information Search and Retrieval

Disponibilidad

Institución detectada	Año de publicación	Navegá	Descargá	Solicitá
No requiere	2019	SEDICI: Repositorio Institucional de la UNLP (SNRD)

Información

Tipo de recurso:

tesis

Idiomas de la publicación

español castellano

País de edición

Argentina

Fecha de publicación

2019-03-18

Información sobre licencias CC

https://creativecommons.org/licenses/by-nc-nd/4.0/

Cobertura temática