Catálogo de publicaciones - tesis

Compartir en
redes sociales


Título de Acceso Abierto

Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires

Walter Marcelo Lamagna María Elena Buemi

publishedVersion.

Resumen/Descripción – provisto por el repositorio digital
En esta última década, el acceso masivo a las nuevas tecnológicas con medios de almacenamiento reducidos en tamaño y precios accesibles han impulsado la creación y manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datos públicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos a disposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecen la participación democrática motivando a los científicos de datos a utilizar su conocimiento para responder ciertas preguntas ó resolver problemas a través de la tecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que corresponden a las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato proveniente de dos fuentes diferentes de formato distinto: dígitos tipeados a partir de formularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadas utilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya que son producto del conteo manual supervisado por todos los actores presentes en el evento. Conociendo la metodología utilizada sabemos que este dato debería corresponderse entre ambas fuentes. Se busca determinar si existe una tasa de error entre dos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regiones de interés que localizan cada número que luego será segmentado en sus correspondientes dígitos. La dificultad de decodificar el símbolo numérico que corresponde a cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamiento de imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizado que clasifica los dígitos manuscritos de los telegramas y luego los compara con los datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árboles de decisión en la clasificación de las regiones del telegrama y redes neuronales convolucionales en la clasificación de los dígitos manuscritos.
Palabras clave – provistas por el repositorio digital

ELECCIONES; DATAMINING; GOBIERNO ABIERTO; PROCESAMIENTO DE IMAGENES; REDES NEURONALES CONVOLUCIONALES

Disponibilidad
Institución detectada Año de publicación Navegá Descargá Solicitá
No requiere 2016 Biblioteca Digital (FCEN-UBA) (SNRD) acceso abierto

Información

Tipo de recurso:

tesis

Idiomas de la publicación

  • español castellano

País de edición

Argentina

Fecha de publicación

Información sobre licencias CC

https://creativecommons.org/licenses/by/2.5/ar/