Catálogo de publicaciones - tesis

Compartir en
redes sociales


Título de Acceso Abierto

Desarrollo de herramientas bioinformáticas para la anotación de genomas

Germán F. Burguener Adrián Turjanski

publishedVersion.

Resumen/Descripción – provisto por el repositorio digital
El ensamblado y la anotación de genomas es un área de particular interés en genómica, que ha abierto un horizonte de posibilidades impensadas en la época de los primeros avances de la genómica preinformática. Desde las primeras secuenciaciones de genomas completos, se han desarrollado diferentes métodos y herramientas para el procesamiento y anotación de datos genómicos. La aparición de las tecnologías de secuenciación de nueva generación ha significado una verdadera revolución en la biología y, sobre todo, en las denominadas ciencias ómicas. Sin embargo, los enormes volúmenes de datos generados representan nuevos desafíos, tanto a nivel técnico como de análisis. Se genera mucha más datos de los que pueden procesarse para posibilitar la extracción de información en forma confiable, con lo que la cantidad de datos no curados en diferentes repositorios es cada vez mayor. La velocidad con la que crecen las bases de datos y la dificultad de garantizar la calidad de las mismas, hacen que las anotaciones, principalmente automáticas, requieran siempre un gran esfuerzo posterior de curado manual. Asimismo, la disparidad en los formatos y fuentes de datos y la falta de estandarización en las metodologías dificulta la integración entre diferentes análisis, lo que suele requerir también un gran insumo de tiempo para poder extraer información a partir de datos obtenidos por medios diversos. El presente trabajo de tesis tuvo como principal objetivo el diseño, programación, testeo y aplicación de protocolos de trabajo (pipelines) para ensamblado y anotación de genomas y transcriptomas de organismos con diversos niveles de complejidad. Se programaron pipelines para ensamblar y anotar organismos desde virus y bacterias a eucariotas superiores. Cada pipeline fue organizado en forma modular, permitiendo iniciar el proceso desde los primeros pasos de secuenciación hasta las etapas más avanzadas, con la posibilidad de incorporar información procedente de fuentes diversas, tanto internas como externas y de combinar los diferentes pipelines entre sí, según el nivel de análisis que se necesite y la información de que se disponga. A su vez, las anotaciones finales son incorporadas a la plataforma web de BIA (Plataforma de Bioinformática Argentina), interrelacionándose y enriqueciéndose con otros módulos y pudiendo visualizarse y filtrarse en forma flexible. Paralelamente al proceso de desarrollo de los pipelines, los mismos fueron aplicándose a diversos organismos, en un proceso iterativo de testeo y mejoramiento. De esta forma, se ensamblaron y anotaron diversas especies de bacterias, arqueas, eucariotas inferiores y eucariotas superiores, entre ellos: anotación de la arquea extremófila Halorubrum sp. AJ67 y de la bacteria probiótica Lactobacillus acidophilus ATCC 4356, ensamblado y anotación de las cepas M y B del complejo Mycobacterium Tuberculosis; ensamblado y anotación de un hongo no caracterizado del género Trichoderma, ensamblado, anotación y estudio comparativo del patógeno de maíz Puccinia sorghi race RO10H11247; ensamblado y anotación de Ilex Paraguariensis A. St.-Hil., en el marco del Proyecto de Secuenciación del Genoma de Yerba Mate (PRO.MATE.AR).
Palabras clave – provistas por el repositorio digital

BIOINFORMATICA; GENOMICA; TRANSCRIPTOMICA; ENSAMBLADO; ALINEAMIENTO; PIPELINE; BIOINFORMATICS; GENOMICS; TRANSCRIPTOMICS; ASSEMBLY; ALIGNMENT

Disponibilidad
Institución detectada Año de publicación Navegá Descargá Solicitá
No requiere 2017 Biblioteca Digital (FCEN-UBA) (SNRD) acceso abierto

Información

Tipo de recurso:

tesis

Idiomas de la publicación

  • español castellano

País de edición

Argentina

Fecha de publicación

Información sobre licencias CC

https://creativecommons.org/licenses/by/2.5/ar/