El girasol es uno de los principales cultivos oleaginosos del mundo por su volumen de producción y composición en ácidos grasos insaturados. En promedio, durante los últimos cinco años, la producción mundial se ha mantenido estable concentrándose el 72% de la misma entre Argentina y la Unión Europea. A pesar de esto y debido a las condiciones de los precios internacionales y la productividad comparativa con otros cultivos, el área de producción se está desplazando a regiones más áridas a nivel mundial cobrando relevancia la incidencia de estreses abióticos como sequía, salinidad y bajas temperaturas. Pese a la importancia económica del girasol a escala mundial, el grado de avance de los conocimientos públicos sobre el genoma de girasol es limitado cuando se lo compara con cultivos como el arroz, el maíz, la soja, el tomate, el trigo, la papa, la cebada. Sin embargo, en los últimos cinco años, en paralelo al avance de este trabajo, se han iniciado distintos proyectos a nivel nacional e internacional orientados al análisis genómico de girasol con lo cual ha aumentado significativamente la disponibilidad de secuencias genómicas y de ADNc, con el consecuente impacto en el avance de las investigaciones y el conocimiento sobre esta especie. El objetivo de este trabajo es contribuir al conocimiento de las regiones codificantes del genoma de girasol a partir de una estrategia de genómica funcional que sirva como base para la caracterización transcripcional simultanea de los perfiles de expresión inducidos bajo condiciones de estrés y el desarrollo de marcadores funcionales. Para lo cual se abordo el desarrollo de un banco local de secuencias que se expresan o ESTs ("expressed sequence tags") diferenciales para distintos órganos y/o estadios de desarrollo de girasol y el desarrollo de una plataforma bioinformática para la caracterización de los perfiles transcripcionales de las mismas en respuesta a estrés abióticos. En una primera etapa se evaluaron distintas estrategias de secuenciación a pequeña y mediana escala para la identificación de genes diferencialmente expresados en girasol a partir de la generación colecciones de ADNc diferencial. La técnica utilizada se basó en la hibridación substractiva como herramienta para la identificación de genes diferencialmente expresados en un tejido definido, disminuyendo significativamente la redundancia en la secuenciación de clones que representan a genes abundantes y maximizando la detección de los transcriptos “raros” o poco abundantes. Esta estrategia posibilitó un incremento de la eficiencia de secuenciación dentro del marco de un proyecto genómico de pequeña escala que apunta a la identificación de genes de utilidad para propósitos de mejoramiento y la búsqueda de marcadores funcionales. Como resultado, se obtuvieron clonotecas diferenciales a partir de hoja, tallo, raíz y flor en dos estadios de desarrollo (R1 y R4). El uso de diferentes fuentes de ARN como objeto o “tester” y referencia o “driver” fue de utilidad para la selección y detección de transcriptos poco abundantes. La especificidad órgano- específica varió dentro de un rango de 75 a 100% de las secuencias no- redundantes (unigenes) dentro de cada clonoteca de ADNc. La clonoteca correspondiente al estadio R4 de flor fue la menos redundante con un 62% de secuencias únicas y la que aportó el número más elevado de secuencias nuevas de girasol. El análisis bioinformático se llevó a cabo mediante la instalación de un servidor local (INTA 01) conteniendo las herramientas de distribución pública para la edición, análisis y ensamblado de secuencias como Phred/Phrap, CAP3 y algoritmos de comparación de secuencias como BLAST y el desarrollo de BioPipeline® una plataforma desarrollada en entorno Windows para el análisis automatizado de secuencias utilizando los mismos programas y algoritmos mencionados anteriormente. La información de secuencias generadas fue depositada en la base dbESTs de NCBI para su distribución pública. Para el manejo local de esta información se desarrolló una base relacional de tipo ACeDB para la integración de la información generada y su anotación funcional. Sobre un total de 919 secuencias que fueron editadas y anotadas, 318 representan secuencias únicas. Las comparaciones contra bases de datos públicos arrojaron un valor del 60% de secuencias no-redundantes con similitud a secuencias conocidas. El número de genes novedosos predichos varió según la clonoteca analizadas, en un rango que va de 56% en las clonotecas de flor estadio R4 al 16% en las de flor R1. Las comparaciones con los ESTs de girasol depositados y reportados en bases de datos mostraron que 197 secuencias (59,9%) del total) representaban secuencias nuevas, sin similitud significativa con secuencias conocidas. Este enfoque fue exitoso respecto del aislamiento de un número significativo de secuencias reportadas asociadas en su función inferida (probable) a caracteres de importancia agronómica, procesos regulatorios y fisiológicos clave. En una segunda etapa se abordó la evaluación de la expresión relativa simultánea de los transcriptos correspondientes a las secuencias de la base de ESTs desarrollada bajo diferentes condiciones de estrés abiótico utilizando la tecnología de micromatrices de ADN. Se imprimieron los fragmentos representativos de los 318 unigenes anotados en las clonotecas previamente descriptas en micromatrices sobre soporte de vidrio. Se evaluaron tres muestras biológicas tanto para tratamiento de frío (estrés térmico), tratamiento de salinidad (estrés salino) y controles representados por plantas crecidas en condiciones regulares. Estos estreses fueron seleccionados considerando al girasol como una planta con grado intermedio-alto de sensibilidad a bajas temperaturas en la zona radicular, así como también particularmente susceptible al desarrollo en condiciones de alta salinidad. El análisis transcripcional permitió detectar 3 grupos de genes bien diferenciados en sus patrones de expresión. Por una parte el Grupo 2, integrado por 126 genes, no mostró variación en sus niveles medios a través de los tratamientos. En cambio, el Grupo 1 (integrado por 112 genes) evidenció sobre- expresión respecto del control cuando las plantas fueron sometidas a estrés (por frío o por salinidad). De manera análoga, 49 genes conformaron el Grupo 3, pero en este caso se observó una sub-expresión respecto del control en ambos tratamientos. Dentro del grupos 1 y 3, se detectaron perfiles de expresión diferenciales para ambos tipos de estrés, siendo la sobre expresión y/o sub expresión de los genes evaluados más pronunciada en respuesta al estrés por frío respecto al estrés por salinidad. Finalmente, surgieron 80 genes candidato en la separación de tratamientos de acuerdo a su p-valor en la prueba de comparación de medias por análisis de la varianza y su ubicación en la región periférica del plano de ordenación generado por los dos primeros ejes principales de un Análisis de Componentes Principales (ACP) de la matriz de expresión génica escalada gen a gen por la desviación estándar residual del análisis de la varianza. De estos genes, 7 fueron validados por técnicas de reacción en cadena de la polimerasa cuantitativa (Real Time PCR), habiéndose obtenido patrones transcripcionales similares con ambas estrategias de análisis La diferencia en expresión génica fue analizada en relación al origen de las secuencias en evaluación. Las secuencias provenientes de la colección de hoja mostraron en general patrones de subexpresión génica en respuesta a ambos estreses (la mayoría corresponden a genes asociados al proceso de fotosíntesis) mientras que las secuencias aisladas de colecciones de tallo o flor en estadio R4 mostraron patrones de inducción génica frente a los mismos estreses. Si se considera que los cambios transcripcionales en respuesta a frío y salinidad fueron evaluados en hoja, estos resultados confirman la eficiencia de la técnica de SSH utilizada para la generación de las colecciones de ADNc órgano específicas y explica la alta relación de transcriptos que muestra cambios en su perfil en respuesta a estreses en relación a los que no varían su nivel transcripcional en las condiciones evaluadas. Durante la segunda etapa de este trabajo se realizó un análisis de los 80 genes candidatos, detectándose 48 como sobre o sub expresados frente a uno u otro estrés, indicando la implicancia de mecanismos regulatorios comunes a ambos estreses. Asimismo 17 y 12 genes se detectaron inducidos o sub expresados específicamente frente a un estrés y no frente al otro. De acuerdo al análisis funcional comparativo estos genes estarían involucrados en mecanismos de regulación incluyendo procesos de transcripción, traducción, degradación/plegado o interacción de proteínas o asociados a mecanismos de generación y procesamiento de especies reactivas de oxigeno. De estas secuencias, 12 corresponden a secuencias con funcionalidad desconocida. Sólo 3 de las secuencias analizadas en este trabajo mostraron patrones transcripcionales opuestos incluyendo una con similitud a un transportador de lípidos. La información generada a partir de la caracterización del banco de ESTs constituye por una parte una fuente de información sobre genes candidatos involucrados en mecanismos de respuesta a estreses abióticos que pueden ser incluidos en ensayos de complementación en plantas transgénicas modelo y asimismo permite identificar secuencias nuevas no descriptas anteriormente para el desarrollo de marcadores funcionales a ser utilizados en programas de mejoramiento asistido de este cultivo