beca

Título: Nuevos modelos computacionales para la anotación funcional de genes



Tipo de Beca:  Inicial / doctoral

Área: Informática/Biología

Directora: Dra. LAURA KAMENETZKY (IMPAM-UBA-CONICET)

Co-directora: Dra. GEORGINA STEGMAYER (sinc-UNL-CONICET)

Descripción Tema Beca: La ciencia de datos ha experimentado un crecimiento exponencial en la última década. Cada día es más fácil adquirir y almacenar datos de todo tipo, con el desafío de poder extraer información útil de esos datos. A su vez los genomas generados no siempre tienen asociadas las anotaciones de sus productos funcionales. Muchas veces la falta de identidad de secuencia con bases de datos y los algoritmos de anotación existentes no permiten llegar a una anotación de genes precisa. En organismos divergentes respecto a los genomas modelo, hasta un 40% de genes puede quedar sin anotación. La inteligencia artificial (IA) está proveyendo soluciones efectivas a gran cantidad de  problemas de este tipo, especialmente desde el aprendizaje de máquina (machine learning, ML), que ha demostrado tener todo el potencial necesario para este tipo de problemas. Por ejemplo, la predicción automática de la función de genes a partir de genomas completos y de mediciones experimentales de diferente naturaleza. Actualmente existen anotaciones semánticas con vocabulario controlado que describen a los genes y sus funciones en cualquier organismo en base a términos de la ontología de genes (GO). La curaduría (manual) de anotaciones para nuevos genes es un procedimiento muy costoso que requiere de conocimiento específico. Modelos computacionales basados en ML pueden ayudar a encontrar rápidamente potenciales anotaciones para genes nuevos, e impulsar el descubrimiento de nuevo conocimiento en este dominio.

En este plan de trabajo de beca se propone desarrollar nuevos modelos y algoritmos de ML para predecir anotaciones de genes cuya potencial función es desconocida, es decir sin términos GO asociados. Se pretende poder desarrollar modelos de aprendizaje profundo (deep learning) que, en base a las etiquetas de los genes de función conocida, permitan predecir/inferir el conjunto de etiquetas GO que describen la función de cada gen desconocido. Se cuenta con genomas nuevos y modelos experimentales para validar los resultados obtenidos.

Requisitos del Becario: Biólogo, Bioingeniero, Bioinformático, Ingeniero en Informática, Sistemas de Información, Industrial o graduado en carreras afines. Menor de 35 años de edad a la fecha de cierre del concurso. Excelentes antecedentes académicos.

Lugar de Ejecución de la Beca: FCEN y FMED-UBA, viajes trimestrales a la UNL, Santa Fe.

Enviar CV y carta de intención a:

lkamenetzky@gmail.com

gstegmayer@sinc.un.edu.ar