La identificación de genes relacionados con rasgos productivos –como el peso al nacer y la producción de leche– y de calidad de la carne –como su terneza– mejoraría con una herramienta de bioinformática que analiza estas variantes en vacas y ovejas. Boris Julián Sepúlveda Molina, magíster en Bioinformática de la Universidad Nacional de Colombia (UNAL), unificó tres pasos (QC, GWAS y anotación) que antes se realizaban de manera independiente, para asociar la información del genotipo (información genética) de los animales con su fenotipo (características físicas), datos claves que permitirían alcanzar su mejoramiento genético.
Por medio de modificaciones de la constitución genética de los individuos o la selección y mejora de caracteres deseados para su reproducción se busca incrementar la productividad de los animales y su resistencia –tanto al medioambiente como a las enfermedades– generando una mejor adaptación y aspecto físico, además de una mayor calidad de sus subproductos.
Con la unificación de estos datos de especies distintas al humano en el entorno del lenguaje de programación R, se obtuvo un código que se sometió a publicación y se encuentra disponible en el repositorio https://github.com/bojusemo/Diploid-GWAS, con el que se gestionaría de forma más práctica y ágil la gran cantidad de información genética sobre rumiantes con la que se puede contar hoy en día en la era de los Big Data.
El código fue probado en dos poblaciones de rumiantes: el ovino de pelo criollo colombiano y los bovinos simmental, a partir de lo cual se identificó que el marcador SNP OAR26_10469468.1, que está en el gen TENM3, estuvo asociado con la terneza de la carne del primero.
Por otra parte, el marcador SNP BovineHD4100012055 estuvo asociado con el peso al nacer de simmental y se encontraron otros genes destacados sobre los que todavía se está estudiando su posible efecto en la definición de las características de esta raza.
Variación genética
Para hacer dichas asociaciones, una estrategia ampliamente utilizada es realizar estudios de asociación del genoma completo (GWAS), que consiste en analizar una variación genética a lo largo de todo el genoma o grupo de genes de un animal o un humano con el objetivo de identificar su asociación con un rasgo observable.
Los GWAS deben partir de un filtro adecuado de la información de las variables y de los animales, denominado control de calidad (QC), para luego identificar las asociaciones entre marcadores genéticos tipo SNP (Single Nucleotide Polymorphism) y los rasgos físicos, proceso que luego se complementa con una contextualización biológica de estas asociaciones con la anotación de los genes cercanos a los marcadores.
En este trabajo se utilizó, inicialmente, un conjunto de datos de prueba conocidos como toy data o datos de juguete, con los que se puso a funcionar la herramienta y se optimizó su funcionamiento. Luego se analizaron los datos obtenidos por el investigador en trabajos anteriores sobre evaluación genómica en la raza simmental –de la mano de Colciencias– y de identificación de variantes genéticas de tipo SNP, en la Facultad de Medicina Veterinaria y de Zootecnia de la UNAL.
“Con la profesora Liliana López Kleine, directora de la tesis, establecimos un flujo de trabajo en R que incluía varias etapas: primero, un input o ingreso de los datos con estructuras diferentes para darle el formato necesario”, detalla el magíster, quien después desarrolló los módulos de control de calidad de la información eliminando datos y muestras poco informativas o problemáticas.
Los datos pasan a un análisis de asociación con un modelo de regresión lineal por cada uno de los marcadores, en el que se pueden incluir, por ejemplo, variables del ambiente, para identificar su relación con los rasgos físicos deseables a replicar entre el ganado bovino y ovino.
“Esta información se exporta de R en formatos pdf y txt para que el usuario tome las decisiones que considere pertinentes”, explica el investigador, y señala que el programa cuenta con otro módulo de flujo de trabajo en el que el usuario puede ingresar el ID de genes contenidos en dos de las más grandes bases de datos mundiales sobre el tema, para consultar sobre las funciones biológicas del gen, qué se ha reportado sobre él, a qué proteína codifica o en qué rutas metabólicas está.
“De esta manera se puede adquirir más conocimiento sobre cuáles genes están determinando, hasta cierto punto, el fenotipo de los animales para más adelante desarrollar unos chips o genotipar los animales para que se puedan identificar de manera más eficiente, los que mejorarán la siguiente población”, comenta el magíster.