Los investigadores en bioinformática de la Universidad ITMO (San Petersburgo) han desarrollado un algoritmo que ayuda a evaluar la influencia de los genes en varios procesos del organismo humano, incluyendo el desarrollo de enfermedades. La investigación fue publicada en la revista BMC Bioinformatics.
La predisposición a la caída del cabello, la obesidad o la mala visión pueden estar asociadas a genes específicos. Para tener la posibilidad de tratar estos problemas, hace falta identificar la parte precisa del genoma que es la causante. Además, para saber si existe una conexión entre un gen y una enfermedad, es importante saber cómo interactúan los genes entre sí.
"En total, un humano tiene más de 20.000 genes. Comparando los genes de los pacientes con las enfermedades que estudiamos y con los genes de las personas sanas, podemos ver las diferencias de actividad y manifestación entre las muestras. Con esta información, se crea un gráfico común que muestra las interconexiones entre todos los genes, y a cada gen se le asigna un factor de peso", explica el investigador Alexéi Sergushichev de la ITMO.
Por lo general, los científicos continúan trabajando solo con los genes más activos, haciendo un subgráfico especial de ellos. Sin embargo, al separar estos genes de la imagen más amplia, se pierde la oportunidad de evaluar la correlación de cada gen con los demás y con los diagnósticos.
En lugar de centrarse en un solo sistema de genes con el factor de peso más alto, los investigadores en bioinformática de la Universidad ITMO han propuesto un nuevo método en el que se generan miles de gráficos con el uso de datos sobre todo el genoma. El nuevo algoritmo, que se basa en un método de la cadena de Markov de Monte Carlo, permite calcular la probabilidad de una conexión entre cada muestra con la condición en cuestión y analizar la composición de una muestra con respecto a las interacciones entre cada gen.
Con un grupo de muestras grande, los científicos pueden identificar los genes que aparecen allí más a menudo que los demás. Si un gen aparece en el 90% de tales subgráficos, entonces los científicos pueden estar un 90% seguros de su conexión con la condición estudiada.
Los autores del proyecto señalan que en el futuro, el algoritmo puede ser representado como un programa con un deslizador que permitirá ver resultados con distintos niveles de certeza.
"Por ejemplo, cuanto más bajo sea el nivel de certeza, más genes se muestran, y viceversa. Si necesitamos identificar solo los genes más ciertos, estableceremos el nivel a un 99%", concluye Alexéyev.