Esta investigación en el campo de la lingüística computacional se llevó a cabo gracias a la beca concedida por la Fundación Científica de Rusia. Los resultados han sido publicados en la revista Procedia Computer Science.
A partir del análisis del lenguaje se puede diagnosticar al individuo ciertas enfermedades (demencia, depresión) e inclinación a la conducta suicida. La necesidad de definir las características del autor de un texto aumenta conforme se desarrollan las comunicaciones por internet: a las empresas les importa saber a qué grupos sociales les agradan sus productos o servicios.
Te puede interesar: El avance infatigable de los 'periodistas-robots': ¿ya hay qué temer?
El equipo de investigadores estudió la eficacia de diferentes tecnologías de aprendizaje automático con el empleo de las redes neuronales para analizar los textos.
Durante el estudio contrastaron la precisión de los resultados de una identificación de género de los autores del texto sobre la base de dos posibilidades de realizar modelos basados en los datos. Por un lado, los algoritmos del aprendizaje automático (método de los vectores de soporte y potenciación del gradiente). Y, por el otro, las redes neuronales de aprendizaje profundo (redes neuronales de alta precisión y redes neuronales recurrentes del tipo Long short-term memory).
"Hemos conseguido buenos resultados para identificar el género del autor del texto gracias a los modelos avanzados de redes neuronales a condición de que el autor no intente ocultarlo. Ahora lo tenemos que conseguir en los casos cuando pretende ocultar esta información", comenta el investigador de la MEPhI, Alexandr Sbóyev.
En los siguientes textos colgados en las páginas para buscar pareja en internet, la red neuronal detecta la trampa en 10 casos sobre 10, y eso que el autor lo firma, premeditadamente, con un nombre del género opuesto.
El texto está escrito por un hombre: "¡Buenos días! ¡Estoy muy descontenta! ¡Mucho! ¡¿Por qué se comporta con nosotros de esta manera?! ¡Todos somos personas, somos iguales! ¿Usted es sexista? ¡No lo pienso tolerar más! Le destrozaré el auto a golpes, se lo dejaré todo pintado. Espere, monstruo. Así será el final".
Asuntos relacionados: La inteligencia artificial supera a los mejores abogados en su negocio
Los resultados del estudio pusieron de manifiesto que el empleo de la red neuronal de alta precisión y los métodos de aprendizaje profundo es óptimo para identificar el género del autor del texto.
Ahora el equipo investigador está trabajando en la tarea de identificación de la edad.