El guía del aprendizaje semisupervisado
Este licenciado en Informática y doctor por la Universidad de Valladolid forma parte de los científicos más influyentes del mundo / Lidera desde la UBU un proyecto para construir un modelo que, dado un ejemplo, cuya clase es desconocida, asigne o prediga una de las etiquetas
Forma parte de la primera generación que tuvo ordenador en casa, aunque se tuviera que conectar a la televisión y usara cintas de casete para almacenar los programas y datos. En su caso, fue un Sinclair ZX Spectrum. Con ese tesoro se enamoró de la informática. Juan José Rodríguez Diez estudió en la Universidad de Valladolid (UVA) tanto la licenciatura como el doctorado. Al terminar la carrera se incorporó como profesor de la institución universitaria. En el 2000 se trasladó a la Universidad de Burgos (UBU). Desde el año pasado es catedrático.
En 1998 realizó una estancia docente en la Universidad Nacional de Centro de la Provincia de Buenos Aires, impartiendo cursos sobre creación de páginas web y del lenguaje de programación Java. Durante la tesis hizo dos estancias, con una duración total de tres meses, en las que colaboró con Henrik Boström en el departamento de Ciencias de la Computación y Sistemas de la Universidad de Estocolmo y el Instituto Real de Tecnología sueco.
Ha cursado varias estancias en la Universidad de Bangor, en Gales (Reino Unido), la primera en 2005 y la última en 2019, con una duración de 20 meses. Las más prolongadas en 2007 y 2016, de seis meses cada una. En estas estancias ha colaborado con la catedrática Ludmila Kuncheva, una de las principales investigadoras en reconocimiento de patrones, en especial en métodos de combinaciones de clasificadores.
Rodríguez Diez es miembro y ha sido coordinador del grupo de Investigación Reconocido (GIR) por la Universidad de Burgos Advanced Data MIning Research And Business intelligence/Big data/Bioinformatics LEarning. Las líneas de investigación principales son el desarrollo de métodos de aprendizaje computacional y minería de datos, incluyendo el procesamiento de grandes cantidades de datos, big data, así como la aplicación de estos métodos en problemas industriales, en salud y en educación. También el procesamiento de imágenes, modelado 3D y realidad virtual.
Este profesor, que figura entre los científicos más influyentes del mundo en el Ranking of World Scientists elaborado por la Universidad de Standford, lidera un proyecto, financiado por la Junta de Castilla y León y el Fondo Europeo de Desarrollo Regional, que tiene como meta construir un modelo que, dado un ejemplo, cuya clase es desconocida, asigne o prediga una de las etiquetas. Por ejemplo, se pueden tener fotos de animales indicando cuál es el animal. A partir de esas fotos se construye un clasificador que dada una imagen predice a qué animal se corresponde. Otras propuestas son la clasificación de textos, noticias, según su tipo y la predicción de enfermedades, según los síntomas o resultados de pruebas.
«Las clases o etiquetas suelen ser asignadas por humanos, a menudo expertos. También pueden ser asignadas por sensores o dispositivos. La asignación de etiquetas tiene un coste y no siempre es posible su concesión a todos los datos históricos disponibles. La cuestión que se plantea es si estos datos no etiquetados pueden ser útiles a la hora de construir el clasificador. Esto es lo que se conoce como aprendizaje semisupervisado. Para el ejemplo de las fotos de animales, además de las fotos etiquetadas, podemos obtener muchas fotos sin información de cuáles son los animales (o incluso que no contengan animales) y esas fotos adicionales se pueden usar para lograr mejores clasificadores», expone.
Este proyecto cuenta con el apoyo del Centro Tecnológico de Miranda de Ebro (CTME) y la multinacional burgalesa Nicolás Correa, que colaborarán en la validación experimental de los nuevos algoritmos de aprendizaje semisupervisado desarrollados. De esta forma, tal y como asegura, estas técnicas estarán preparadas para su aplicación en problemas industriales reales, como la predicción del nivel de desgaste en componentes de grandes máquinas o de herramientas de corte en procesos de mecanizado, lo que mejorará la competitividad del tejido industrial de Castilla y León.
Otro de los proyectos en marcha, financiado por la Fundación la Caixa y Fundación Caja de Burgos, es el ‘Estudio de los mecanismos de patogenidad de Campylobacter jejuni como causante de cardiomiopatías y posibles soluciones en base a sustancias antimicrobianas naturales (Campycardio)’, en colaboración con los grupos de investigación Tecnofood y BIOIND de la Universidad de Burgos. «La bacteria Campylobacter causa una enfermedad diarreica, pero en algún caso desencadena cardiomiopatías no isquémicas. La participación de nuestro grupo consiste en el desarrollo de herramientas de análisis bioinformático, incluyendo la aplicación de técnicas de aprendizaje computacional y la aceleración del proceso mediante paralelización de algoritmos», detalla Juan José Rodríguez Diez.
En su opinión, en la Comunidad existen grupos de investigación muy destacados, también empresas fundamentadas en la innovación y la investigación. Respecto a los trabajos impulsados desde la universidad, puntualiza que la financiación recibida para los proyectos concedidos, tanto del Gobierno autonómico como del Ministerio, puede ser adecuada, sin embargo, muchas propuestas de iniciativas muy bien valoradas no se conceden por inexistencia de financiación suficiente.
Afirma que el ser puntero en el campo de la informática, salvo excepciones puntuales, es ambicioso a medio plazo y no es algo que depende en exclusiva de las administraciones públicas. No obstante, Rodríguez Diez tiene claro que el trabajo y la financiación también son necesarias en aquellas áreas en las que no es puntero para no caer en obsolescencia. «En informática es imprescindible», apostilla.
El catedrático de la UBU declara que la sociedad premia la innovación y el talento, si bien quizá de manera desequilibrada, mucho a unos pocos. «La innovación implica un riesgo, no siempre tiene éxito. También hay casos en los que lo que plantean como innovaciones, ni lo son ni tienen sentido. El talento es muy útil, pero ni es suficiente por sí solo ni es imprescindible; el esfuerzo y la constancia pueden ser bastante más importantes».