Diario de Castilla y León

BURGOS

Revolucionando el Entrenamiento de Algoritmos de Deep Learning con SIGEDA

Este sistema utiliza tecnologías de realidad virtual para generar grandes conjuntos de imágenes o vídeos, de manera que proporciona resultados prácticamente iguales que con fotos o vídeos reales

Marteyn van Gasteren, coordinador de Proyectos Internacionales de Investigación e Innovación del ITCL y coordinador científico técnico del proyecto europeo HosmartAI.

Marteyn van Gasteren, coordinador de Proyectos Internacionales de Investigación e Innovación del ITCL y coordinador científico técnico del proyecto europeo HosmartAI.Ó. CORCUERA

Publicado por
María Merino
Burgos

Creado:

Actualizado:

En el mundo de la inteligencia artificial y la visión por computadora, uno de los mayores desafíos es la disponibilidad de conjuntos de datos adecuados para entrenar algoritmos de deep learning. La herramienta SIGEDA, creada en el ITCL se presenta como una solución innovadora a este problema, permitiendo la generación de conjuntos de datos sintéticos que facilitan la renderización de miles de imágenes y videos etiquetados.

Marteyn van Gasteren, Coordinador de Proyectos Internacionales de Investigación e Innovación del ITCL, y Coordinador Científico Técnico del proyecto europeo HosmartAI, cuenta con una trayectoria de más de veinte años en la gestión de investigación e innovación en proyectos europeos. Le apasiona poder contribuir a la ejecución de las políticas de la Unión Europea e intentar “hacer la sociedad un poco mejor con el apoyo de tecnología”, siempre colaborando con las personas que obtienen beneficio de la tecnología, pero no necesariamente la entienden.

Ha trabajado en proyectos de múltiples sectores, incluyendo sanidad, transporte, educación, e industria. También ha realizado evaluaciones de proyectos para la Comisión Europea y otras entidades europeas que financian investigación e innovación.

El proyecto SIGEDA está enmarcado dentro del proyecto europeo HosmartAI, con un presupuesto de 12 millones de euros, y 10 millones de euros de subvención de la Comisión Europea. El consorcio consistió en 24 organizaciones como empresas, hospitales, universidades, centros tecnológicos y asociaciones de toda Europa.

El objetivo primordial de HosmartAI fue promocionar el uso de IA y robótica en hospitales mediante 8 grandes proyectos piloto, y duró 3 años y 4 meses, finalizando el pasado mayo.

Van Gasteren explica que las tecnologías basadas en fotos e imágenes están ya completamente integradas en nuestras vidas y lo son cada vez más, desde nuestro smartphone a cámaras de vigilancia y en la industria. Los algoritmos que utiliza la llamada visión artificial han avanzado muchísimo con la llegada de la inteligencia artificial, pero solo funcionan bien si son entrenados correctamente.

Ahí es donde entra SIGEDA, una gran herramienta para generar grandes cantidades de imágenes que sirven para entrenar los algoritmos de IA.

Por lo tanto, se trata de una tecnología de generación de conjuntos de datos sintéticos que permiten la representación de miles de imágenes y/o vídeos etiquetados para entrenar algoritmos de IA (Deep Learning) para visión artificial.

En muchas ocasiones, hay muy pocas imágenes o vídeos adecuados disponibles. Este servicio permite a los desarrolladores de IA entrenar sus algoritmos con imágenes o vídeos creados con realidad virtual. Por ejemplo, para la detección de personas, se puede generar una enorme variedad de ‘personas’ gracias a la capacidad de configuración de los avatares de realidad virtual, evitando sesgos y cuestiones éticas. Además, dado que estas imágenes se crean en ordenador, se conoce la posición exacta del individuo o el objeto en su entorno y no hace falta estimar la de la foto.

El desarrollo comenzó hace 5 años en otro proyecto europeo llamado WorkingAge, en el que buscaban evaluar la postura ergonómica de trabajadores sin sensores incómodos en el cuerpo. Optaron por el uso de una cámara y tecnologías de visión artificial. La falta de disponibilidad de fotos específicas de trabajadores en los entornos de estudio, una oficina y una fábrica de automoción, les dio esta idea de generar imágenes sintéticas. Desde entonces están proporcionando un servicio de generación de conjuntos de imágenes a clientes: desarrolladores de soluciones de visión artificial.

En HosmartAI han ampliado la tecnología de imágenes a vídeo, y esto añade la dimensión del tiempo. Ampliando de esta manera la detección de personas desde posturas a movimientos, por ejemplo, las caídas de personas.

SIGEDA se ha utilizado para visión artificial utilizando un robot humanoide para una de las pruebas piloto en un hospital de Eslovenia. El robot ayuda a pacientes en la rutina diaria de enfermería y por ejemplo puede detectar caídas de pacientes y da apoyo en ejercicios de respiración.

También se encuentran en pleno proceso de investigación, con el Hospital Universitario de Bruselas y la Universidad Libre de Bruselas para hacer efectiva la aplicación de estas tecnologías en la simulación del crecimiento de tumores cerebrales. Las tecnologías de imagen son importantísimas en muchas áreas del sector sanitario y SIGEDA ayuda que sean más precisas, más rápidas y por tanto más baratas.

Aparte de las aplicaciones en el ámbito sanitario y condiciones laborales, también se puede emplear en seguridad o en agricultura, por ejemplo, vigilando el crecimiento de cultivos. La monitorización de procesos industriales es otro ejemplo. La visión artificial se utiliza en todos los sectores, y prácticamente todas estas aplicaciones utilizan IA, y la IA necesita miles de imágenes para ser entrenada.

Van Gasteren apunta que el cliente que quiere entrenar su IA, ahorra mucho tiempo ya que SIGEDA añade automáticamente las etiquetas a las imágenes; con fotos el etiquetado es un costoso trabajo manual y además es menos preciso. Este etiquetado es necesario para informar al sistema IA acerca de qué hay en la imagen. Por ejemplo, en caso de la postura de una persona, las etiquetas tienen la posición de las articulaciones principales que definen la postura: cuello, hombros, codos, muñecas, cadera, rodillas y pies, con SIGEDA estos parámetros están predefinidos en cada imagen.

Además, en el caso de personas, no hay problemas de privacidad ya que no se utilizan humanos reales, sino recreaciones virtuales perfectamente adaptables. De esta forma se puede crear una distribución representativa de género, edad, raza, tamaño, etc. de la población, evitando importantes problemas éticos.

Se proyecta que el mercado global de generación de datos sintéticos crezca de 300 millones de dólares en 2023 a 2100 millones en el 2028; un crecimiento muy significativo empujado por preocupaciones de protección de datos privados y eficacia en coste y tiempo de algoritmos de IA. Van Gasteren expone entusiasmado que actualmente trabajan arduamente para ayudar a clientes a aplicarlo en variedad de sectores y aplicaciones.

tracking