Diario de Castilla y León

Una central de datos para diseñar políticas con Inteligencia Artificial

Quince empresas tecnológicas, entre ellas PwC, Indra y Telefónica, optan al concurso lanzado por la Junta para ordenar y unificar sus bases de datos, ahora almacenados en distintos formatos y ficheros dispersos por las consejerías

Centro de Supercomputación de Castilla y León ubicado en el campus universitario de Vegazana de León. / ICAL

Centro de Supercomputación de Castilla y León ubicado en el campus universitario de Vegazana de León. / ICAL

Publicado por
Esther Neila
Valladolid

Creado:

Actualizado:

Quince empresas tecnológicas, entre ellas grandes consultoras como Pricewaterhouse Coopers, Indra, Telefónica, Oesia, GMV  y Fujistu, aspiran a ordenar las bases de datos de la Junta de Castilla y León. Concurren al concurso público lanzado por la Consejería de Presidencia para centralizar en una única plataforma la información que ahora mismo se encuentra dispersa por las consejerías y en distintos formatos. Esa herramienta permitirá agilizar el trabajo dentro de la administración, mejorar su transparencia y fomentar la reutilización de los datos. Además, ayudará a los gestores a tomar decisiones basándose en los datos. Incluso, anticipándose a escenarios futuros a través de modelos de inteligencia artificial capaces de pronosticar posibles situaciones a partir de modelos matemáticos. 

La externalización busca poner fin así al galimatías de variopintos formatos, sistemas y ficheros repartidos por las consejerías y sus entidades dependientes. Y diseñar, desde fuera, la estructura organizativa para la gestión de los datos. La Junta justifica la necesidad de encargar este trabajo a una empresa porque «no se cuenta en general con un equipo especializado en la explotación y análisis de datos, lo que dificulta  un mayor aprovechamiento de estos» , según explica la memoria. 

El importe del contrato asciende a 2,48 millones de euros en tres anualidades y con cargo a los fondos europeos Next Generation. 

‘Servicios de diseño e implantación del modelo de gobierno del dato en la Administración de la Comunidad de Castilla y León’ es el nombre completo del proyecto, licitado el pasado mes de agosto y promovido por el Servicio de Transparencia y Reutilización de la Información. Los pliegos están disponibles en la Plataforma de Contratación del Sector Público. La apertura de la documentación tuvo lugar esta semana. Se han recibido, en total, quince propuestas. Además de las ya citadas, optan al contrato Datua IA, Alkemy Iberia, NTT Data Spain, Inetum España, DXC Technology, Ey Transforma, Mnemo Evolution & Integration Services y dos UTES, formadas por  ICT y Devoteam Drago, por un lado, y Ticsmart y Abaco, por otro. 

El proyecto «se concibe como una iniciativa transversal» que implantará «de forma integral» en toda la administración un modelo «que permita la gestión centralizada y eficiente de los datos».

A más tardar, el trabajo tiene que comenzar en febrero de 2024, tendrá una duración de 28 meses y se desarrollará en tres fases. Al finalizar, cristalizará en el diseño y puesta en marcha de herramientas que permitan agregar datos procedentes de distintas fuentes y la explotación y visualización de los casos desarrollados, «que permitan la utilización de técnicas de analítica no sólo descriptiva, sino también predictiva e incluso prescriptiva, que faciliten a la Administración conocer a partir de sus datos qué ha pasado, qué va a pasar o cual sería la decisión más acertada en base a una serie de escenarios futuros».

Los pliegos recuerdan que, desde 2012, la Junta, a raíz de la puesta en marcha del portal de datos abiertos, ha llevado a cabo trabajos de publicación de información en formatos reutilizables. Comenzó entonces a implantarse, primero de forma tímida, «una nueva filosofía en relación con la información y los datos». Por primera vez la Administración autonómica tomó conciencia de las ventajas de compartir y reutilizar la información, «tanto por parte de personal interno como por actores externos». Ese impulso fue creciendo con la constante incorporación de nuevos conjuntos de datos y alcanzó gran apogeo durante la pandemia, con el volcado diario de un gran volumen de información actualizada sobre la incidencia del coronavirus y aspectos económicos y sociales vinculados a la crisis sanitaria. 

Los avances registrados a lo largo de esta década, sin embargo, resultan insuficientes y Castilla y León necesita ponerse al día para sacar partido a una materia prima valiosa. 

Los propios pliegos dibujan un muy mejorable escenario de partida. La Junta, explican, ha podido «constatar» que la información que ella misma «genera, recopila y gestiona» a menudo «se encuentra repetida y en diferentes formatos, generando situaciones en las que se llevan a cabo trabajos recurrentes y procesos ineficientes». La información, además, «se encuentra almacenada en diferentes sistemas de información y ficheros», generados «a lo largo de los años y gestionados por los responsables de cada materia, situación que dificulta tener una visión homogénea y coherente».

«Los datos se encuentran dispersos, en silos de información, sin que haya unas políticas corporativas de gestión del ciclo de vida de los datos, de compartición, de normalización o de fijación de estándares de calidad, seguridad y trazabilidad dentro de la organización», explican los documentos. En este contexto es necesario «avanzar en unificar criterios de calidad, seguridad, interoperabilidad o combinación de fuentes, para multiplicar el valor añadido que pueda obtenerse de los datos y fomentar su reutilización».

En la actualidad, las fuentes de información se basan principalmente en Oracle , «si bien podría haber casos de datos almacenados en bases de datos tipo Access, SQL Server, SAP HANA». E, incluso, en ficheros Excel

Entre las preguntas planteadas por las empresas interesadas en el concurso, destacan los requerimientos de información sobre el volumen de datos, los sistemas de origen o el número de empleados públicos implicados en el proceso, cuestiones que desde la Junta no ha sido posible determinar. Emplazan la respuesta al diagnóstico que también deberá realizar la adjudicataria. 

Y es que la empresa que firme el contrato tendrá que realizar antes de nada un diagnóstico de la actual situación. En cuatro meses, deberá analizar qué conocimiento hay de los datos existentes en la Junta y de sus procesos de gestión, qué herramientas se manejan, quién toma decisiones y cómo es la organización del personal. Con el informe resultante se trazará la hoja de ruta para implantar el modelo de gobierno del dato.

En esta primera fase, además, la adjudicataria definirá la arquitectura tecnológica y la estrategia de implantación.

Durante los ocho meses posteriores se definirá el marco de referencia con «las políticas, procedimientos y buenas prácticas» que regirán durante todo el ciclo de vida del dato, desde las fuentes hasta su explotación. Se traducirá en un plan estratégico con las herramientas a implantar, la creación de un catálogo de datos y la definición de la estructura organizativa dentro de la Administración. Además, desarrollará al menos tres casos representativos (puede proponer más, como mejora) por su temática relevante. 

De forma paralela, la adjudicataria desarrollará labores de formación, para que el trabajo «no se quede en algo teórico y sólo aplicado a los casos de uso implementados, sino que se consiga embeber en la operación diaria» de la Junta. « Se necesita una transformación dentro de la organización, un cambio cultural », apostilla para implantar una «verdadera cultura del dato y su gobierno». El adjudicatario deberá presentar una estrategia de comunicación inicial «para involucrar al personal necesario» y llegar «a todos los niveles de la organización» y un plan de formación con, al menos, un curso para cada uno de los perfiles necesarios. 

El objeto del contrato se alinea con los objetivos de los planes de recuperación europeos de modernizar la administración pública y « democratizar el acceso de los datos » por parte del ciudadano. Y es que, cuanto mayor sea la calidad de los datos, más garantizada está la transparencia. Entre otras cosas, porque a menudo la Junta niega información al ciudadano con el argumento de que no está sistematizada y extraerla conllevaría una acción previa de elaboración, que es una de las causas legalmente previstas pero que algunas administraciones usan de forma recurrente como excusa para poner barreras al acceso. 

tracking