El coste de la inteligencia artificial

No sé si conocéis el estupendo podcast de la Dirección General de Gobernanza Pública sobre el Ciclo de Administración Abierta que me permite escuchar estas conferencias estando al otro lado del mundo. En el último programa que escuchaba hace tiempo Carles Ramió daba una conferencia acerca de los retos de la Administración Pública del futuro más que recomendable. Sin embargo, mientras iba haciendo la compra y escuchando al profesor Ramió casi me tropiezo cuando dice que la Inteligencia Artificial no es cara, sino que esto es un fake (minuto 60:46).

Estoy convencido que alguien que ha publicado profusamente sobre Inteligencia Artificial y Administración Pública sabe que esta afirmación es, como poco matizable. No ya el tema de si es cara o barata, lo que nos llevaría a una discusión sobre el valor que aportaría, lo que supera con mucho lo que este blog puede contar, sino que existen una serie de costes directos e indirectos que hay que contemplar. Siguiendo la afición de Ramió a los símiles universitarios, decir que la IA es barata porque los algoritmos se pueden descargar es como decir que la educación universitaria es barata porque la matrícula cuesta poco; hay costes directos, indirectos, soportados por la sociedad a incluir en la ecuación que, si no tenemos en cuenta, puede llevarnos a donde no queremos.

Así que quiero hacer una breve recopilación de costes asociados al uso de la IA en las AAPP para que nadie se lleve a engaños.

La infraestructura: datos, datos, datos e IoT

Toth y Ramses III ilustran este post sobre el coste de la Inteligencia Artificial
Toth, Algoritmo egipcio asesorando a Ramses III. El coste de esta IA es una ofrenda de dos botecitos. Fuente

El primer coste evidente para el uso de la IA es precisamente la existencia de datos. La IA requiere datos primero para entrenarse y luego para poder extraer conclusiones operativas. Se que la primera respuesta es que la administración tiene datos a espuertas, pero esto no es tan sencillo. Hay costes de preparación:

Preparar los datos

Es cierto que la administración tiene cientos de datos, lo que ya no está tan claro es que esos datos sean fácilmente operables en términos digitales. Como mínimo habría que:

  • Digitalizar los datos existentes. No todos los datos de las AAPP están digitalizados y no todos los datos digitalizados son fácilmente operables. Basta darse un paseíto por cualquier plataforma de contratación y buscar empresas que participan en licitaciones para ver un hueco tan claro como doloroso. Esos datos están, están digitalizados, pero hay que sacarlos con alicates de los PDFs que a veces son de texto (y lo hace un algoritmo con suerte) o son escaneados ( y entonces toca un OCR)
  • Homogeneizar los datos. En segundo lugar hay que homogeneizar los datos. No en todos los sitios se reflejan los mismos datos e, incluso cuando esto es así, no se refleja lo mismo de la misma manera. Si tenéis la suerte de rellenar formularios de diferentes administraciones os podéis encontrar que algo tan «normal» como la dirección ofrece combinaciones como poner el tipo de vía y nombre junto, ponerlo separado, poner en el mismo campo el portal (o no) el piso (o no) la puerta o no… En los campos de dirección los únicos casos de consenso son el código postal (porque ciudad y provincia con los topónimos oficiales son otro tema)
  • Unificar los datos. Nos hemos tirado fácilmente 40 años hablando de tirar silos administrativos y ahora hablamos, lógicamente, de tirar silos de información en la administración. Unir datos dentro de una administración (incluso la misma administración) requiere generalmente software de algún tipo, formación, personal (de ello hablaremos) y proyectos de integración de datos. No podemos decir que sea una tarea barata si queremos, por ejemplo, integrar datos censales con fiscales y educativos no de manera ocasional, sino de manera regular para que los explote una IA.
  • Ampliar los datos. Ya que vamos por la IA, seamos ambiciosos. ¿Por qué contentarnos con prever dónde harán falta más plazas de colegios si podemos regular el tráfico? El aumento de oportunidades hace que busquemos nuevas aplicaciones y eso supone nuevas tecnologías. Llevamos más de una década con las Smart Cities que dan datos para aplicar IA a cuestiones cotidianas. Esto supone una inversión en adquisición, configuración y mantenimiento de tecnología.

El coste de personal: preparar a las AAPP para poder trabajar con la IA

Otro área que supone costes es el personal. No hablamos de la evidente necesidad de formación, sino de la dotación de recursos de personal por parte de las AAPP para que la IA funcione. Esto implica:

  • Delegados de protección de datos. El uso de datos de la ciudadanía requiere un control por parte de la Administración de que sea legítimo, proporcionado y no dañe sus derechos. Hay una persona (o personas) que deben hacer este trabajo. Sé que en muchos casos (la mayoría) esto se está haciendo a modo de guerrilla: se coge a alguien de la organización y le toca. Sin embargo la administración debería asumir que incluso cuando a una persona se le libera de tareas para asumir una nueva, hay un coste de oportunidad. En este lote incluyo al responsable de seguridad, porque aunque sus funciones son distintas, la casuística es la misma.
  • Responsables de datos de la organización. A lo largo de la vida cotidiana de la organización hay decisiones cotidianas que tomar y controlar con los datos. La aparición de un nuevo procedimiento (o de un nuevo formulario), un cambio de normas a pasado o a futuro, la aparición de una nueva tecnología, afecta a esa consistencia y plenitud de los datos. Debe haber perfiles responsables de la toma de estas decisiones y del mantenimiento de los datos (normalmente responsable de datos, árbitro de datos o CDO…) Se aplica lo mismo que antes, o contratas a alguien nuevo, o alguien deja de hacer cosas para hacer estas nuevas.
  • Científicos de datos (y todos los complementos). Los algoritmos pueden ser gratuitos (hablaremos de ello), pero esto es solo el principio. Un algoritmo requiere la selección del modelo, la detección de variables, el entrenamiento, la evaluación del modelo, la implementación y la actualización. Esto lo tienen que hacer perfiles especializados que precisamente en la actualidad se encuentran muy demandados. La nómina habrá que pagarla (si es que las AAPP tienen capacidad de atraerlos). Si no, habría que subcontratar, y eso también cuesta.

El software: algoritmos y mucho más

El software para hacer andar la máquina tiene también costes importantes. Evidentemente python es gratuito y muchos de los algoritmos de IA también lo son, pero no hablamos de proyectos pequeños, tenemos algunos elementos como

  • Software de ETL (extracción, transformación y carga) y Business Intelligence e integradores de datos. Con la diversidad de fuentes de datos con las que nos movemos es necesario tener algún software que permita hacer operativa y efectiva su integración, y ahí entran los ETL, y dónde dejarlos (los BI). Hay herramientas pago y hay herramientas sin coste de licenciamiento que requieren personal especializado para su configuración y uso.
  • Herramientas de seguridad. No creo que sea necesario explicar por qué
  • Sistemas de bases de datos. Tenemos BIs, tenemos datos, pero tenemos muchos documentos y datos no estructurados que requerirán posiblemente usar herramientas como Mongo (por poner un ejemplo) para poder integrar documentos y datos de alguna manera.
  • Herramientas de big data. Salvo que hablemos de administraciones muy pequeñas (donde quizá la IA no sea tan importante) es muy probable que necesitemos recurrir a herramientas más complejas que un python normalito. Como mínimo vamos a precisar Hadoop para integrar y procesar diferentes fuentes de datos. Si queremos trabajar con datos de diversas fuentes a tiempo real, pues hay que irse a Spark o similares. Estas son solo dos herramientas de las muchas que hay y se pueden necesitar. Muchas de ellas son gratuitas, pero el coste de encontrar personal especializado es alto.

El algoritmo barato que me quitan de las manos

La última parte la quiero dedicar al algoritmo que, como bien dice Ramió, puede localizarse de manera descargable y gratuita en muchos casos. Esto es estupendo, y hay algoritmos buenos, potentes y populares. Pero hay que tener cierta cautela con esto: el coste de licencia del algoritmo es solo una parte de todo lo que supone aplicar uno.

  • Identificar variables. Si tenemos todo lo anterior y tenemos un algoritmo, toca identificar qué le damos de comer. En mi experiencia esto puede parecer fácil, pero en cuestiones complejas (como casi todas las reales) es muy difícil hacer esta selección. Lleva hacer conjeturas, planes, pruebas, depurar, descartar y configurar un grupo de variables que tengan sentido y den un resultado satisfactorio. Hablamos en muchos casos de trabajos de meses para procesos relativamente simples y bien localizables. Los complejos son cosa de años (si hay suerte)
  • Entrenar el algoritmo y evaluar el resultado. Una segunda parte es entrenar el algoritmo y evaluar los resultados. Si tenemos las variables y las sometemos al algoritmo, tendremos algunos resultados. Normalmente la respuesta no es tan sencilla como para que a la primera digas «hurra», pero tampoco para que tires la toalla. Hay que probar nuevas ideas, aproximaciones, intentos hasta dar con lo que crees que necesitas. Y una vez que tenemos resultados aceptables, hay que evaluar si son lo bastante aceptables. Parte del coste de los algoritmos propietarios es precisamente no abordar estas dos tareas (como por ejemplo, Watson, que menciona el propio Ramió minutos antes de la frase que da pie a este post).
  • La auditoría del algoritmo y los sesgos. Todos nos preocupamos de los sesgos de la IA por lo que es necesario comprobar que no sólo los datos, sino el algoritmo también, no incluye sesgos. Los sesgos tienen una cosa curiosa, y es que, no sólo son dífíciles de localizar, sino que no son iguales en todos los casos. Un algoritmo que no sesga resultados en un caso, puede sesgar enormemente otro. No se puede tomar un algoritmo como una caja negra, y no se puede tomar un algoritmo auditado en general como necesariamente válido para nuestro caso. Hay que auditar el algoritmo y el resultado. De nuevo, esto es un coste de personal.
  • El mantenimiento del algoritmo. Si todo esto ha salido bien, hay que considerar que ni la realidad, ni los datos, ni los algoritmos son algo estático. La irrupción de un nuevo procedimiento, un cambio importante en el comportamiento de la población o una nueva tecnología puede hacer que nuestro trabajo se vaya al traste.

El coste de la Inteligencia Artificial

La inteligencia artificial cuesta, y cuesta mucho dinero. Basta con mirar que en EEUU se invirtieron en este campo 93500 millones de dolares de capital riesgo en USA fueron a este concepto. No digo que no lo valga, y que no se puedan asumir proyectos piloto localizados a un coste razonable, pero desde luego, hay una inversión importante que hacer y un gasto en personal igualmente grande y crítico. Ninguna de las cosas que he señalado en el artículo dejan de ser básicas y necesarias, no solo para que funcione, sino para que lo haga sin vulnerar derechos ciudadanos.

Eso no significa que el coste no valga la pena. Desde luego es una oportunidad importante, pero es demasiado arriesgado iniciar un cambio como este sin ser conscientes de que hay una serie de trabajo que hacer que va a costar dinero y que, cuanto más claro lo tengamos, mejores soluciones podremos encontrar al reto que supone

Comparte este artículo

Acerca del autor

Regístrate y consigue los últimos artículos en tu mail.

Deja un comentario

SUSCRÍBETE AL BOLETÍN DEL BLOG

y recibe novedades y material exclusivo sobre transformación digital en Administraciones Públicas
Analítica Pública usará esta información para mandarte el boletín y actualizaciones puntuales. Del mismo modo, si deseas señalar qué aspectos son los que te interesan de la Transformación Digital, lo tendremos en cuenta para trabajar más en esos campos. También tendremos en cuenta si abres o no los correos y si haces clic en ellos. No es por cotilleo, eso ayuda mucho a la hora de saber qué temas y enfoques son los que interesan y los que hacen que la gente nos regale un poco de su tiempo. En cumplimiento de lo establecido en la Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal le informamos que sus datos personales quedarán incorporados y serán tratados en los ficheros de Analítica Pública, con el fin de poderle prestar y ofrecer nuestros servicios, así como para informarle sobre novedades y nuevos proyectos en los que se encuentre trabajando la empresa. Le informamos de la posibilidad de que ejerza los derechos de acceso, rectificación, cancelación y oposición de sus datos de carácter personal en info@publilitica.es, mediante la utilización de un correo electrónico conforme se informa en la política de privacidad.»