Big data

Capítulo 4. Big data para la política y la Administración

Página 10 de 16

CAPÍTULO 4

Big data para la política y la Administración

Introducción

Como hemos indicado, un rasgo definitorio de nuestra sociedad en las últimas décadas ha sido el rápido crecimiento en la capacidad de las empresas para explotar las TIC, la IO y la modelización estadística para recopilar y procesar datos de operaciones y de mercado y respaldar sus procesos de toma de decisiones con modelos adecuados. Por el contrario, si bien en muchos países las decisiones gubernamentales suelen venir respaldadas por métodos tradicionales de análisis de políticas públicas, son pocos los departamentos y organismos gubernamentales que han logrado implantar de forma sistemática y efectiva las aproximaciones big data descritas. Por simple comparación con las aplicaciones comerciales, no es difícil prever el enorme potencial que espera en problemas asociados a examinar la distribución de los distintos sucesos de salud, al diseño racional de infraestructuras, al uso de conocimiento sobre el comportamiento de los ciudadanos para promover el ahorro energético, al desarrollo de servicios de administración electrónica o la gestión de ciudades inteligentes.

Realizaremos, pues, en este capítulo una reflexión sobre la relevancia del big data en la toma de decisiones públicas. En primer lugar revisamos algunos usos en la Administración pública; después presentamos algunas cuestiones relativas a la mercadotecnia política y el problema de las fake news; finalmente, en nuestra discusión presentamos algunas iniciativas relacionadas con organizaciones no gubernamentales y la gestión de crisis humanitarias.

Big data para políticas públicas

El análisis de políticas (policy analysis) es un campo esencialmente multidisciplinario que, tradicionalmente, ha aportado un marco para reflexionar sobre la toma de decisiones sobre políticas públicas que cubre las etapas típicas del ciclo del análisis de decisiones, incluyendo la contextualización del problema, la determinación de las posibles políticas alternativas; la predicción de sus consecuencias; la valoración de sus resultados y la elección de la política a implementar. A menudo se presenta como parte de un ciclo ideal de formulación de políticas, representado como un continuo con las siguientes etapas generales (Dunn, 1994):

Establecimiento de la agenda. En la que se determinan las prioridades entre las cuestiones de interés público que requieren una acción política o cambios sobre políticas implementadas anteriormente.

Análisis. Dirigido a conseguir una mejor comprensión de un tema que se haya incluido en la agenda. El problema se formula y se desarrollan y evalúan opciones de políticas alternativas para gestionarlo. Se recopila evidencia para aclarar los hechos relevantes y los objetivos de los distintos grupos de interés y de los ciudadanos en general.

Toma de decisiones sobre políticas. Apoyados en el análisis, se adopta una decisión final y se especifica la política elegida.

Implementación de políticas. Una vez seleccionada, tal política debe hacerse operativa. Para ello se movilizan los recursos públicos y reglamentos necesarios para su puesta en marcha.

Monitorización. Se dirige a evaluar de manera continua si la política implementada está produciendo los resultados esperados para identificar si esta debe modificarse o deben considerarse nuevos temas en la agenda.

A pesar de su indudable atractivo, dada su claridad y racionalidad implícita a menudo se critica este ciclo porque raramente refleja lo que ocurre en la realidad, lo que conduce a una variedad de formas de conceptualizar el proceso de formación de políticas (Forester, 1993, entre otros). Sin embargo, las etapas señaladas anteriormente siguen siendo útiles en la práctica para orientar las necesidades y pensar en las diferentes formas que el análisis de políticas adopta y los métodos utilizados para implementarlas. Además, se han implantado con éxito por diferentes actores en áreas como la localización y el dimensionamiento de parques de bomberos, la toma de decisiones sobre políticas energéticas, la regulación y el control del tráfico aéreo, la planificación de sistemas nacionales de salud, la asignación de recursos educativos o la planificación del personal militar, por nombrar unos pocos.

En cualquier caso, una cuestión crítica en la toma de decisiones públicas es determinar los criterios utilizados para evaluar las políticas y quién puede influir en dicha elección. Típicamente reflejan los valores políticos y las prioridades del gobierno correspondiente, sobre lo que subyace una concepción particular de lo que se entiende por “valor público” en relación con, por ejemplo, los impactos sobre el bienestar social, el medio ambiente o el desarrollo económico de las decisiones que se adopten. En particular, la componente de bienestar social puede verse como la agregación del bienestar de los distintos individuos, con lo que es probable que haya que hacer concesiones entre ellos, así como con otros objetivos ambientales y económicos que, a menudo, conducen a conflictos entre los diferentes actores. Así, el análisis de políticas puede tratar de suavizar tales conflictos buscando opciones que conduzcan a una distribución más equitativa, efectiva y eficiente de bienes, servicios, costes y beneficios entre los miembros de la sociedad.

En términos más generales, los objetivos subyacentes a las actividades del análisis de políticas y los roles asociados que los analistas desempeñan en dichos procesos pueden variar considerablemente. Así, por ejemplo, no todos los analistas buscan diseñar y recomendar de manera objetiva y pragmática las “mejores opciones” a partir de evaluaciones como las que estamos describiendo en este libro, sino que pueden adoptar roles alternativos de mediación en conflictos sociales, en el apoyo al debate sobre valores y argumentos o en la democratización de los procesos de formulación de políticas.

Los roles tradicionales del analista pueden entonces complementarse con las aproximaciones analíticas y de big data como se muestra con los siguientes ejemplos:

Investigar y analizar datos relevantes para la formulación de políticas; por ejemplo, a través de todo tipo de aproximaciones analíticas, desde el análisis exploratorio de datos a los métodos de análisis de conglomerados.

Diseñar y recomendar opciones relevantes para su formulación; por ejemplo, a través de modelos de optimización de gran escala o de modelos del análisis de decisiones.

Asesorar estratégicamente sobre qué opciones políticas podrían ser efectivas; por ejemplo, con ayuda de sensores en tiempo real y modelos dinámicos predictivos basados en datos de teléfonos móviles o GPS.

Mediar en conflictos entre diferentes valores y opciones políticas; por ejemplo, con metodologías de planificación e-participativa.

Ayudar a democratizar el proceso político; por ejemplo, por medio de conferencias de consenso o sistemas de información geográfica participativos.

Aclarar los valores y argumentos de diferentes actores en el proceso de formación de políticas; por ejemplo, a través de mapas cognitivos o minería de textos y análisis de sentimientos en redes sociales.

Las técnicas mencionadas son solo ejemplos de categorías generales y, a menudo, se utilizarán para el análisis de políticas y el apoyo a su formulación a través de las fases del “ciclo de políticas” e incluyen, entre otras, la minería de textos en la fase de establecimiento de la agenda; la construcción de modelos de análisis multicriterio y simulación para la fase de análisis; los métodos de planificación participativa en la fase de toma de decisiones; los modelos de asignación de recursos y optimización en tiempo real en la fase de implementación, y, finalmente, distintos métodos de evaluación como la teledetección para la fase de monitorización.

Mencionemos, para concluir, algunos ejemplos de analítica de políticas. Así, Scharaschkin y McBride (2016) discuten la tarea de cómo evaluar si la implementación de una política aporta una buena relación de coste-beneficio a la Oficina Nacional de Auditoría del Reino Unido, con ejemplos en relación con la regulación financiera, la gestión sanitaria y el desarrollo de recursos humanos para el sector público. Algunas áreas en las que es especialmente relevante la analítica de políticas incluyen la planificación urbana, la planificación energética y la gestión ambiental, a través del concepto de ciudades inteligentes. Un caso relevante se describe en Kumar et al. (2016), que analizan grandes bases de datos sobre las tarjetas de viaje de los usuarios del sistema de bicicleta compartida en Singapur para mejorar las necesidades de dicho servicio y emplean luego las correspondientes predicciones de uso para encontrar la capacidad óptima de expansión del sistema mediante un modelo de optimización a gran escala. Zhang et al. (2016) proporcionan un modelo de equilibrio de mercado para biocombustibles en el estado de Iowa, teniendo en cuenta las necesidades de los agricultores involucrados, los productores y los consumidores de biocombustibles. Su formulación conduce a un modelo de teoría de juegos de gran escala que, cuando se alimenta con grandes bases de datos relevantes, proporciona producciones y precios de combustible en el equilibrio. MacKenzie et al. (2016) muestran varios modelos de optimización dinámica de gran escala que facilitan la asignación de recursos para la recuperación ambiental después de un desastre, ilustrándolo con la gestión de las operaciones de limpieza después del vertido asociado al accidente de la plataforma Deepwater Horizon.

El empleo de estas metodologías para la mejora de los servicios de atención médica es también un área muy importante de aplicación, a la que dedicaremos el capítulo 5. Aquí describimos un par de ejemplos de política pública en esta área. Uno de ellos (Aringhieri et al., 2016) estudia el problema de cómo organizar los servicios médicos de emergencia en la ciudad de Milán; para ello, desarrollan un modelo de simulación a gran escala para el envío de ambulancias y un modelo más estratégico de cálculo del tamaño de la flota de ambulancias necesaria para atender la demanda prevista. Brennan et al. (2016) se ocupan de una cuestión importante de salud pública: los efectos del consumo excesivo de alcohol y la evaluación de las políticas para mitigarlos; para ello, estructuran y ajustan un modelo a gran escala del comportamiento relacionado con el alcohol, valorando sus resultados.

De la mercadotecnia política…

En términos generales, para poder implantar políticas debemos ser capaces de acceder al poder. Por ello, en esta sección daremos algunas ideas sobre cómo pueden ayudar las metodologías y tecnologías aquí descritas a facilitar la acción política.

Una cuestión esencial es hacer llegar los mensajes adecuados al electorado, dentro de lo que se denomina “mercadotecnia política” Este no es un problema nuevo y los partidos han utilizado estrategias variadas con métodos tradicionales como mítines, programas de televisión y de radio, llamadas por teléfono, anuncios en periódicos o visitas a domicilio. Sin embargo, las redes sociales han abierto una nueva era en este campo y, en realidad, en la mercadotecnia en general —como describimos en el capítulo 2 y remarcaremos en el capítulo 7—, que nos permite lanzar mensajes mejor adaptados a los distintos perfiles de usuarios de redes sociales para intentar convencerles de las bondades de un candidato, de un programa o de una opción política.

Un ejemplo interesante proviene de algunas propuestas incluidas en Alfaro et al. (2016). La idea básica que se persigue es determinar qué tipo de palabras y mensajes son los más efectivos sobre un electorado. Para ello se pueden utilizar los comentarios que aparecen en blogs y redes como Twitter en relación con dos o más partidos o candidatos. Podemos conseguirlo combinando algoritmos supervisados de aprendizaje automático y técnicas de aprendizaje no supervisadas para análisis de opinión y minería de opiniones.

Una aproximación relacionada está en la base de la polémica reciente sobre la desaparecida Cambridge Analytica. Su aproximación se basa en la capacidad de predicción de rasgos personales a través los likes de usuarios en una red social como Facebook. Para ello se emplearon los datos de 58.000 individuos que, de forma voluntaria, dieron información demográfica (género, edad…) y participaron en un conjunto de tests psicométricos aportando sus likes de Facebook entre más de 56.000 opciones. En primer lugar, se introdujo una aproximación de reducción de la dimensionalidad a cien variables, basada en la descomposición de valor singular. Después se introdujeron modelos de regresión lineal o logística para predecir el sexo, la raza o la orientación política de los participantes en función de tales variables. De esa manera, resultó posible predecir los perfiles sociodemográficos de los usuarios en una red social a partir de sus opiniones y adaptar los mensajes que se envían a los mismos, aumentando su impacto. El gran revuelo mediático de este caso está sin duda ligado al uso sin consentimiento de datos personales por parte de Facebook para fines políticos. Sin embargo, existen dudas razonables sobre la precisión de la predicción de dichos perfiles (Rathi, 2018) y los directivos de la compañía (quizás de manera interesada), en su comparecencia ante la comisión del Parlamento británico, admitieron que dicha precisión no superaba el 60% en la mayoría de los casos y solo funcionaba razonablemente bien para usuarios con más de 50 likes, que no superaban el 20% del total.

… a las noticias falsas

Un problema muy relacionado con el anterior es el de las fake news. Esencialmente, se refieren a noticias en forma de artículo, imagen o vídeo que son intencional y verificablemente falsas y se lanzan con el objetivo de manipular a la audiencia con cierto propósito, como que voten a un candidato. En realidad, el fenómeno no es nuevo, siendo incluso tan viejo como la dicotomía comunicación-información; eso sí, con nuevos aliados estratégicos en las TIC y las redes sociales: el acceso a las masas, la viralidad y la redundancia en el engaño, muy centrada en un periodo breve pero intenso de tiempo. Estos rasgos caracterizan las noticias falsas en sus formas más avanzadas, potenciadas por los mínimos costes marginales que conllevan.

Así, si unimos todo lo anterior en el marco de una nueva lógica política en la que las TIC y las redes sociales se emplean como recurso principal en numerosos países, nos encontramos con la necesidad de enfrentarnos con retos que ponen en riesgo las democracias occidentales tal y como hoy las conocemos. En este sentido, si tuviésemos que señalar el punto de inflexión en el que este fenómeno se convierte en una herramienta política estratégica, deberíamos mencionar necesariamente las elecciones presidenciales del año 2008 en Estado Unidos. Desde entonces no ha habido un solo proceso electoral en países avanzados que no se haya visto sujeto a la toxicidad instrumental de las noticias falsas, destacando las elecciones Trump-Clinton, el referéndum del Brexit o el proceso independentista de Cataluña.

Así, es la dimensión geopolítica de este fenómeno la que es nueva en relación con las técnicas tradicionales de manipulación, que son relativamente estándar en la economía y los negocios. De hecho, estos métodos son frecuentes en las estrategias recientes de publicidad engañosa dirigida, por ejemplo, a promover decisiones de compra incluso en casos que ponen en peligro nuestra salud, incluyendo estrategias de baja intensidad como las de nudging (Thaler y Sunstein, 2008), provenientes de la economía del comportamiento. Al fin y al cabo, no olvidemos que la propaganda y la mercadotecnia utilizan metodologías y técnicas de persuasión similares. Así, las herramientas de publicidad engañosa han sido empleadas tradicionalmente por grandes corporaciones y bancos para posicionarse en mercados y ganar confianza entre los ahorradores. Incluso, en cierta forma, podríamos decir que hubo mucho de publicidad engañosa y noticias falsas en las raíces de la crisis financiera del 2008, con Bankia como ejemplo principal en España.

Obsérvese, sin embargo, que a pesar de tener fallos y no ser muy eficiente, nuestro sistema sociopolítico incluye mecanismos para enfrentarse a la información tóxica, incluyendo las que conciernen a los periodistas. El problema con las noticias falsas en su versión más reciente, y teniendo en cuenta su dimensión geopolítica, es que no se dispone de mecanismos en tiempo real para afrontar tales retos, principalmente porque incluso aunque los creadores de tales estrategias suelen ser personas, frecuentemente se realizan a través de sistemas automáticos contra los que los sistemas de detección tradicionales son esencialmente inútiles.

Por ello, se vienen produciendo desde tiempos recientes intentos de automatizar la detección de noticias falsas a través de métodos que se clasifican esencialmente en dos familias: aproximaciones lingüísticas, basadas en el hecho de que la mayoría de los mentirosos emplean el lenguaje estratégicamente para evitar ser detectados, de forma que con estos métodos se intentan hallar signos de engaño con patrones dentro de mensajes, empleando clasificadores sobre representaciones de un texto por medio de n-gramas o de bolsas de palabras; y aproximaciones en red, que intentan aprovechar la información del comportamiento de difusión del mensaje, por ejemplo, en sitios de microblogs como Twitter, que trata de detectar rumores infundados a través de metadatos tales como hiperenlaces u otras propiedades de grafos y así distinguir fuentes creíbles de otras maliciosas. Para ello, se puede incluir la identificación del usuario que genera el contenido, distinguiendo entre personas o bots. Ambas aproximaciones pueden combinarse, conduciendo a modelos híbridos que se benefician de una mejor representación de los datos dentro de modelos de redes neuronales profundas, combinando métodos de procesamiento del lenguaje natural y de análisis de redes sociales.

Para saber más

En este capítulo hemos ilustrado cómo las tecnologías y metodologías big data pueden ayudar en el tratamiento de algunos problemas de adopción de políticas públicas. El análisis de políticas es un campo multidisciplinario que se describe en más detalle, por ejemplo, en Mayer et al. (2004) o Fischer et al. (2007). El término de “analítica para políticas” es reciente; Daniell et al. (2016) proporcionan una revisión con ejemplos. Nos gustaría destacar aquí, en nuestro país, los trabajos pioneros que la Agencia Estatal de Seguridad Aérea ha realizado en analítica de políticas para mejorar sus metodologías de gestión de riesgos en seguridad aérea.

Para concluir, es interesante mencionar también el impacto que puede tener una adecuada gestión del big data en problemas de logística humanitaria y apoyo a las ONG, siendo un buen ejemplo los trabajos de la organización Data-Pop Alliance12, una coalición global impulsada por Pentland en el MIT Media Lab y la Harvard Humanitarian Initiative para promover los aspectos más humanos en la revolución del big data a través de la investigación, la formación y el análisis de datos para cuestiones referidas al cambio climático, el desarrollo sostenible, las migraciones y la salud pública, entre otras. Varios de los casos que han tratado se refieren a la gestión de desastres. Cada año, los desastres naturales afectan a cientos de millones de personas, siendo además un problema creciente exacerbado por el cambio climático. El despliegue de los equipos de respuesta de emergencia depende de la disponibilidad de información relevante, como la relativa a los movimientos de la población afectada. El análisis de los registros de llamadas, convenientemente agregados y anonimizados, ofrece posibilidades para caracterizar el comportamiento humano durante sucesos críticos, para mejorar el establecimiento de alertas tempranas y la gestión de mecanismos de emergencia.

Uno de los proyectos de la Data-Pop Alliance es OPAL13 (Open Algorithms), un consorcio sin ánimo de lucro que integra diversas instituciones y compañías de telecomunicaciones y tiene por objeto posibilitar el uso de big data recopilado por compañías privadas para el bien común. Para ello proponen soluciones tecnológicas que cambian la forma en que las compañías adquieren y almacenan los datos de los usuarios. La privacidad de los datos, la robustez de la anonimización y el carácter abierto de los algoritmos que operan sobre ellos son algunas de sus señas de identidad. Volveremos sobre esta importante cuestión en el capítulo 7.

Ir a la siguiente página