Big Data y las elecciones

Diego Piñeiro

02.06.2019

Mientras escribo esta nota en las últimas 24 horas1[1] se han visto 7 millones de videos de YouTube, emitidos 729 millones de Tweets, 2 billones de likes en Instagram, 6 billones de búsquedas en Google, y se han enviado 27 billones de WhatsApp entre muchos otros números importantes.

 

Este es el volumen de información que circula asociada a millones de datos en cada ocasión, generando definiciones acerca de qué nos gusta, cuánto nos gusta, dónde, cuándo e infinidad de datos asociados a cada individuo. Hasta hace algunos años, esto era el reino del caos, cuanto mayor volumen de información, más complejo era estructurarla en relación a un individuo, el concepto de BigData vino a ser el camino en que profesionales multidisciplinarios comenzaron a intentar moldear este caos.

La definición de Big Data en su dimensión actual comenzó a utilizarse en el año 2005[2], parece que estuviéramos hablando de paleontología, para lo que refiere a este nuevo mundo disruptivo de información y tecnología, pero los avances han sido igualmente acelerados en tan corto tiempo. Para poder organizar este enorme volumen de datos y estructurarlos en relación a un perfil, se generaron cadenas de algoritmos que permitían ordenar grandes volúmenes de datos y extraer algunas conjeturas. Uno de los abordajes iniciales que dio nacimiento a “Cambride Analítica”[3] es el desarrollado por la Universidad de Cambridge con su Centro de Psicometría bajo la dirección del Dr. Michal Kosinski[4], este puede aún experimentarse (ingresando su perfil de Facebook, Twitter, un Curriculum o la combinación de todos), en https://applymagicsauce.com/demo.

El Dr. Martin Hilbert[5] destacaba en abril del 2017 en una entrevista con BBC, que bastaba con 250 likes para que los algoritmos aplicados a Facebook para predecir la personalidad mejor que vos mismo. Con 100 "me gusta" podían predecir tu personalidad bastante bien e incluso otras cosas: tu orientación sexual, tu origen étnico, tu opinión religiosa y política, tu nivel de inteligencia, si usas sustancias adictivas o si tus papás están separados. Detectaron que con 150 "me gusta" el algoritmo podía predecir la personalidad tuya mejor que tu pareja.

¿Cuántos datos dejamos en nuestra huella digital con la computadora el teléfono celular? Muchos, y en la mayoría de los casos es para brindarte mejores opciones. La compañía de celular sabe dónde estás gracias a tu celular. Google también lo sabe, porque tenés instaldo Google Maps y Gmail en tu teléfono —lo puedes ver incluso en https://www.google.com/maps/timeline. Cada "like" hecho en Facebook… Incluso cómo mueves tu mouse en una página de internet puede estar registrado.

Esta información es recolectada por mútiples compañías y aplicaciones, que segundo a segundo están registrando datos. Tomemos por ejemplo un operador de telefonía celular. El proveedor de telefonía tiene que coleccionar el registro de tus llamadas (cuántas hiciste, por cuánto tiempo, etc.), porque te tiene que cobrar la factura. Ellos ni siquiera se preocupan sobre con quién hablaste o qué hablaste. Es nada más la frecuencia y duración de tus llamadas, lo que se llama metadata[6]. Si tengo información un poco más detallada, por ejemplo si el operador de telefonía celular también registra dónde te mueves (porque registra dónde te conectas a sus radiobases), se puede predecir hoy con 90% o 95% de precisión dónde vas a estar en dos meses, y en qué momento del día.

Las claves para obtener buenos resultados en este proceso responden a lo que se conoce como las “5 V”[7]: Volumen, Velocidad, Variedad, Veracidad y Valor. Esto para analizar y procesar la información.

El mundo de las campañas electorales no ha sido ajeno a estos avances. Tomemos por ejemplo la campaña de Barack Obama. La misma utilizó estas herramientas para lograr alcanzar la mayor eficiencia en la recaudación de fondos para la campaña. Básicamente aplicaban algoritmos que permitían determinar en qué hogar había más posibilidades de recaudar a favor de la campaña (una de las más exitosas en este sentido). El gasto más grande de su campaña de 2012 no fue para comerciales televisivos: creó un grupo de 40 ingenieros que sacó de empresas como Google, Facebook, Craigslist, les dio varios millones de dólares y desarrollaron una base de datos de 16 millones de votantes indecisos, sobre los que diseñaron perfiles de psicometría (esto es complejos y elaborados perfiles de personalidad y comportamiento).

Las campañas de Donald Trump, Macron y el Brexit, vieron el máximo esplendor del uso de Big Data (o mejor dicho el mal uso por parte de Cambridge Analítica), ya no sólo para generar perfiles psicométricos, sino además para generar contenidos de mensajes específicos en función de dicho perfil. En función de dichos intereses se podían producir más de 150 mil mensajes específicos en función a tus intereses en relación a un tema como las armas por ejemplo. El hecho de Cambridge Analítica sobrepasara todos los límites robando información de perfiles de Facebook, determinó su extinción y la interpelación en el Congreso de Estados por parte del jóven dueño de dicha red, Marck  Zuckerberg[8] en abril del año pasado.

Independientemente al robo de información, lo cual además de ser ilegal es anti ético, el acceso a grandes volúmenes de datos y su posterior (e incluso simultánea), organización, permite lo que se conoce como Microsegmentación, tanto de públicos como la elaboración de mensajes pertinentes a sus intereses específicos. Esto se viene practicando en campañas electorales con gran fuerza en muchos países de Latino América, pero incipientemente en mercados como Argentina y Uruguay, sobre todo en el uso de herramientas como el Whats App.

En ambas orillas del Río de la Plata, son pocos los proveedores de soluciones globales para montar un Big Data Room o gestionar envíos masivos con contenidos personalizados vía Whats App y otros canales de comunicación. De hecho es pública la preocupación por el gobierno de Mauricio Macri y políticos globales para intentar manejar herramientas básicas como el WhatsApp. Puede que exista cierta convicción de que este nuevo mundo todavía no ha llegado a nuestra región, pero lo cierto es que hoy las herramientas existen, están disponibles y sus costos son relativamente bajos si los medimos sobre todo en la relación “Costo/Eficiencia” y no en “Costo/contacto” (medida habitual para los medios tradicionales e incluso digitales).

Esta columna es una breve introducción a este fascinante mundo, e intentaré ahondar más en próximas columnas. Sin duda con disparadores como ¿Uruguay, sus electores y el sistema electoral, están preparado para una campaña basada en Big Data? ¿Cómo inciden las Fake News en una campaña electoral? ¿Cómo impactan en los electores los nuevos desarrollos de Inteligencia Artificial en la generación de contenidos específicos de acuerdo a perfiles psicométricos?


Diego Piñeiro

Licenciado en Comunicación Publicitaria (UCUDAL)
Post graduado en Marketing Electoral y Comunicación Pública Gubernamental.
Presidente de IDEIA Big Data Uruguay.
Ha sido asesor de campañas electorales en Uruguay y el exterior.
Director de “DOXA estudios y opinión” para África Subsahariana


[1] Pueden acceder a un relevamiento más exhaustivo en estos links: https://www.slideshare.net/DataReportal/digital-2019-q2-global-digital-statshot-april-2019-v02?from_action=save

https://influencermarketinghub.com/internet-real-time-social-media-statistics/

[2] (Roger Mougalas en un artículo publicado en Reilly Media)

[3] Cambridge Analytica (CA) fue una compañía privada que combinaba la minería de datos y el análisis de datos con la comunicación estratégica para el proceso electoral. La empresa fue creada en 2013 como una rama de la casa matriz Strategic Communication Laboratories (SCL), para participar en la política estadounidense.1? La consultora está especializada en la recopilación y en el análisis de datos para la creación de campañas publicitarias y políticas.2? En 2014, CA estuvo implicada en 44 campañas políticas estadounidenses. La compañía es en parte, propiedad de la familia de Robert Mercer, un administrador estadounidense de fondos de cobertura, quien respalda varias causas políticas de carácter conservador. Cuenta con oficinas en Londres, Nueva York, y Washington D. C.

En 2015, la empresa se revelo como la compañía de análisis de datos que trabajó para la campaña presidencial de Ted Cruz. En 2016, tras el fracaso de la candidatura de Cruz, CA trabajó para la campaña presidencial de Donald Trump.? Ex empleados de la compañía, revelaron que la empresa había trabajado con el PRO y Mauricio Macri en 2015, luego de revelar que SCL Group, nombre legal de Cambridge Analytica, elaboró una campaña anti-kirchnerista en mayo de 2015, cuando Mauricio Macri y Daniel Scioli se disputaban la presidencia de Argentina. ? Además influyó en la campaña para la retirada del Reino Unido de la Unión Europea y en las elecciones de Francia. La compañía cerró en el 2018 luego del escándalo por el robo de datos de Facebook.?

[4] El Dr. Martin Kosinski es experto en psicometría de las universidades de Cambridge y Stanford
 
[5] Martin Hilbert es profesor de la Universidad de California y doctor en Comunicación y Ciencias Económicas y Sociales.

[6]  metadatos  son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos que describen el contenido informativo de un objeto al que se denomina recurso. El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.

[7] Las “5 V” del Big Data

#1 Volumen
Tradicionalmente, los datos se han venido generando de forma manual. Ahora provienen de máquinas o dispositivos y se gestan de manera automática, por lo que el volumen a analizar es masivo.  Las cifras son abrumadoras. Y es que los datos que se producen en el mundo durante dos días equivalen a todos los generados antes del año 2003.

#2 Velocidad
El flujo de datos es masivo y constante. Este gran volumen provoca que los datos queden desfasados rápidamente y que pierdan su valor cuando aparecen otros nuevos. Las empresas, por lo tanto, deben reaccionar muy rápido para poder recopilarlos, almacenarlos y procesarlos.


#3 Variedad
El origen de los datos es altamente heterogéneo. Provienen de múltiples soportes, herramientas y plataformas: cámaras, smarthpones, coches, sistemas GPS, redes sociales, registros de viajes, movimientos bancarios, etc..  Los datos que se recopilan pueden venir estructurados (son más fáciles de gestionar) o no estructurados (en forma de documentos, vídeos, mensajes de correo electrónico, redes sociales, etc.).

#4 Veracidad
Esta característica del Big Data probablemente sea la que supone un mayor reto. El gran volumen de datos que se genera puede hacer que dudemos del grado de veracidad de todos ellos, ya que la gran variedad de los datos provoca que muchos de ellos lleguen incompletos o incorrectos.

#5 Valor
Esta característica representa el aspecto más relevante del Big Data. El valor que generan los datos, una vez convertidos en información, puede considerarse el aspecto más importante. Con ese valor, las empresas tienen la oportunidad de sacar el máximo partido a los datos para introducir mejoras en su gestión, definir estrategias más óptimas, obtener una clara ventaja competitiva, realizar ofertas personalizadas a los clientes, aumentar la relación con el público, y mucho más, incluso en el manejo de la Gestión Pública.

[8] Mark Elliot Zuckerberg es programador y empresario estadounidense, conocido por ser el fundador de Facebook.

Columnistas
2019-06-02T17:30:00

UyPress - Agencia Uruguaya de Noticias