EVITAR LAS SORPRESAS: ANÁLISIS PREDICTIVO

Si echamos la vista atrás, 2016 fue un año lleno de sorpresas en el ámbito político: el inesperado “Sí” al Brexit en el Reino Unido, la victoria de Donald Trump en las elecciones presidenciales americanas, el “No” al tratado de paz con las FARC en Colombia o, ya en clave nacional, el no cumplimiento del anunciado sorpasso de Unidos Podemos al PSOE en las elecciones de junio. Nadie se esperaba lo que finalmente ocurrió. ¿Por qué? Sencillamente porque todas las encuestas indicaban lo contrario.

Estamos hartos de ver cómo las encuestas fallan una y otra vez. Aun así, seguimos confiando en ellas. Y, ¿por qué fallan las encuestas? Por varios motivos:

  • Las muestras pueden no ser suficientemente significativas para tener relevancia
  • Los encuestados pueden mentir a las preguntas formuladas
  • Las variables seleccionadas como más relevantes para el estudio no siempre son las más adecuadas.

En el caso de Trump, las encuestas inicialmente lo daban como perdedor porque  se equivocaron al estimar cómo sería el electorado de su campaña: pronosticaron que el perfil de votante medio de Trump se aferraba más a los pilares ideológicos republicanos de lo que lo hacía verdaderamente.

También, en las últimas elecciones celebradas en España (las del 26 de junio de 2016), las encuestas daban por seguro el famoso sorpasso de Unidos Podemos al PSOE. Dicho sorpasso finalmente no se produjo y el día después de las elecciones parecía que todo el mundo estaba sorprendido porque las encuestas habían fallado.

Ambos casos, sirven como ejemplo de que se están haciendo predicciones que no son suficientemente sólidas porque no se basan en información objetiva.

Sin embargo, hubo analistas que, en base a ciertas variables, sí predijeron lo que finalmente pasó. Entonces, ¿cómo supieron el resultado correcto?

En lo que respecta a la campaña de Trump, los analistas vieron que estaba canalizando a su favor el descontento de parte de la sociedad estadounidense con respecto a tres cuestiones: inmigración, corrupción y bajos salarios, cuestiones que no necesariamente formaban parte de un programa tradicional republicano; es decir, que no todos los potenciales votantes eran republicanos fieles, hecho al que no se le dio la suficiente relevancia.

En el caso del no sorpasso, un análisis del electorado de Podemos en las elecciones anteriores (noviembre 2015), llevó a los analistas a predecir que el pacto con Izquierda Unida iba a hacer que ciertos sectores de ese electorado cambiasen el sentido de su voto.

Partiendo de estos hechos, se demuestra que haciendo un análisis de los datos de que se dispone se pueden obtener resultados más fiables. Esta metodología está cada vez más presente en el mundo empresarial, y es lo que se conoce como Business Analytics o “análisis predictivo”.

El análisis predictivo consiste en utilizar los datos para pronosticar lo que puede pasar en el futuro. A partir del análisis de la información disponible – presente y pasado, podemos determinar la información de la que no disponemos – futuro. El Business Analytics (BA) se apoya en la minería de datos (proceso que intenta descubrir patrones en grandes volúmenes de datos) para la búsqueda de relaciones entre los mismos, y la generación de información que produzca nuevo conocimiento. Es decir, mediante el análisis de los datos, podremos planear acciones concretas que se aprovechen de ese conocimiento adquirido para obtener un beneficio.

Business Analytics también se preocupa por predecir o pronosticar comportamientos futuros, para lo cual emplea Modelos Predictivos que se basan de manera automática en el análisis de tendencias históricas de los datos, así como en el análisis probabilístico de la ocurrencia de sucesos para así estimar eventos futuros.

Un ejemplo de aplicación de esta metodología sería el sector automovilístico. En los coches cada vez se están incorporando más (y mejores) sensores con el objetivo de extraer y almacenar información. Con el mismo fin se analizan las memorias de error e informes de reparación de los vehículos. El desafío para las compañías automovilísticas es manejar toda esa información de la manera más eficiente posible para mejorar sus vehículos, así como el servicio:

  • Se puede utilizar la información de la autonomía de una carga de batería/gasolina para estimar cuál es el punto más lógico en el que construir una nueva estación. Esto tiene mucha utilidad ahora que están empezando a entrar en el mercado los vehículos eléctricos (ej: Tesla).
  • Se pueden prevenir fallos mediante el análisis predictivo de las causas de los errores en el funcionamiento de los vehículos.
  • Se puede mejorar la asistencia a la conducción mediante algoritmos de aprendizaje automáticos alimentados por la información obtenida.

Por tanto, aunque se trata de una metodología que ya existe hace tiempo, es ahora cuando está llegando con mayor fuerza al mercado. Así, se trata de una gran oportunidad para las empresas cuyo negocio es la consultoría tecnológica, y, en particular, para las de Testing. En nuestro ámbito, se trata de un campo poco explorado, y nuestra mayor aportación se vería reflejada en todo lo que se refiere a calidad del dato, así como a la calidad de las aplicaciones utilizadas para realizar las predicciones. También sería de gran utilidad a la hora de estimar la cobertura de las pruebas que se llevarán a cabo.

La calidad del dato se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes. Se puede decir que los datos son de calidad cuando representan a la realidad que pretenden describir. La calidad del dato se puede evaluar en función de distintas dimensiones:

  • Completitud: ¿Están todos los datos?
  • Consistencia: ¿Los datos son los mismos en todos los sistemas?
  • Unicidad: ¿Hay una única vista de los datos?
  • Validez: ¿Coinciden los datos con las reglas sintácticas: formato, tipo, rango, …?
  • Precisión: ¿Los datos describen correctamente la realidad?

En definitiva, el mundo de los datos en el que vivimos está cambiando nuestra forma de enfrentarnos al futuro. A partir de los datos que tenemos, podemos generar información útil para la toma de decisiones gracias al análisis predictivo. Ahora es el momento de aprovechar la gran oportunidad que se presenta y empezar a trabajar en este ámbito desde el punto de vista de la calidad.

NOTA: En futuros artículos se profundizará en las distintas técnicas de análisis predictivo y selección de las variables óptimas, así como de las herramientas existentes de análisis predictivo y su aplicación al ámbito del Testing.

Referencias:

  1. Antonio Papell – “Por qué no habrá ‘sorpasso’ el 26J” – Analytiks

http://www.bolsamania.com/analytiks/2016/05/29/por-que-no-habra-sorpasso-el-26j/.

  1. Joshua Green y Sasha Issenberg – “Trump’s Data Team Saw a Different America – And They Were right” – Bloomberg

https://www.bloomberg.com/news/articles/2016-11-10/trump-s-data-team-saw-a-different-america-and-they-were-right

  1. Introducción a los sistemas de información – Sajid Abad – OBS Business School
  2. Análisis predictivo – Fundación Big Data

http://fundacionbigdata.org/analisis-predictivo/

  1. Gestionar la Calidad de Datos – Sajid Abad – OBS Business School
  2. “Ford and Analytics” – Practicalanalytics

Business Analytics 101

 

Un artículo de Álvaro Martínez López-Zuazo y Paloma Rodríguez Prieto

Anuncios

Deja tu comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: