El poder de los datos densos

1517
Imagen de xresch en Pixabay

Mucho se ha dicho acerca del éxito logrado por Netflix en los últimos años y cómo ha utilizado datos masivos para conocer las preferencias de sus usuarios. Pero se conoce menos cómo ha logrado entender que sus suscriptores se sienten más poderosos cuando ven una serie antes que sus pares y pueden revelar el final para arruinarles la sorpresa; de allí la estrategia de lanzar simultáneamente todos los episodios de las series.

Jenifer María Campos Silva / 31 de mayo de 2021


 

En 1989, Erik Larson hizo referencia a los famosos datos masivos (big data), en el sentido usado actualmente; aunque sus inicios se remontan a los años treinta, cuando Alan Turing imaginaba una máquina capaz de realizar tareas de forma autónoma. Es en tiempos recientes cuando los avances tecnológicos han posibilitado el desarrollo de tales métodos. Hoy las herramientas asociadas a la inteligencia de negocios se han vuelto mucho más populares, principalmente en el mundo comercial, pues permiten dar respuestas a muchas preguntas clave y brindar resultados «confiables» que facilitan la toma de decisiones.

Los datos masivos poseen tres características —volumen, velocidad y variedad— comúnmente llamadas «las tres V». El volumen se refiere a la cantidad de datos; no por nada se llaman datos masivos o macrodatos. La velocidad se define como la cantidad de datos generados en cada unidad de tiempo, y a medida que las tecnologías avanzan la rapidez aumenta. La variedad significa que los datos masivos pueden ser estructurados y no estructurados; por lo tanto, su formato o escala de medición es irrelevante.

Hoy se habla de cinco, seis u ocho V de los datos masivos. También se consideran características tales como variabilidad (por los diferentes flujos de datos presentes), veracidad (que no es más que la calidad de los datos, la posibilidad de contrastarlos con otros y verificar su origen y valor), valencia y otras características más. Pocas personas dudan del valor de usar datos masivos en sus negocios. Sin embargo, aunque para Netflix ha significado un impulso en su estrategia, otras empresas como Nokia han fracasado estrepitosamente.

Nokia dominaba la venta de equipos de telefonía móvil durante el inicio del milenio; pero, a pesar de contar con una gran cantidad de información de sus usuarios y las tendencias del mercado, la dirección que tomó la empresa la llevó a tener que vender sus acciones a Microsoft en 2014. Mucho se ha escrito acerca de las divisiones internas entre los equipos de trabajo y las causas del fracaso comercial de la empresa. Para Wang (2016), el problema fue que «pusieron un valor más alto en los datos cuantitativos, no sabiendo cómo manejar datos que no eran fáciles de medir, y que no aparecían en los informes existentes. Lo que podría haber sido su inteligencia competitiva terminó significando su eventual caída». Este gigante no logró entender que debían desarrollar teléfonos inteligentes, no para unos pocos, sino para las masas. Sus productos no los iban a usar solo unas pocas élites, sino que debían ser asequibles para los millones de personas del mundo, independientemente de sus ingresos.

Fue así como, a pesar de contar con grandes cantidades de datos, la gente de Nokia no llegó a las conclusiones correctas y tomó una decisión equivocada para su negocio. Como explica Wang (2016), «lo que es medible no es lo mismo que lo que es valioso». Para Tank (2020), los datos masivos son especialmente útiles para brindar información acerca de todos los consumidores. Esta información se transforma en números y se identifican patrones que puedan interpretarse.

Los datos masivos ayudan a responder preguntas de negocio como las siguientes: ¿cuándo y dónde compran los consumidores un cierto producto? ¿Cuáles otros productos compran junto con este? ¿Cuánto pagan por el producto? ¿Cuáles son las características de este consumidor? Ahora bien, los datos masivos no pueden responder preguntas como, por ejemplo, ¿qué significa el producto para la persona, cómo lo utiliza y por qué adquiere un artículo y no otro?

 

Los datos densos

Es aquí donde se insertan los datos densos (thick data). Estos son datos cualitativos y se refieren a todos aquellos elementos que dan sentido a los números: sentimientos, emociones e historias personales que ayudan a entender el porqué de las situaciones (Wang, 2018). Para analizarlos no se requieren grandes muestras sino, más bien, el estudio en profundidad de unos pocos casos que ayudan a contextualizar los resultados y aportan un gran valor a la interpretación de distintas situaciones.

Los datos densos se relacionan con la etnografía: la ciencia que estudia y describe los pueblos y sus culturas. La etnografía ha sido usada principalmente en las llamadas investigaciones cualitativas, que para muchos carecen de rigor científico, pues piensan que se limitan al estudio de casos o la narración de historias personales, y que sus resultados no pueden extenderse a una población, pues carecen de representatividad. Lo que esas personas desconocen es que estos estudios pueden llegar a ser mucho más precisos que los que se realizan con grandes muestras.

Los datos no pueden estudiarse de forma aislada de su contexto. Solamente inducen cambios cuando se vuelven densos, mediante el significado social (Smith, 2018). Considerar los datos de forma aislada de la situación que los produce es como intentar elaborar un postre sin contar con una receta; con seguridad, el resultado no será el que se espera.

Para Tank (2020) los datos densos completan la imagen de los clientes que los números no proporcionan. Con el propósito de mejorar la relación de la empresa con el cliente, Tank propone dos tipos de acciones: 1) seguir preguntando qué es lo más importante para el cliente (aunque la primera respuesta sea usualmente la aceptada, suele ser insuficiente para comprender las motivaciones reales de las personas, es necesario seguir indagando) y 2) tener una mentalidad basada en la empatía (comprender lo que siente el cliente y ponerse en su posición, percibir el mundo a través de sus sentidos).

 

¿Datos masivos o densos?

Para entender mejor sus diferencias es necesario, primero, precisar en qué consiste cada uno de acuerdo con varios criterios.

 

Tipo de aprendizaje

La estrategia de datos masivos se basa en el aprendizaje de máquinas (machine learning): la capacidad de las máquinas para aprender por sí mismas; es decir, para cambiar y generar nuevos algoritmos y resultados basadas en la información primaria que reciben. Por su parte, la estrategia de datos densos se basa en el aprendizaje humano: un proceso que integra no solo la información recibida, sino también las experiencias y sentimientos asociados, lo que, aún, una máquina no ha podido replicar.

 

Tamaño de la muestra

Los datos masivos, como su nombre lo dice, requieren muestras muy grandes y medir grandes cantidades de variables, por lo que resulta superior en términos de escala, pero no en términos de foco de las conclusiones. Por su parte, los datos densos no requieren muestras grandes; el método etnográfico se concentra en muestras pequeñas, por lo que la escala es mucho menor, pero las conclusiones obtenidas pueden llegar a ser mucho más precisas y nítidas.

 

Información recolectada

Los datos masivos usan una serie de variables medidas en los individuos de la muestra; luego se acotan a lo que estas revelen, pues las variables se definen previamente al estudio. Los datos densos se circunscriben al contexto donde surgen los datos, muestran las relaciones presentes entre ellos y permiten la introducción de nuevas variables, a medida que el estudio progresa y se conoce más sobre el tema.

 

Metodología

La estrategia de datos masivos evalúa los números —valores de las variables en los individuos— y busca la presencia de patrones —cuanto más se repitan estos patrones mayor será la precisión del resultado— y así reduce la realidad a uno o varios modelos que permiten replicar estos resultados con cierto grado de confiabilidad. Mientras que la estrategia de datos densos acepta y entiende la complejidad del mundo y de las personas: no busca simplificarlo sino más bien alcanzar su comprensión global.

 

Objetivo

Los datos masivos dan respuesta a las preguntas qué, quién y dónde. Mientras que los datos densos intentan responder al cómo y al por qué. Por ello, ambos enfoques deben ser complementarios.

 

Opiniones contrarias

A pesar de las ventajas de los datos densos identificadas hasta ahora, el enfoque también tiene sus detractores, como es el caso de Thompson (2019), para quien no es más que una estrategia de marca y la considera un «concepto oportunista» que finalmente demostrará ser una maniobra contraproducente. Si bien entiende que para sus defensores los datos densos contribuyen a la interpretación cultural de la información y su contexto, Thompson cree que tal estrategia no va más allá de una promesa de disponer de mejores datos, en el sentido más amplio de la palabra, ni ofrece evidencia suficiente de hacer contribuciones reales a la investigación de mercado necesaria en el siglo XXI.

La realidad es que lograr la transformación requerida por las empresas es algo muy costoso, tanto en términos materiales como en recursos humanos, y la investigación consume gran parte de los recursos, por lo que necesitan asegurarse de contar con buenas herramientas. Una de ellas es la estrategia de datos masivos, pero esta debe entenderse «como un medio para un fin y no como un fin en sí mismo. Los datos densos son un nuevo enfoque etnográfico que descubre el significado detrás de la visualización y el análisis de datos masivos» (Alles y Vasarhelyi, 2014: 95)

«Más números no necesariamente producen más conocimientos» (Wang, 2016). Los datos no son neutros, aunque a simple vista pudieran parecerlo: «los tipos de datos recopilados, los métodos utilizados, la forma en que se interpretan, lo que se pasa por alto, el contexto donde se generan y por quién, y qué hacer como resultado, son opciones que dan forma a los hechos de un asunto» (Smith, 2018) y tienen una gran influencia en las decisiones que se toman.

Así como los equipos de trabajo suelen agrupar profesionales de diferentes campos, en busca de interdisciplinariedad, lo mismo ocurre con los tipos de datos y las técnicas de análisis. El mundo no es blanco o negro. Viene en una amplia gama de colores y la forma de apreciar los distintos matices es hacer uso conjunto de datos masivos y densos, lo que permitirá tener una visión global y mucho más realista de lo acontece.

En palabras de Wang (2016): «El acto de recolección y análisis de historias produce ideas. En última instancia, una relación entre un actor y una organización o marca es emocional, no racional». Los datos masivos no permiten medir o entender esa emocionalidad; mientras que el análisis de datos densos parece ser la herramienta adecuada para ello. No hay que tener miedo de estudiar los elementos intangibles de las personas y de los negocios, pues son precisamente los que causan las mayores diferencias.


Jenifer María Campos Silva, profesora del IESA.

Referencias

Alles, M. y Vasarhelyi, M. A. (2014). Thick data: Adding context to big data to enhance auditability. International Journal of Auditing Technology, 2(2), 95-108.

Smith, A. (2018, 18 de abril). Smart cities need thick data, not big data. The Guardian. https://www.theguardian.com/science/political-science/2018/apr/18/smart-cities-need-thick-data-not-big-data

Tank, A. (2020, 21 de septiembre). How thick data gives your business a competitive edge. JotForm. https://www.jotform.com/blog/thick-data/

Thompson, C. J. (2019). The ‘big data’ myth and the pitfalls of ‘thick data’opportunism: On the need for a different ontology of markets and consumption. Journal of Marketing Management, 35(3-4), 207-230.

Wang, T. (2016, 26 de mayo). ¿Por qué big data necesita thick data? Medium. https://medium.com/@triciawang/por-qu%C3%A9-big-data-necesita-thick-data-fbbe11dfb088