Información inexplorada: el lado oscuro de la información masiva

1970
Leyenda: Vitaly Vlasov / Pexels

¿Cuánta información produce la empresa? ¿Cuánta información almacena? ¿Cuánta utiliza? Todo negocio debe hacerse estas preguntas. Al responderlas tendrá una mejor idea del potencial que le falta por desarrollar.

Jenifer María Campos Silva / 11 de mayo de 2020


 

Francis Bacon dijo «el conocimiento es poder» hace unos cuatrocientos años. Esta frase sigue siendo válida, pero, ¿cómo se adquiere ese conocimiento? Una parte puede obtenerse en la escuela, en los libros, en internet y distintos medios audiovisuales. Otra puede pasar de generación en generación a través de relatos, entre otros medios. Estas formas de transmisión de saberes permiten a las personas aprender a comportarse en sociedad, ser funcionales y aportar a su comunidad. Pero, cuando se hace referencia al conocimiento necesario para poner en marcha un negocio, hacerlo funcionar día tras día y lograr que crezca y prospere, estos mecanismos resultan insuficientes.

En la llamada «era de la información» quienes la posean y la utilicen alcanzarán los mayores beneficios. Ahora bien, a cada segundo las personas producen información, mediante los sitios de internet que visitan, juegos en línea, conversaciones, publicaciones, «me gusta» y comentarios en redes sociales, llamadas telefónicas, compras, ventas, solicitudes, preguntas. Son innumerables las formas de producir información.

Esto se debe en gran medida a los cambios que ocurren en los mercados. Cada vez es más frecuente que las interacciones entre consumidores y proveedores ocurran de forma digital, lo que crea la llamada «huella digital» y produce mucha información que debe ser aprovechada por las empresas para mejorar.

La información inexplorada se compara con la materia oscura (en física): se sabe que existe y está allí, pero (aún) no se le extrae utilidad alguna

Los avances tecnológicos han permitido no solo crear registros, sino también almacenarlos para su posterior uso. Sin embargo, no toda la información producida se utiliza, y es allí donde surge lo que el glosario de la empresa Gartner (2020) define como datos oscuros (dark data) a los «activos de información que las organizaciones recopilan, procesan y almacenan durante las actividades comerciales regulares, pero que generalmente no se utilizan para otros fines (por ejemplo, análisis, relaciones comerciales y monetización directa)».

Pueden encontrarse diferentes tipos de información inexplorada:

  • Datos que no se recopilan; es decir, toda la información que se produce y no se registra o no se almacena.
  • Datos que se recopilan, pero cuyo acceso es difícil, en el momento y lugar correctos, porque la estructura de los datos no es uniforme.
  • Datos que se recopilan y están disponibles, pero no se han convertido en productos o servicios y, por lo tanto, se desaprovechan (Banafa, 2015).

Gartner compara la información inexplorada con la materia oscura (en física): se sabe que existe y está allí, pero (aún) no se le extrae utilidad alguna. En una encuesta realizada por Splunk (2019), compañía líder en programas de inteligencia operativa, en siete países y más de 1.300 negocios, los participantes informaron que más de la mitad de los datos de sus organizaciones son oscuros. El único país que presenta una situación distinta es China, donde menos de la mitad de los datos son oscuros.

 

¿Por qué no se usa la información que se produce?

La mayoría de los participantes en la encuesta de Splunk (2019) está de acuerdo en que sus empresas deben sacar mayor provecho de la información que poseen, pero no lo hacen. ¿Por qué, si tienen la información y la tecnología para procesarla? Los motivos son muchos y variados, según la industria. Entre los más frecuentes aparecen:

  1. La cantidad de información requiere un plan de acción claro y conocimiento técnico para organizarla de forma útil.
  2. Faltan habilidades para comprender o trabajar los datos. Existen pocas personas con la formación necesaria —matemática, estadística, informática y conocimiento de la industria— para manejar los datos y transformarlos en información comprensible.
  3. Faltan recursos (programas) para el procesamiento de la información, cuyo desarrollo y mantenimiento es costoso. La inversión necesaria no está al alcance de todas las empresas y no siempre es una prioridad.
  4. Es difícil coordinar el trabajo entre los distintos departamentos: el personal que produce los datos es distinto del que los procesa y este, a su vez, es distinto del que toma las decisiones finales. Adicionalmente, cada área utiliza un lenguaje diferente y, por lo tanto, llegar a acuerdos es más difícil.
  5. Nadie se dedica a encontrar datos que la organización posee: la información está allí, nadie más la tiene y no es prioritario su análisis.
  6. Falta control sobre aplicaciones y dispositivos que producen los datos, usualmente subcontratados, y se desconocen sus potencialidades.
  7. Falta interés de los líderes de las organizaciones: si un proyecto no tiene un beneficio evidente, la asignación de recursos es poco factible.
  8. Falta creatividad: las empresas enfrentan un mundo desconocido con esa información inexplorada, y sacarle provecho requiere «pensar fuera de la caja» y buscar soluciones novedosas.

La premisa de muchas empresas —que afirman estar impulsadas por los datos— se queda en un lema o un deseo en el imaginario de quienes la dirigen, en lugar de convertirse en una realidad y una pauta de trabajo clara en todos los departamentos de la organización.

La transformación de datos no estructurados en activos legibles implica procesos que son principalmente manuales

Una de las dificultades que enfrentan las empresas interesadas en usar la información que poseen y no utilizan es, sin duda, la naturaleza de los datos que fluyen a través de la organización, producidos por diversos sistemas, dispositivos e interacciones. Todos quedan registrados en alguna parte, pero lo usual es que su formato sea inconsistente y varíe según la fecha, el equipo o incluso debido a factores no identificados, lo que dificulta su aprovechamiento. Es posible que ni siquiera se tenga conocimiento de la existencia de tales registros.

 

¿Cómo iluminar los datos oscuros?

Para Louvrier (2019), los datos oscuros son una «mina de oro desconocida» y para sacarles el máximo provecho es necesario atender a sus principales características: «datos no estructurados, sin etiquetar y sin explotar que aún no se han analizado y procesado».

El enfoque de las empresas que deseen aprovecharlos debe ser más avanzado que el usual, en cuanto al modo de recopilarlos, organizarlos y analizarlos. El primer paso consiste en darle una estructura a la información existente, que sea consistente con los programas de análisis y fácilmente convertible y reproducible. En segundo lugar, los datos deben ser debidamente organizados y catalogados, para analizarlos y obtener beneficios de ellos.

Banafa (2015) alerta, con respecto a los datos, que «destruirlos podría ser muy arriesgado, pero analizarlos puede ser costoso». Deshacerse de los datos disponibles no sería acertado, pues se eliminaría también la posibilidad de aprender y mejorar a partir de su análisis. Pero «la transformación de datos no estructurados en activos legibles implica procesos que son principalmente manuales» (Louvrier, 2019). Para optimizar su valor es indispensable que las empresas automaticen esos procesos para que, en lugar de realizar tareas rutinarias, los recursos humanos se dediquen a las actividades más creativas, que requieren juicio humano. Adicionalmente, la automatización tiene la ventaja de disminuir el tiempo de ejecución de los procesos, lo que se traduce en disminución de los costos.

Cada vez más se reduce el tiempo entre el momento en el que se obtiene la información y el momento en el que se actúa. Muchas decisiones se toman en tiempo real. Ello requiere, en el ámbito operativo, tecnologías capaces de analizar una gran cantidad de datos en poco tiempo, y aprender cada vez que lo hagan; aunque, en el ámbito estratégico, sean las personas quienes tomen las decisiones.

Aprovechar la información inexplorada requiere «comprender las relaciones entre piezas aparentemente no relacionadas» (Louvrier, 2019). La clave para lograrlo radica no en recopilar datos, sino en estudiarlos y analizarlos para aprender de ellos y obtener nuevos conocimientos mediante el descubrimiento de patrones no perceptibles a simple vista, para poner en práctica nuevas ideas.

La empresa Splunk (2019) ofrece las siguientes recomendaciones a las empresas que deseen explotar al máximo el potencial oculto en sus datos:

  • Entender que la inteligencia artificial es una realidad cada vez más cercana a ellas.
  • Construir una infraestructura y una cultura basada en los datos.
  • Reclutar capital humano que posea la combinación de habilidades necesaria para trabajar con los datos.
  • Proveer oportunidades de entrenamiento al personal existente y al nuevo, para responder a esta nueva realidad.

Las organizaciones necesitan una comprensión profunda de sus procesos actuales. Los tiempos actuales exigen una velocidad de respuesta acelerada: cómo pueden hacer lo que hacen más rápidamente. Una vez resuelto este problema, el siguiente paso es cómo hacerlo de forma más económica —disminuir costos— y luego cómo hacerlo mejor (Mishra, 2019). Este es un ciclo que se va a repetir, a medida que otras organizaciones alcancen las metas e incluso las superen.

El futuro éxito de una organización estará determinado por los datos; es decir, por el uso que haga de ellos y la velocidad a la que pueda implementar los cambios requeridos, tanto en adopción de tecnología como en formación de personal para operar la tecnología. De esta forma, la educación de los empleados adquiere un papel fundamental en estos momentos, y es lo que puede marcar la diferencia (Eid, 2019).

 

Referencias

  • Banafa, A. (2015): «Entender el dark data». OpenMind: https://www.bbvaopenmind.com/tecnologia/mundo-digital/entender-el-dark-data/
  • Eid, S. (2019): «Turn the light on dark data». CSO: https://www2.cso.com.au/article/664983/turn-light-dark-data/
  • Gartner (2020): «Dark data». Gartner Glossary: https://www.gartner.com/it-glossary/dark-data
  • Louvrier, L. (2019): «The rise of machine learning to manage dark data». Technative: https://www.technative.io/the-rise-of-machine-learning-to-manage-dark-data/
  • Mishra, G. (2019): «Revealing the hidden value in dark data deposits». Siliconangle: https://siliconangle.com/2019/08/02/qa-revealing-the-hidden-value-in-dark-data-deposits-mitcdoiq/
  • Splunk (2019): «The state of dark data: industry leaders reveal the gap between AI’s potential and today’s data reality»: https://www.splunk.com/pdfs/dark-data/the-state-of-dark-data-report.pdf

Jenifer María Campos Silva, profesora del IESA.