¿Big Data o BI? … primos hermanos condenados a entenderse

28 Junio 2018 Por CIED

El crecimiento exponencial en la producción y consumo de datos en los últimos años, ha dado lugar a la aparición un nuevo vocabulario, que incluye no sólo nuevos términos, si no también nuevas acepciones de términos que ya existían.

En esta entrada queremos arrojar un poco más de luz desde un punto de vista más divulgativo que riguroso o científico, sobre en qué consisten dos de estos términos, cuál es la relación entre ellos y cómo se complementan. No obstante, antes de hacerlo conviene resaltar que en muchos casos la frontera es demasiado difusa, pudiendo llegar a difuminarse por completo dependiendo del caso o dominio concreto en el que nos encontremos.

Centrémonos primero en el Big Data. Si bien hay montones de definiciones - alguna muy ocurrente, como “todo lo que no cabe en un Excel” - podemos concluir que se trata de un término utilizado habitualmente para referirse a las ingentes cantidades de datos que las organizaciones manejan en la actualidad, y la forma en las que pueden explotarlos para generar cierto valor a la organización. Si queremos ser un poco más específicos, podemos recurrir a las populares 3 Vs (si bien últimamente se habla de 4, 5 o hasta 7 Vs, incluyendo términos como Validez, Veracidad ó Valor):

  • Volumen: hablamos de grandes conjuntos de datos.
  • Velocidad: esos datos deben ser consumidos rápidamente para no producir cuellos de botella a la entrada del sistema y, en muchas ocasiones deben ser procesados igual de rápido (pensemos en los datos enviados por los sensores de un tren por ejemplo: la velocidad de procesamiento influye directamente en la velocidad de reacción).
  • Variedad: trabajaremos con datos que responden a diferentes formatos, desde los tradicionales formatos relacionales (tabulares) a los en muchas ocasiones mal llamados no estructurados (XML, JSON, etc.). La razón de ser de esta variedad de formatos estriba en la necesidad de almacenar todo tipo de datos, desde los convencionales registros de bases de datos, a ficheros de audio y video, pasando por publicaciones y comentarios en redes sociales, etc.

Por otro lado, cuando hablamos de Business Intelligence (BI) estamos refiriéndonos fundamentalmente a las técnicas y herramientas que las organizaciones pueden utilizar para controlar el pulso de su negocio. En este contexto, pensamos típicamente en cuadros de mando y todo tipo de informes que proporcionan una vista general y agregada de parámetros y variables relevantes para el negocio: beneficio neto, nivel de satisfacción del cliente, ventas por zona geográfica, productos o servicios más vendidos, etc. Los avances en el área en los últimos años se han traducido en herramientas que permiten a usuarios no-técnicos personalizar cuadros de mando a su gusto, definir otros nuevos o realizar nuevos análisis causa-efecto.

Si nos ciñésemos a la concepción tradicional de ambos términos, podríamos decir que algunas de las principales diferencias entre Big Data y BI son:

  • Las soluciones Big Data suelen utilizar sistemas de ficheros distribuidos para el almacenamiento de información frente al servidor central (tradicionalmente conectado a un data warehouse) más propios de BI.
  • Otra teórica ventaja de las soluciones Big Data pasa por llevar el procesamiento de los datos al lugar donde están almacenados (procesamiento en paralelo), en lugar de trasladarlos a un único servidor que es quien los procesa, como suele ocurrir en las soluciones BI.
  • Ya hemos hablado de la variedad de formatos propia del Big Data, frente a la habitual utilización de datos relacionales (tablas, ya sean normalizadas o desnormalizadas) propias del BI.
  • Finalmente es habitual que las soluciones Big Data traten de explotar no sólo los datos de los que ya dispone la organización, si no también los datos en tiempo real que es capaz de consumir el sistema. Por el contrario, las soluciones BI han estado tradicionalmente asociadas al análisis de datos históricos (de nuevo, pensamos en soluciones basadas en un data warehouse).

En realidad, como ya comentamos al principio, esta frontera es mucho más difusa. No en vano, no son pocas las soluciones BI que no se limitan ya al análisis de datos transaccionales, si no que ya son capaces de trabajar también con datos en tiempo real y/o operacionales. En el fondo, podemos concluir que las herramientas y técnicas del Big Data vienen a ampliar el espectro de BI, permitiéndonos incluir en el análisis datos que hasta ahora no podíamos contemplar y, en definitiva, aportar más información, y por tanto mejorar, al proceso de toma de decisiones.

Así las cosas, conviene tener presente que el Big Data no es el martillo con el convertiremos todos los problemas en clavos, si no sólo una herramienta (o conjunto de herramientas más) que vienen a proporcionarnos soluciones para determinados dominios o contextos en los que necesitamos de esas soluciones. Para gran parte de esos dominios, las soluciones BI tradicionales seguirán siendo indispensables y, en muchos casos, más que suficientes, mientras que en otros casos convendrá potenciar sus capacidades con aquellas que nos proporciona el Big Data.

Si os ha resultado interesante este post, os animamos a consultar la oferta formativa de URJConline y en particular el plan de estudios de nuestro Máster en Ingeniería de Sistemas de Información, donde hablamos sobre estos y otros temas relacionados con la gestión de la información en la sociedad actual.

Ampliación Edif. Rectorado
Campus de Móstoles
Calle Tulipán s/n.
28933 Móstoles. Madrid

cied@urjc.es

Recibe inspiración