En la industria TI resuena fuerte el nuevo fenómeno de Big Data, pero es un término que aún está instalándose y no es tan claro para algunos players del mercado. ¿Qué es y cómo repercute en las empresas? 

Big Data es un término popular que se utiliza para explicar el crecimiento exponencial de la disponibilidad y el uso de la información. Muchos creen que es clave para la innovación, diferenciación y crecimiento de las empresas.

Los diversos orígenes de esta nueva tendencia se dan por la proliferación de sistemas y dispositivos, generando gran cantidad de información, que luego debe ser almacenada y procesada para la toma de decisiones.

Este crecimiento es exponencial porque lo hace desde tres dimensiones de manera simultánea:

•Volumen: se genera mayor cantidad de datos de distintos tipos, transacciones, textos, voz y videos, entre otros. Un dato significativo que podemos mencionar es el caso de YouTube donde se producen 72 hs. de video en sólo un minuto. 

•Variedad: los datos llegan en múltiples formatos -desde bases de datos estructuradas y tradicionales hasta documentos, emails, videos, audios y transacciones.

•Velocidad: se incrementa la necesidad de procesar los datos en tiempo real, debido a la velocidad con que son generados. 

Los diversos orígenes de esta nueva tendencia se dan por la proliferación de sistemas y dispositivos, generando gran cantidad de información, que luego debe ser almacenada y procesada para la toma de decisiones. 

Algunos de los ejemplos más representativos que podemos mencionar son:

•Sensores inteligentes aplicados a diferentes verticales que almacenan datos que son luego analizados para, por ejemplo, mejorar procesos industriales.

•Miles de pagos con tarjeta de crédito cada segundo alrededor del mundo.

•Millones de tweets por día. Miles de tweets por segundo.

•Numerosos comentarios en las paginas corporativas de las redes sociales.

•Gigas de archivos, documentos, planos, y muchos otros tipos de datos digitalizados y desestructurados para mejorar la eficiencia.

Big Data trae, además de los beneficios ya mencionados, algunos desafíos en cada una de sus cuatro etapas: 

*Generación: desafíos logísticos y técnicos para la instalación de dispositivos o la implementación de sistemas que son los generadores de la información cruda.

*Almacenamiento: dimensionamiento y crecimiento de la capacidad de storage para poder almacenar toda la información generada por suficiente tiempo y con la mayor calidad y detalle. 

*Procesamiento: dimensionamiento y know how para poder procesar toda la información y ser capaz de obtener información valiosa en un tiempo razonable.

*Trasmisión: entre cada etapa de las anteriores, se debe mover la información físicamente de un lugar a otro para poder ejecutar el siguiente paso. Desde el lugar en donde se genera la información al lugar donde se almacena. Desde el lugar donde se almacena al lugar donde se procesa. El desafío aquí es poder mover todo ese volumen de datos en un tiempo razonable y de manera segura.

Una variable común a todas las etapas en cuanto a los desafíos es, por supuesto, el costo de ejecutarlas. Y cada empresa necesita una correcta administración, ya que resulta crucial para la gestión de su negocio.