28 de abril de 2014

Big Data: Las 5 V que todos debemos conocer


Big Data es muy importante, ya que no se trata de una moda pasajera.  Frecuentemente el fenómeno de Big Data se describe utilizando 5 V’s: Volumen, Velocidad, Variedad, Veracidad y Valor.  Para facilitar el entendimiento y la relevancia de la tecnología de Big Data, un medio conveniente es hacerlo a través de una breve explicación de las 5 V en lenguaje sencillo: 

Volumen 

El volumen de datos que se genera en el mundo en cada segundo es extraordinario.  Pensemos en todos los correos, mensajes de twitter, clips de video, etc. que se producen cada segundo, no hablamos de Terabytes sino Zettabytes o Brontobytes.  Como referencia, si tomamos la data generada desde que el hombre está en la tierra hasta el año 2008, ella equivale a la cantidad que pronto estaremos produciendo en un minuto. 

Ello hace que los conjuntos de datos sean demasiados grandes para ser almacenados y analizados utilizando tecnología tradicional de bases de datos. Aplicando tecnología Big Data, ahora podemos almacenar y usar esos conjuntos de datos con la ayuda de sistemas distribuidos, donde distintas partes de la data son almacenadas en ubicaciones diferentes y son integradas a traves de software. 

Velocidad 

Se refiere a la velocidad en que nueva data es generada y la velocidad a la cual la data se mueve de un lugar a otro.  Pensemos solamente que mensajes en los medios sociales pasan al status de viral en cuestión de segundos, la velocidad a la cual las transacciones de tarjetas de créditos debe ser chequeadas para determinar si son fraudulentas o los milisegundos que le toma a los  sistemas de comercio analizar las redes sociales para recoger e identificar señales que disparen acciones de compra o de venta.  

La tecnología de Big Data permite hoy en día analizar la data mientras la misma está siendo generada, sin haberla nunca llevado a las Bases de Datos. 

Variedad 

Variedad se refiere a los diferentes tipos de datos que utilizamos hoy.  En el pasado nos concentrábamos en data estructurada que encajaba perfectamente en tablas o bases de datos relacionales, tal como data financiera.  El hecho es que hoy en día el 80% de la data que se maneja es no estructurada. 

Con tecnología Big Data hoy se pueden aprovechar diferentes tipos de data (estructurada y no estructurada) incluyendo mensajes, conversaciones de redes sociales, fotos, datos provenientes de sensores, grabaciones de video o voz e integrarlas a data estructurada más tradicional.  

Veracidad 

Con Veracidad nos referimos al desorden y a la confiabilidad de la data.  Con los diferentes tipos de Big Data la calidad y precisión son menos controlables (consideremos solamente  twits con hash tags, abreviaturas, errores ortográficos y el lenguaje coloquial utilizado en ellos) y es la tecnología de Big Data y de Analítica que nos permte trabajar con este tipo de data. 

El volumen con frecuencia compensa por la falta de calidad o precisión. 

Valor 

Finalmente la última, pero más importante V, se refiere al valor de la data.  La data debe tener valor para el negocio, lo cual la hace lo más relevante.  Es importante hacer un caso de negocios para cualquier proyecto para recolectar y aprovechar Big data.  Es muy fácil caer en la trampa de embarcarse en grandes iniciativas de Big Data sin tener claridad y entendimiento de los costos y beneficios. 

El artículo en el link, también facilita una presentación de apoyo, si se requiere.

http://linkd.in/O1D2aa

No hay comentarios.:

Publicar un comentario