Big Data es muy
importante, ya que no se trata de una moda pasajera. Frecuentemente el
fenómeno de Big Data se describe utilizando 5 V’s: Volumen, Velocidad,
Variedad, Veracidad y Valor. Para facilitar el entendimiento y la relevancia de la tecnología de Big Data, un medio conveniente es hacerlo a través de una breve explicación
de las 5 V en lenguaje sencillo:
Volumen
El volumen de
datos que se genera en el mundo en cada segundo es extraordinario. Pensemos en todos los
correos, mensajes de twitter, clips de video, etc. que se producen cada
segundo, no hablamos de Terabytes sino Zettabytes o Brontobytes. Como referencia,
si tomamos la data generada desde que el hombre está en la tierra hasta el año
2008, ella equivale a la cantidad que pronto estaremos produciendo en un
minuto.
Ello hace que los
conjuntos de datos sean demasiados grandes para ser almacenados y analizados
utilizando tecnología tradicional de bases de datos. Aplicando tecnología Big
Data, ahora podemos almacenar y usar esos conjuntos de datos con la ayuda de
sistemas distribuidos, donde distintas partes de la data son almacenadas en ubicaciones
diferentes y son integradas a traves de software.
Velocidad
Se refiere a la
velocidad en que nueva data es generada y la velocidad a la cual la data se
mueve de un lugar a otro. Pensemos solamente que mensajes en los medios
sociales pasan al status de viral en cuestión de segundos, la velocidad a la
cual las transacciones de tarjetas de créditos debe ser chequeadas para
determinar si son fraudulentas o los milisegundos que le toma a los sistemas de comercio analizar las redes
sociales para recoger e identificar señales que disparen acciones de compra o de venta.
La tecnología de
Big Data permite hoy en día analizar la data mientras la misma está siendo generada, sin
haberla nunca llevado a las Bases de Datos.
Variedad
Variedad se
refiere a los diferentes tipos de datos que utilizamos hoy. En el pasado
nos concentrábamos en data estructurada que encajaba perfectamente en tablas o
bases de datos relacionales, tal como data financiera. El hecho es que
hoy en día el 80% de la data que se maneja es no estructurada.
Con tecnología Big
Data hoy se pueden aprovechar diferentes tipos de data (estructurada y no estructurada)
incluyendo mensajes, conversaciones de redes sociales, fotos, datos
provenientes de sensores, grabaciones de video o voz e integrarlas a data estructurada
más tradicional.
Veracidad
Con Veracidad nos
referimos al desorden y a la confiabilidad de la data. Con los diferentes
tipos de Big Data la calidad y precisión son menos controlables (consideremos
solamente twits con hash tags,
abreviaturas, errores ortográficos y el lenguaje coloquial utilizado en ellos) y
es la tecnología de Big Data y de Analítica que nos permte trabajar con este
tipo de data.
El volumen con
frecuencia compensa por la falta de calidad o precisión.
Valor
Finalmente la
última, pero más importante V, se refiere al valor de la data. La data debe
tener valor para el negocio, lo cual la hace lo más relevante. Es
importante hacer un caso de negocios para cualquier proyecto para recolectar y
aprovechar Big data. Es muy fácil caer en la trampa de embarcarse en
grandes iniciativas de Big Data sin tener claridad y entendimiento de los
costos y beneficios.
El artículo en el
link, también facilita una presentación de apoyo, si se requiere.
http://linkd.in/O1D2aa
No hay comentarios.:
Publicar un comentario