Las Vs del Big Data

Las Vs del Big Data

El Big Data ha surgido rápidamente en los últimos años y ha sido definido o caracterizado de diferentes formas. 

Podemos afirmar que los grandes datos se refieren a conjuntos de datos que no pueden ser administrados, procesados o almacenados por soluciones tradicionales de hardware/software. 

Algunos de los desafíos en la gestión de los datos son las dimensiones muy grandes del conjunto y el hecho de que los datos se producen continuamente o que los datos deben limpiarse antes de su uso para eliminar el ruido o los valores atípicos para el análisis correspondiente. 

Otra característica del Big Data es la utilización de un modelo de múltiples Vs

1.- Volatilidad

Los datos deben ser almacenados por diferentes cantidades de tiempo dependiendo de su validez o importancia. Debido a la velocidad y el volumen de los datos, su volatilidad debe considerarse cuidadosamente. Ahora hay que establecer reglas para la disponibilidad y la vigencia de estos datos, así como para garantizar una recuperación rápida de la información cuando sea necesario.

2. Variedad

Cualquier formato de datos (estructurados, no estructurados, semiestructurados) o incluso estructurados de forma muy complicada, es tratado por el Big Data. Por ello, almacenar y analizar datos sin formato mediante un sistema de gestión de bases de datos relacionales (RDBMS) es difícil. Los datos no estructurados, en cambio, ofrecen una información más importante que rara vez se encuentra en los datos estructurados. La diversidad de datos también implica una variedad de fuentes de datos. Por ello, esta característica de los Big Data también ofrece información sobre las fuentes de datos.

3. Validez

La validez y la veracidad comparten varias características. La validez de los Big Data, como implica el término, se refiere a la exactitud de los datos para su uso previsto. Sorprendentemente, una cantidad importante de big data queda inutilizada, lo que se denomina «datos negros». El resto de los datos no estructurados se limpian primero antes de ser analizados.

4. Veracidad

No todos los datos presentados para su tratamiento son útiles. Por tanto, no es aconsejable conservar o procesar datos enteros a menos que se hayan limpiado adecuadamente. Esta característica de los Big Data -la autenticidad- es especialmente importante cuando el volumen es tan grande. Estas cualidades también ayudan a determinar si los datos proceden de una fuente fiable o se ajustan bien al modelo analítico.

Las Vs del Big Data

5. Vulnerabilidad

Toda preocupación de seguridad respecto a los datos. Casos de hackeo y violación de datos para posteriores actividades ilegales.

6. Valor

Lo más probable es que los grandes datos se persigan por su valor comercial. Esta es quizá la característica más importante del Big Data. Porque no sirve de nada tener datos masivos si no se obtiene ninguna información comercial de ellos.

7. Velocidad

El concepto de Stream Analytics que se refiere al uso de tecnologías para manejar datos de alta velocidad. Pero, ¿sabe qué aspectos del Big Data están relacionados con la analítica de flujos? Es, sin duda, la velocidad de los datos. El término «velocidad» se refiere al ritmo al que se generan los datos, así como a la frecuencia con la que se proporcionan y procesan.

Un mejor caso es Google, que procesa unas 40,000 consultas de búsqueda por segundo, lo que se traduce aproximadamente en más de 3,5 mil millones de búsquedas por día.

8. Volumen

Cuando se trata de Big Data, el volumen es quizás el factor más importante a considerar. El rango de volumen justifica que se considere «grande» o no. Cuando el volumen de datos supera los Gigabytes, suele considerarse Big Data sólo desde el punto de vista del volumen. 

¿Qué significa el término «medir» en este contexto? Petabytes, Terabytes y Exabytes son todas las posibilidades. Es la cantidad de datos que hay que procesar en un tiempo determinado. Esto puede adoptar la forma de una cantidad que debe manejarse a lo largo del tiempo o una cantidad que debe procesarse de una sola vez.

9. Variabilidad

La inconsistencia de los datos es un problema frecuente en el análisis de Big Data, ya que los datos se reciben de varias fuentes. Además, contienen una gran variedad de tipos de datos. Por ello, la identificación de anomalías y valores atípicos es fundamental para extraer información útil de esta gran cantidad de datos. En consecuencia, uno de los rasgos distintivos del Big Data es la variabilidad.

10. Visualización

El procesamiento de grandes datos no es la única forma de obtener información útil de ellos. De nada sirve evaluar algo si no se puede expresar o ver de forma significativa. Por ello, el Big Data debe visualizarse con herramientas adecuadas que sirvan para muchos parámetros, para que los científicos de datos o los analistas puedan comprenderlos mejor. Por otra parte, trazar miles de millones de puntos de datos es una operación difícil. Además, conecta varias metodologías como los treemaps, los diagramas de red y los árboles de conos.

¿Cuántas Vs debería tener el Big Data?

Desde los comienzos, IBM y Gartner plantearon el Big Data como un modelo que abarca tres dimensiones (Volumen, Velocidad y Variedad) denominadas “Modelo de las tres V”.

Con las tres Vs es posible definir el Big Data como la unión de herramientas que trabajan conjuntamente y permiten captar, almacenar y gestionar un gran Volumen de información Variada a una alta Velocidad, permitiendo obtener datos para la toma de decisiones.

¿Pero las demás Vs? Todas y las que vienen, son y serán el complemento para contar con un Big Data moderno.

Fuentes de información para el presente Post: Investigación realizada por el Autor.

Síguenos en las Redes Sociales y ahora en todos los canales de Podcasts, para obtener actualizaciones periódicas y opiniones sobre lo que está sucediendo en el mundo de Project Manager, Agile, Big Data, Cloud, Scrum y mas…
Busca iPMOGuide en Facebook | Twitter | LinkedIn | Pinterest | Podcast

¿Tienes Telegram instalado?
Recibe este Post en nuestro canal, en tu móvil ó tablet.

Nos leemos pronto, ¡un abrazo!

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.