¿Sabías que alrededor del 90 por ciento de todos los datos disponibles hoy en día en el mundo se generaron en los últimos años? Debido a las numerosas nuevas tecnologías de la información y comunicación, el volumen de datos en todo el mundo ha crecido increíblemente y ofrece posibilidades hasta ahora desconocidas. El Big Data representa este volumen de datos estructurados y no estructurados, que no pueden ser procesados con software o hardware convencional debido a su tamaño.
Estos volúmenes de datos se crean, entre otras cosas, con cada uno de nuestros clicsen Internet. Esto puede ser, por ejemplo, una compra en Amazon, una consulta de búsqueda en Google, actividad en redes sociales como Instagram o Facebook, etc.
Sin embargo, las grandes cantidades de datos por sí solas no constituyen el Big Data. Sólo el análisis y el procesamiento de estos volúmenes de datos, por ejemplo, por una empresa, constituye el Big Data. En 2001, el analista Doug Lane definió el concepto de Big Data, estableciendo un modelo 3-V que sigue vigente hoy en día. Según Lane, el Big Data tiene las siguientes tres características:
Volumen: Las empresas reúnen grandes volúmenes de datos de diversas fuentes. Estas incluyen dispositivos inteligentes (IO) como teléfonos móviles, videos, medios sociales, etc. En el pasado, no habría sido posible almacenar estos grandes volúmenes de datos; hoy en día, existen plataformas de almacenamiento para ello.
Velocidad: Las empresas procesan flujos de datos a velocidades sin precedentes y a grandes velocidades.
Variedad: Los datos recogidos son diversos y tienen una gran variedad de formatos: los datos numéricos, que están disponibles en forma estructurada y almacenados en bases de datos ordinarias, pueden formar parte del Big Data, así como los documentos de texto no estructurados, los datos de las transacciones financieras o los correos electrónicos.
Definición
Big Data
… representa una gran cantidad de datos disponibles que se analizan y procesan para un propósito específico. Según Doug Lane, el Big Data se caracteriza por su volumen, velocidad y diversidad.
Big Data vs. Small Data
A diferencia del Big Data, el Small Data se refiere a los datos en un volumen y formato accesible para los humanos. Los siguientes puntos muestran cómo se pueden distinguir el Big Data del Small Data:
Objetivos: el Small Data se usa para un objetivo concreto; el uso del Big Data, a menudo se desarrolla sin organización.
Ubicación: el Small Data se almacena generalmente en un lugar, por lo general en un solo archivo del ordenador, mientras que el Big Data suele estar repartidos en numerosos archivos en diferentes servidores ubicados en diferentes países.
Estructura de datos: el Small Data está estructurado en línea recta, mientras que el Big Data puede no estar estructurado y puede tener muchos formatos de archivo de diferentes campos.
Preparación de los datos: en la preparación del Small Data sólo suele participar un usuario final. Sin embargo, en el caso del Big Data, a menudo un grupo de personas prepara los datos, otro grupo los analiza y finalmente un tercer grupo los utiliza. Cada uno de estos grupos puede tener objetivos diferentes.
Durabilidad: el Small Data generalmente se conserva durante un cierto período de tiempo después de la finalización de un proyecto. En el caso del Big Data, sin embargo, los datos permanecen almacenados por un período de tiempo ilimitado.
Origen: el Small Data se almacena en poco tiempo y en unidades de medida específicas. El Big Data, por otro lado, se originan en diferentes lugares, países, compañías, organizaciones, etc.
Reproducibilidad: el Small Data generalmente puede ser reproducidos completamente. El Big Data, por el contrario, se origina en muchas fuentes diferentes y está disponibles en muchas formas por lo que su reproducción es imposible.
Calidad: los significados de los datos en un conjunto de Small Data son inequívocos, estos datos pueden por lo tanto describirse a sí mismos. El Big Data, por el contrario, son mucho más complejos y también pueden contener información no identificable que no tiene un significado específico. Esto puede reducir la calidad de los datos.
Análisis: para el análisis del Small Data suele bastar un único proceso, ya que los datos se analizan a partir de un solo archivo informático. En el caso del Big Data, los datos deben ser extraídos, comprobados, reducidos, en un proceso que requiere mucho tiempo.
Como puedes ver por la distinción entre Big Data y Small Data, es a menudo, difícil de comprender.
¿Sabías que alrededor del 90 por ciento de todos los datos disponibles hoy en día en el mundo se generaron en los últimos años? Debido a las numerosas nuevas tecnologías de la información y comunicación, el volumen de datos en todo el mundo ha crecido increíblemente y ofrece posibilidades hasta ahora desconocidas. El Big Data representa este volumen de datos estructurados y no estructurados, que no pueden ser procesados con software o hardware convencional debido a su tamaño.
Estos volúmenes de datos se crean, entre otras cosas, con cada uno de nuestros clics en Internet. Esto puede ser, por ejemplo, una compra en Amazon, una consulta de búsqueda en Google, actividad en redes sociales como Instagram o Facebook, etc.
Sin embargo, las grandes cantidades de datos por sí solas no constituyen el Big Data. Sólo el análisis y el procesamiento de estos volúmenes de datos, por ejemplo, por una empresa, constituye el Big Data. En 2001, el analista Doug Lane definió el concepto de Big Data, estableciendo un modelo 3-V que sigue vigente hoy en día. Según Lane, el Big Data tiene las siguientes tres características:
Definición
Big Data
… representa una gran cantidad de datos disponibles que se analizan y procesan para un propósito específico. Según Doug Lane, el Big Data se caracteriza por su volumen, velocidad y diversidad.
Big Data vs. Small Data
A diferencia del Big Data, el Small Data se refiere a los datos en un volumen y formato accesible para los humanos. Los siguientes puntos muestran cómo se pueden distinguir el Big Data del Small Data:
Como puedes ver por la distinción entre Big Data y Small Data, es a menudo, difícil de comprender.