Big Data - Shomira/Proyecto-PAvanzada GitHub Wiki
Saltándonos un poco más, obviando acontecimientos redundantes nos damos cuenta que actualmente vivimos en la época de Big Data son formas de tratamiento de grandes volúmenes de datos, que se encuentra englobado por una serie de técnicas(principalmente matemáticas basadas en estadísticas ) para el tratado de los mismos, con esto se puede fundamentar que no son datos comunes, por tanto no se puede considerar su gestión mediante herramientas tradicionales como una base de datos.
Existen herramientas que tienen la capacidad de indexar los datos(ordenar los datos partiendo de un criterio común y especifico) y de esa forma sea más fácil consultarlos, analizarlos, generarlos mediante la sumersión en el mundo del Internet se recopilan posiblemente con una finalidad pero con el tiempo se pueden usar o servir para una infinidad de propósitos. Teniendo una sola finalidad en común, extraer información de valor de los datos que se recogen. Para expresar de mejor manera la extracción de los datos partimos desde las denominadas V, que con el tiempo va incrementándolas, a continuación se realiza una breve descripción de estas.
- Hace referencia a los macrodatos demasiados grandes para una computadora personal
- Demasiados formatos
- Basado en la Ley de MOORE, datos masivos son muy grandes para un sistema, posiblemente en otro sea la norma
- Datos que al entrar son muy rápidos un claro ejemplo se puede observar en Contador Web en Tiempo Real
- Falta de orden, texto no estructurado
- Tienen una alta influencia en cuanto a el análisis para la recopilación de datos
El tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo, actualmente se los considera a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.
Lo que hace que Big Data sea tan útil es el hecho de que proporciona respuestas a muchas preguntas o es considerado un punto de referencia. Con una cantidad tan grande de información, los datos pueden ser moldeados o probados de cualquier manera que se considere adecuada. Al hacerlo, las organizaciones son capaces de identificar los problemas y oportunidades que de otra forma no hubieran sido siquiera concebibles. Eso, a su vez, conduce a movimientos de negocios más inteligentes, operaciones más eficientes, mayores ganancias y clientes más felices.