Minería de Datos (Data Mining) vs Grandes Datos (Big Data)

La Minería de Datos (Data Mining) también conocida como exploración de datos, se define como el analista de (a menudo grandes) datos que se establece para encontrar relaciones insospechadas, intentando descubrir patrones para resumir los grandes volúmenes de éstos en formas novedosas que sean comprensibles y útiles para el titular de los datos. La entrada normalmente se administra en una tabla y para la salida puede haber reglas, clústeres, estructuras de árbol, gráficos, ecuaciones, modelos, etc.

Por su parte, los Grandes Datos (Big Data), hace referencia a grandes cantidades de datos que superan la capacidad de procesamiento habitual del software informático existente. Por lo que Big Data es la tecnología capaz de capturar, gestionar y procesar en un tiempo razonable y de forma veraz estos datos, a través de herramientas (software) que identifiquen patrones comunes como definir características específicas de los consumidores, generar parámetros, métricas o procesos específicos que cambian por completo la forma de hacer negocios, encontrando nuevos nichos, aumentando la rentabilidad y productividad de las compañías.

El crecimiento del “universo digital” es el principal motor de la popularidad de Data Mining y Big Data. Ambas, pero sobre todo la minería de datos han venido madurando caracterizadas por métodos científicos sólidos y muchas aplicaciones prácticas.
Los grandes datos y la minería de datos son dos cosas diferentes. Ambos están relacionados con el uso de grandes conjuntos de datos para manejar la recolección o la presentación de los datos que sirve a empresas u otros destinatarios. Sin embargo, los dos términos se utilizan para dos elementos diferentes de este tipo de operación.

Big Data es un término para un conjunto de datos de gran tamaño. Conjuntos de grandes datos son aquellos que superan el simple tipo de arquitecturas de bases de datos y manejo de datos que se utilizaron en los primeros tiempos, cuando el procesamiento de los grandes datos era más caro y menos factible. Por ejemplo, conjuntos de datos que son demasiado grandes para ser fácilmente manejado en una hoja de cálculo Microsoft Excel podrían ser referidos a los conjuntos de datos tan grandes.

Data Mining por su parte, se refiere a la actividad de pasar por los conjuntos de grandes datos para buscar información pertinente u oportuna. Este tipo de actividad es realmente un buen ejemplo del viejo axioma “buscar una aguja en un pajar”. La idea es que las empresas recopilan conjuntos masivos de datos que pueden ser homogéneos y de forma automática. Los tomadores de decisiones necesitan tener acceso a partes más pequeñas y específicas de esos grandes conjuntos de datos. Éstas usan la minería de datos para descubrir las piezas de información que les permita mantener el liderazgo y ayude a trazar el curso de su negocio. La minería de datos puede implicar el uso de diferentes tipos de paquetes de software tales como herramientas de análisis. Puede ser automatizado, o puede ser en gran medida hecho a mano, donde trabajadores individuales envían consultas específicas de información a un archivo o base de datos. En general, la minería de datos se refiere a las operaciones que implican búsquedas relativamente sofisticadas que devuelven resultados específicos y concretos. Por ejemplo, una herramienta de minería de datos puede mirar a través de decenas de años de información contable para encontrar una columna específica de gastos o cuentas por cobrar por un año de funcionamiento específico.

En resumen, los Grandes Datos son el “activo” y la Minería de Datos es el “manejador” que se utiliza para proporcionar resultados beneficiosos.

Fuente: Nubia Márquez, Tuatara Tech

12-Data-Mining-Tools-and-Techniques-Invensis[1]

Newsletter

Su nombre es WATSON y su pasión: LOS DATOS

IBM Watson (en honor al fundador de la compañía Thomas Watson), es la primera plataforma de tecnol...

Minería de Datos (Data Mining) vs Grandes Datos (Big Data)

La Minería de Datos (Data Mining) también conocida como exploración de datos, se define como el a...

¿Cómo es el experto en Big Data? La profesión con más futuro del siglo XXI

El experto en Big Data o “data scientist” es una de las profesiones más prometedoras para el si...

Big Data y la Ilusión del Servicio 1 a 1

Una de las decepciones más grandes al escuchar o leer sobre Big Data, es caer en la cuenta de la br...