Minería de Datos (Data Mining) vs Grandes Datos (Big Data)

La Minería de Datos (Data Mining) también conocida como exploración de datos, se define como el analista de (a menudo grandes) datos que se establece para encontrar relaciones insospechadas, intentando descubrir patrones para resumir los grandes volúmenes de éstos en formas novedosas que sean comprensibles y útiles para el titular de los datos. La entrada normalmente se administra en una tabla y para la salida puede haber reglas, clústeres, estructuras de árbol, gráficos, ecuaciones, modelos, etc.

Por su parte, los Grandes Datos (Big Data), hace referencia a grandes cantidades de datos que superan la capacidad de procesamiento habitual del software informático existente. Por lo que Big Data es la tecnología capaz de capturar, gestionar y procesar en un tiempo razonable y de forma veraz estos datos, a través de herramientas (software) que identifiquen patrones comunes como definir características específicas de los consumidores, generar parámetros, métricas o procesos específicos que cambian por completo la forma de hacer negocios, encontrando nuevos nichos, aumentando la rentabilidad y productividad de las compañías.

El crecimiento del “universo digital” es el principal motor de la popularidad de Data Mining y Big Data. Ambas, pero sobre todo la minería de datos han venido madurando caracterizadas por métodos científicos sólidos y muchas aplicaciones prácticas.
Los grandes datos y la minería de datos son dos cosas diferentes. Ambos están relacionados con el uso de grandes conjuntos de datos para manejar la recolección o la presentación de los datos que sirve a empresas u otros destinatarios. Sin embargo, los dos términos se utilizan para dos elementos diferentes de este tipo de operación.

Big Data es un término para un conjunto de datos de gran tamaño. Conjuntos de grandes datos son aquellos que superan el simple tipo de arquitecturas de bases de datos y manejo de datos que se utilizaron en los primeros tiempos, cuando el procesamiento de los grandes datos era más caro y menos factible. Por ejemplo, conjuntos de datos que son demasiado grandes para ser fácilmente manejado en una hoja de cálculo Microsoft Excel podrían ser referidos a los conjuntos de datos tan grandes.

Data Mining por su parte, se refiere a la actividad de pasar por los conjuntos de grandes datos para buscar información pertinente u oportuna. Este tipo de actividad es realmente un buen ejemplo del viejo axioma “buscar una aguja en un pajar”. La idea es que las empresas recopilan conjuntos masivos de datos que pueden ser homogéneos y de forma automática. Los tomadores de decisiones necesitan tener acceso a partes más pequeñas y específicas de esos grandes conjuntos de datos. Éstas usan la minería de datos para descubrir las piezas de información que les permita mantener el liderazgo y ayude a trazar el curso de su negocio. La minería de datos puede implicar el uso de diferentes tipos de paquetes de software tales como herramientas de análisis. Puede ser automatizado, o puede ser en gran medida hecho a mano, donde trabajadores individuales envían consultas específicas de información a un archivo o base de datos. En general, la minería de datos se refiere a las operaciones que implican búsquedas relativamente sofisticadas que devuelven resultados específicos y concretos. Por ejemplo, una herramienta de minería de datos puede mirar a través de decenas de años de información contable para encontrar una columna específica de gastos o cuentas por cobrar por un año de funcionamiento específico.

En resumen, los Grandes Datos son el “activo” y la Minería de Datos es el “manejador” que se utiliza para proporcionar resultados beneficiosos.

Fuente: Nubia Márquez, Tuatara Tech

12-Data-Mining-Tools-and-Techniques-Invensis[1]

Newsletter

La Compra Cognitiva, una experiencia real

Según el estudio de IBM “El consumidor es el canal”, el 94% de los directivos de la industria d...

Requisitos que deben cumplir las empresas antes de poner en marcha proyectos de Big Data

El Big Data ayuda a las empresas a mejorar sus resultados, equilibrar la oferta a la demanda, anti...

¿Qué beneficios puede aportar una consultoría de Big Data?

Mejorar procesos de negocio con Big Data Un ejemplo claro de la mejora de procesos es la selección...

Data visualization: ¿qué necesitas?

Data visualization es el preludio del análisis. La visualización, así entendida, es la aplicació...