NUEVA CATEGORÍA BI: SELF-SERVICE DATA PREPARATION

Según la definición de Gartner son herramientas interactivas orientadas al negocio que permiten preparar los datos y potenciar las capacidades de descubrimiento, exploración, estructuración y consumo analítico de la información. Tienen como objetivo reducir el tiempo y la complejidad de preparar los datos y mejorar la productividad analítica.

Características a destacar:

Aceleran las capacidades analíticas de Data Discovery y de Advanced Analytics.
Contribuyen al Data Governance incorporando técnicas de calidad de datos y soporte de metadatos pero no reemplazan los programas formales de Data Governance con las estructuras clásicas.
Flexibilizan el proceso del workflow de integración pero no reemplazan los procesos tradicionales de extracción, transformación y carga de datos corporativos.

El siguiente diagrama muestra el workflow y espacio de trabajo de estas herramientas:

data-preparation

Se pueden categorizar en tres segmentos distintos:

Stand Alone Data Preparation
Integradas como parte de una plataforma analítica de data science/advanced analytics
Integradas como parte de una plataforma de BI/data discovery/analytics

El crecimiento sin precedentes en los datos multi-estructurados (por ejemplo, XML, AVRO, JSON) han contribuido a un mayor esfuerzo necesario en la preparación de los datos para apoyar los procesos de toma de decisiones.

Por otra parte, la preparación de datos es una de las tareas más difíciles y que requieren mucho tiempo para usuarios de BI y herramientas de descubrimiento de datos, así como científicos de datos.

Self Services Data Preparation hacen frente a estos desafíos a través de capacidades tales como datos Data Lineage, Data Cataloging/inventorying, Data Discovery, Data Exploration, Data Transformation, Data Structuring, detección de patrones y de anomalías

Además están ampliando sus capacidades para incluir una gama más amplia de capacidades tales como:

■ El apoyo a las fuentes de datos adicionales.
■ Capacidades inteligentes mediante el aprovechamiento de las técnicas estadísticas y de machine learning.
■ Mejora de la experiencia de colaboración de usuario.
■ Capacidades de descubrimiento de datos mejorada.
■ Capacidades de calidad de datos mejorada.

Gartner prevé que, dentro de 5 años, muchas de las ofertas de los proveedores independientes o bien se ampliarán para ofrecer plataformas analíticas end to end, o se integrarán con proveedores de BI/Analytics que quieren incluir capacidades de preparación de datos como parte de sus plataformas de análisis.

El siguiente cuadro muestra algunas de las herramientas consideradas por Gartner como herramientas de Self Service Data Preparation:

data-preparation-2

nota4-grafico1[1]

Newsletter

Su nombre es WATSON y su pasión: LOS DATOS

IBM Watson (en honor al fundador de la compañía Thomas Watson), es la primera plataforma de tecnol...

Minería de Datos (Data Mining) vs Grandes Datos (Big Data)

La Minería de Datos (Data Mining) también conocida como exploración de datos, se define como el a...

¿Cómo es el experto en Big Data? La profesión con más futuro del siglo XXI

El experto en Big Data o “data scientist” es una de las profesiones más prometedoras para el si...

Big Data y la Ilusión del Servicio 1 a 1

Una de las decepciones más grandes al escuchar o leer sobre Big Data, es caer en la cuenta de la br...