NUEVA CATEGORÍA BI: SELF-SERVICE DATA PREPARATION

Según la definición de Gartner son herramientas interactivas orientadas al negocio que permiten preparar los datos y potenciar las capacidades de descubrimiento, exploración, estructuración y consumo analítico de la información. Tienen como objetivo reducir el tiempo y la complejidad de preparar los datos y mejorar la productividad analítica.

Características a destacar:

Aceleran las capacidades analíticas de Data Discovery y de Advanced Analytics.
Contribuyen al Data Governance incorporando técnicas de calidad de datos y soporte de metadatos pero no reemplazan los programas formales de Data Governance con las estructuras clásicas.
Flexibilizan el proceso del workflow de integración pero no reemplazan los procesos tradicionales de extracción, transformación y carga de datos corporativos.

El siguiente diagrama muestra el workflow y espacio de trabajo de estas herramientas:

data-preparation

Se pueden categorizar en tres segmentos distintos:

Stand Alone Data Preparation
Integradas como parte de una plataforma analítica de data science/advanced analytics
Integradas como parte de una plataforma de BI/data discovery/analytics

El crecimiento sin precedentes en los datos multi-estructurados (por ejemplo, XML, AVRO, JSON) han contribuido a un mayor esfuerzo necesario en la preparación de los datos para apoyar los procesos de toma de decisiones.

Por otra parte, la preparación de datos es una de las tareas más difíciles y que requieren mucho tiempo para usuarios de BI y herramientas de descubrimiento de datos, así como científicos de datos.

Self Services Data Preparation hacen frente a estos desafíos a través de capacidades tales como datos Data Lineage, Data Cataloging/inventorying, Data Discovery, Data Exploration, Data Transformation, Data Structuring, detección de patrones y de anomalías

Además están ampliando sus capacidades para incluir una gama más amplia de capacidades tales como:

■ El apoyo a las fuentes de datos adicionales.
■ Capacidades inteligentes mediante el aprovechamiento de las técnicas estadísticas y de machine learning.
■ Mejora de la experiencia de colaboración de usuario.
■ Capacidades de descubrimiento de datos mejorada.
■ Capacidades de calidad de datos mejorada.

Gartner prevé que, dentro de 5 años, muchas de las ofertas de los proveedores independientes o bien se ampliarán para ofrecer plataformas analíticas end to end, o se integrarán con proveedores de BI/Analytics que quieren incluir capacidades de preparación de datos como parte de sus plataformas de análisis.

El siguiente cuadro muestra algunas de las herramientas consideradas por Gartner como herramientas de Self Service Data Preparation:

data-preparation-2

nota4-grafico1[1]

Newsletter

Aplican “Machine Learning” en la búsqueda de medicamentos para el cáncer

El “Machine Learning” está revolucionando el descubrimiento de fármacos contra el cáncer. El ...

Qué necesitan saber las empresas sobre los sistemas de cómputo cognitivo

Si bien las herramientas de computación cognitiva han llegado lejos en utilidad, todavía tienen al...

Retos que enfrentan Self Services BI y Analytics

Las herramientas de BI de autoservicio se han convertido en el estándar para el software de intelig...

Intelligent Video: la clave para analizar grandes datos de vídeo

La tecnología de videovigilancia ha dado un salto cuántico en la última década. Ahora tenemos un...