NUEVA CATEGORÍA BI: SELF-SERVICE DATA PREPARATION

Según la definición de Gartner son herramientas interactivas orientadas al negocio que permiten preparar los datos y potenciar las capacidades de descubrimiento, exploración, estructuración y consumo analítico de la información. Tienen como objetivo reducir el tiempo y la complejidad de preparar los datos y mejorar la productividad analítica.

Características a destacar:

Aceleran las capacidades analíticas de Data Discovery y de Advanced Analytics.
Contribuyen al Data Governance incorporando técnicas de calidad de datos y soporte de metadatos pero no reemplazan los programas formales de Data Governance con las estructuras clásicas.
Flexibilizan el proceso del workflow de integración pero no reemplazan los procesos tradicionales de extracción, transformación y carga de datos corporativos.

El siguiente diagrama muestra el workflow y espacio de trabajo de estas herramientas:

data-preparation

Se pueden categorizar en tres segmentos distintos:

Stand Alone Data Preparation
Integradas como parte de una plataforma analítica de data science/advanced analytics
Integradas como parte de una plataforma de BI/data discovery/analytics

El crecimiento sin precedentes en los datos multi-estructurados (por ejemplo, XML, AVRO, JSON) han contribuido a un mayor esfuerzo necesario en la preparación de los datos para apoyar los procesos de toma de decisiones.

Por otra parte, la preparación de datos es una de las tareas más difíciles y que requieren mucho tiempo para usuarios de BI y herramientas de descubrimiento de datos, así como científicos de datos.

Self Services Data Preparation hacen frente a estos desafíos a través de capacidades tales como datos Data Lineage, Data Cataloging/inventorying, Data Discovery, Data Exploration, Data Transformation, Data Structuring, detección de patrones y de anomalías

Además están ampliando sus capacidades para incluir una gama más amplia de capacidades tales como:

■ El apoyo a las fuentes de datos adicionales.
■ Capacidades inteligentes mediante el aprovechamiento de las técnicas estadísticas y de machine learning.
■ Mejora de la experiencia de colaboración de usuario.
■ Capacidades de descubrimiento de datos mejorada.
■ Capacidades de calidad de datos mejorada.

Gartner prevé que, dentro de 5 años, muchas de las ofertas de los proveedores independientes o bien se ampliarán para ofrecer plataformas analíticas end to end, o se integrarán con proveedores de BI/Analytics que quieren incluir capacidades de preparación de datos como parte de sus plataformas de análisis.

El siguiente cuadro muestra algunas de las herramientas consideradas por Gartner como herramientas de Self Service Data Preparation:

data-preparation-2

nota4-grafico1[1]

Newsletter

La Compra Cognitiva, una experiencia real

Según el estudio de IBM “El consumidor es el canal”, el 94% de los directivos de la industria d...

Requisitos que deben cumplir las empresas antes de poner en marcha proyectos de Big Data

El Big Data ayuda a las empresas a mejorar sus resultados, equilibrar la oferta a la demanda, anti...

¿Qué beneficios puede aportar una consultoría de Big Data?

Mejorar procesos de negocio con Big Data Un ejemplo claro de la mejora de procesos es la selección...

Data visualization: ¿qué necesitas?

Data visualization es el preludio del análisis. La visualización, así entendida, es la aplicació...