Hadoop potencia las nuevas prácticas de Analytics

El objetivo final para la gestión de información es obtener valor empresarial e impulsar la eficacia de los datos, no sólo capturarlos en un centro de costo. El camino primario a ese valor es a través del análisis. En este contexto, lo que sigue son algunas de las nuevas prácticas analíticas basadas en Hadoop

Análisis avanzados que complementan los análisis estándares

En pocas palabras, las organizaciones necesitan preservar los análisis existentes basados ​​en informes, OLAP y SQL, pero también los complementan con analíticas avanzadas basadas en tecnologías para minería, clustering, , estadísticas y procesamiento del lenguaje natural.

Las formas tradicionales de análisis y generación de informes son principalmente sobre el seguimiento de los hechos y las entidades empresariales. Las formas nuevas y avanzadas de análisis consisten principalmente en descubrir hechos que no conocía antes, así como en vincular eventos y características de entidades diversas (como el comportamiento del cliente, la confiabilidad del partner y las métricas operacionales) para formar nuevos conocimientos y desarrollar nuevas oportunidades de negocio.

La analítica tradicional tiende a requerir datos limpios en una plataforma relacional para resultados muy precisos y estructurados, como se ve en los informes y cubos estándares. Sin embargo, la analítica de hoy se centra en datos crudos y detallados que alimentan descubrimientos y vínculos complejos sin necesidad de precisión.

Múltiples formas de análisis

Una de las tendencias más fuertes en la analítica es hacia el uso de múltiples formas de análisis, ya que cada método dice algo diferente sobre el mismo problema. Conecte múltiples resultados juntos de analítica y obtendrá información más completa para obtener ventajas de negocio.

Cuando un “Data Lake” basado en Hadoop captura y administra datos en su estado original, los datos pueden ser fácilmente reutilizados para múltiples formas de análisis. Dependiendo del diseño y el contenido de datos puede soportar analítica basada en conjuntos (basada en OLAP, SQL y otras técnicas relacionales) y analítica algorítmica (basada en minería, agrupación, gráficos, estadísticas y PNL) .

Secuencia integrada de mejores prácticas de autoservicio

Una de las prácticas de análisis emergentes más deseables hoy en día es conectar, en secuencia, varias tareas de autoservicio relacionadas con los datos. La secuencia típicamente sigue este orden: acceso a los datos, exploración, preparación, visualización y análisis.

Por ejemplo, a medida que los usuarios acceden y exploran los datos, pueden descubrir algo significativo, como la causa raíz del rechazo más reciente o un centro de costo que está erosionando los beneficios de los resultados finales. Después del descubrimiento, quieren preparar rápidamente un conjunto de datos basado en lo que aprendieron, luego compartir el conjunto de datos preparados con colegas o mover sin problemas el conjunto de datos a otras herramientas para obtener más análisis y visualización.

La suposición es que se emplean varios tipos de herramientas (uno por paso en este proceso de varios pasos) y las herramientas están bien integradas para el traspaso sin problemas. Este proceso de análisis multietapa parece funcionar bien con un “Data Lake” basados ​​en Hadoop, pero sólo cuando se da a los usuarios un conjunto de herramientas integrado que soporta autoservicio. El autoservicio no es para todos; tiene éxito cuando se proporciona a ciertas clases de usuarios que tienen perfiles analíticos y/o tienen roles de cientóficos de datos.

Valor del lenguaje humano, texto y otros datos no estructurados

Teóricamente, puede colocar cualquier dato u otra información digital en un archivo y Hadoop puede administrarlo y hacerlo disponible para el procesamiento analítico. Dentro de la categoría de datos no estructurados, el lenguaje humano basado en archivos y otro texto ya está siendo aprovechado a través de este framework de trabajo.

El análisis del sentimiento escanea millones de comentarios de clientes, prospectos y otras personas (tal vez extraídos de medios sociales o campos de texto en aplicaciones de centro de llamadas) para determinar lo que el mercado está diciendo sobre su empresa y  sus servicios.

Análisis de textos similares se observan en el análisis de los resultados de los pacientes en la asistencia sanitaria (tanto por el asegurador como por el proveedor).

Fuente: TDWI

01

Newsletter

La Compra Cognitiva, una experiencia real

Según el estudio de IBM “El consumidor es el canal”, el 94% de los directivos de la industria d...

Requisitos que deben cumplir las empresas antes de poner en marcha proyectos de Big Data

El Big Data ayuda a las empresas a mejorar sus resultados, equilibrar la oferta a la demanda, anti...

¿Qué beneficios puede aportar una consultoría de Big Data?

Mejorar procesos de negocio con Big Data Un ejemplo claro de la mejora de procesos es la selección...

Data visualization: ¿qué necesitas?

Data visualization es el preludio del análisis. La visualización, así entendida, es la aplicació...