Machine Learning and Big Data Analytics: la unión perfecta

Mientras que el 2012 ha sido el año delBig Data, 2013 se convirtió en el año de análisis de Big Data. Recolección y mantenimiento de grandes colecciones de datos son una cosa, pero extraer información útil de estas colecciones es aún más difícil. Big Data no sólo cambia las herramientas que se pueden utilizar para análisis predictivo, también cambia toda nuestra forma de pensar en la extracción de conocimiento e interpretación. Tradicionalmente, la ciencia de datos siempre ha sido dominada por análisis de ensayo y error, de manera que se vuelve imposible cuando conjuntos los de datos son grandes y heterogéneos. Irónicamente, la disponibilidad de más datos conduce generalmente a menos opciones en construir modelos predictivos, debido a que permiten muy pocas herramientas para el procesamiento de grandes conjuntos de datos en un tiempo razonable. Además, las soluciones tradicionales de estadísticas suelen centrase en el análisis estático el cual se limita al análisis de las muestras que se congelan en el tiempo, y con frecuencia resultan en conclusiones superadas y poco confiables.

Sin embargo, alternativas más inteligentes que superan esos problemas se han propuesto recientemente en un innovador y un creciente dominio de investigación: machine learning. En el borde de las estadísticas, informática y nuevas aplicaciones en la industria, esta comunidad de investigación se centra en el desarrollo de algoritmos rápidos y eficientes para el procesamiento en tiempo real de datos como objetivo principal ofrecer predicciones precisas de varias clases.Por nombrar sólo unas cuantas aplicaciones, piensa en casos como la recomendación de producto, segmentación de clientes, detección de fraude o la prevención de pérdida de clientes. Técnicas de machine learning pueden resolver este tipo de aplicaciones utilizando un conjunto de métodos genéricos que difieren de las técnicas estadísticas más tradicionales. El énfasis está en análisis predictivo en tiempo real y altamente escalable, utilizando métodos totalmente automáticos y genéricos que simplifican algunas de las tareas del analista de datos típicos. Y sí, el machine learning está encontrando su camino a la industria en este momento.

Los métodos tradicionales en el machine learning y  y las estadísticas proporcionan modelos basados en datos para predecir unidimensionales objetivos, tales como salidas binarias en la clasificación y salidas de valor real en regresión. En los últimos años, nuevos dominios de aplicación han provocado la investigación sobre los problemas más complicados que requieren predicciones multi-objetivo. Estos problemas surgen en diversos campos de aplicación, como la categorización de documentos, sistemas de recomendación, la predicción de la etiqueta de imágenes, vídeos y música, recuperación de información, procesamiento del lenguaje natural, el descubrimiento de fármacos, la comercialización, la biología, etc. problemas de predicción de múltiples destinatarios específicos han sido estudiados en una variedad de sub-campos de machine learningylas estadísticas, como la clasificación con varias etiquetas, la regresión multivariante, el aprendizaje de secuencias, la predicción de salida estructurada, el aprendizaje de preferencia, el aprendizaje multi-tarea, los sistemas de recomendación y el aprendizaje colectivo. A pesar de sus puntos en común, el trabajo en la resolución de problemas en los dominios anteriores normalmente se ha realizado de forma aislada, sin mucha interacción entre los diferentes sub-comunidades.

Colaboración: Dino Orazi

big-data-makes-for-exceptional-machine-learning1

Newsletter

Aplican “Machine Learning” en la búsqueda de medicamentos para el cáncer

El “Machine Learning” está revolucionando el descubrimiento de fármacos contra el cáncer. El ...

Qué necesitan saber las empresas sobre los sistemas de cómputo cognitivo

Si bien las herramientas de computación cognitiva han llegado lejos en utilidad, todavía tienen al...

Retos que enfrentan Self Services BI y Analytics

Las herramientas de BI de autoservicio se han convertido en el estándar para el software de intelig...

Intelligent Video: la clave para analizar grandes datos de vídeo

La tecnología de videovigilancia ha dado un salto cuántico en la última década. Ahora tenemos un...