Almacenes de Datos Desestructurados (NoSQL)

Durante años el manejo de bases de datos relaciones (RDBMS) y sus formas normales parecía suficiente para almacenar de forma consistente casi cualquier esquema de datos.

Con la aparición de la web 2.0, software como servicio (SaaS), cloudcomputing y las aplicaciones masivas utilizadas por millones de usuarios llegaron los inconvenientes de las bases de datos tradicionales para brindar escalabilidad.
Los sistemas NoSQL atacan este problema disponibilizado una estructura de almacenamiento más versátil.

Los principales diferenciales de las bases de datos NoSQL respecto a las tradicionales, se pueden resumir en:

  • Almacenamiento de datos desestructurados: refiere a que los datos no poseen una definición de atributos fija, es decir, que cada registro o documento puede contener diversos tipos de datos, los cuales pueden variar en el tiempo, facilitando el polimorfismo de datos, bajo una misma colección de información. Bajo esta premisa las bases de datos NoSQL pueden almacenar estructuras complejas en un solo documento, por ejemplo: un perfil de Facebook completo junto con las etiquetas y comentarios realizados sobre las publicaciones, todo en un mismo registro o documento. De esta forma aumenta la claridad (Tener todos los datos relacionados en un mismo bloque) y el rendimiento (No deben efectuarse cruces de datos o JOINs para obtener datos relacionados).
  • Escalabilidad horizontal: Permiten aumentar el rendimiento del sistema añadiendo nodos, de una manera sencilla, solo indicándole al sistema cuales son los nodos disponibles.
  • Alta velocidad: La mayoría de los sistemas de bases de datos NoSQL operan directamente en memoria, y solo vuelcan los datos en disco cada cierto tiempo. Esto permite que las operaciones de escrituras sean realmente rápidas. Esto puede traer aparejado problemas en la durabilidad de los datos, ya que ante un corte en el suministro de energía eléctrica se podrían perder operaciones. Normalmente esto se resuelve permitiendo que la operación de escritura se realice en más de un nodo antes de darla por válida o disminuyendo el tiempo de volcado de información a disco.

Entre los principales proveedores de sistemas de bases de datos NoSQL se encuentran: CouchDB, MongoDB, RavenDB, Neo4j, Cassandra, BigTable, Dynamo, Riak, Hadoop, entre otros.

Fuente: Marcelo Costa

nosql

Newsletter

Aplican “Machine Learning” en la búsqueda de medicamentos para el cáncer

El “Machine Learning” está revolucionando el descubrimiento de fármacos contra el cáncer. El ...

Qué necesitan saber las empresas sobre los sistemas de cómputo cognitivo

Si bien las herramientas de computación cognitiva han llegado lejos en utilidad, todavía tienen al...

Retos que enfrentan Self Services BI y Analytics

Las herramientas de BI de autoservicio se han convertido en el estándar para el software de intelig...

Intelligent Video: la clave para analizar grandes datos de vídeo

La tecnología de videovigilancia ha dado un salto cuántico en la última década. Ahora tenemos un...