Almacenes de Datos Desestructurados (NoSQL)

Durante años el manejo de bases de datos relaciones (RDBMS) y sus formas normales parecía suficiente para almacenar de forma consistente casi cualquier esquema de datos.

Con la aparición de la web 2.0, software como servicio (SaaS), cloudcomputing y las aplicaciones masivas utilizadas por millones de usuarios llegaron los inconvenientes de las bases de datos tradicionales para brindar escalabilidad.
Los sistemas NoSQL atacan este problema disponibilizado una estructura de almacenamiento más versátil.

Los principales diferenciales de las bases de datos NoSQL respecto a las tradicionales, se pueden resumir en:

  • Almacenamiento de datos desestructurados: refiere a que los datos no poseen una definición de atributos fija, es decir, que cada registro o documento puede contener diversos tipos de datos, los cuales pueden variar en el tiempo, facilitando el polimorfismo de datos, bajo una misma colección de información. Bajo esta premisa las bases de datos NoSQL pueden almacenar estructuras complejas en un solo documento, por ejemplo: un perfil de Facebook completo junto con las etiquetas y comentarios realizados sobre las publicaciones, todo en un mismo registro o documento. De esta forma aumenta la claridad (Tener todos los datos relacionados en un mismo bloque) y el rendimiento (No deben efectuarse cruces de datos o JOINs para obtener datos relacionados).
  • Escalabilidad horizontal: Permiten aumentar el rendimiento del sistema añadiendo nodos, de una manera sencilla, solo indicándole al sistema cuales son los nodos disponibles.
  • Alta velocidad: La mayoría de los sistemas de bases de datos NoSQL operan directamente en memoria, y solo vuelcan los datos en disco cada cierto tiempo. Esto permite que las operaciones de escrituras sean realmente rápidas. Esto puede traer aparejado problemas en la durabilidad de los datos, ya que ante un corte en el suministro de energía eléctrica se podrían perder operaciones. Normalmente esto se resuelve permitiendo que la operación de escritura se realice en más de un nodo antes de darla por válida o disminuyendo el tiempo de volcado de información a disco.

Entre los principales proveedores de sistemas de bases de datos NoSQL se encuentran: CouchDB, MongoDB, RavenDB, Neo4j, Cassandra, BigTable, Dynamo, Riak, Hadoop, entre otros.

Fuente: Marcelo Costa

nosql

Newsletter

Su nombre es WATSON y su pasión: LOS DATOS

IBM Watson (en honor al fundador de la compañía Thomas Watson), es la primera plataforma de tecnol...

Minería de Datos (Data Mining) vs Grandes Datos (Big Data)

La Minería de Datos (Data Mining) también conocida como exploración de datos, se define como el a...

¿Cómo es el experto en Big Data? La profesión con más futuro del siglo XXI

El experto en Big Data o “data scientist” es una de las profesiones más prometedoras para el si...

Big Data y la Ilusión del Servicio 1 a 1

Una de las decepciones más grandes al escuchar o leer sobre Big Data, es caer en la cuenta de la br...