Nacidas a finales de la década de 1960 y principios de la de 1970, las bases de datos NoSQ permanecieron durante mucho tiempo a la sombra de las bases de datos SQL, conocidas como bases de datos relacionales, para volver a la escena a principios de la década de 2000. Y esto gracias a la web, que contribuyó a generar una enorme cantidad de datos de distinta naturaleza y abrió así una nueva temporada sobre las bases de datos no relacionales. Es decir, las bases de datos NoSQL.
Las bases de datos NoSQL se utilizan en los ámbitos más avanzados de la informática, y no puede decirse que hayan superado a las relacionales, que siguen siendo ampliamente utilizadas. La creciente popularidad de las primeras está más en consonancia con la cantidad de datos heterogéneos que genera Internet y la necesidad de un procesamiento más flexible, rápido y escalable.
Índice de temas
Bases de datos NoSQL: documento, clave-valor, columna-familia y gráficos
El término NoSQL es un contenedor que sirve para crear una diferencia con las bases de datos SQL tradicionales. De hecho, suelen diferenciarse de las bases de datos SQL en que se apartan del modelo tradicional de tablas de filas y columnas que caracteriza a las bases de datos relacionales.
Los cuatro tipos principales de bases de datos NoSQL son:
-Bases de datos documentales
-Base de datos de columnas
-Clave-valor
-Base de datos gráfica
Ya es evidente, incluso antes de profundizar en estas cuatro categorías, que las bases de datos NoSQL son especialmente flexibles.
Base de datos de documentos
Almacenan datos en documentos BSON, JSON y XML. Son archivos tan comprensibles para los humanos como para las máquinas, y constan de una sintaxis muy sencilla, inmediata y lineal. En estas bases de datos, los documentos pueden indexarse, almacenarse y recuperarse de forma similar a los objetos de datos utilizados en las aplicaciones, y esto lo convierte en un modelo popular entre los desarrolladores, también porque las estructuras de datos pueden ser modificadas por los programadores sin la intervención de los administradores de bases de datos, como ocurre o puede ocurrir con las bases de datos relacionales.
Clave-valor
Es el modelo más sencillo y prevé que cada elemento de la base de datos se almacene según la lógica clave-valor. Recuerda la arquitectura básica de una base de datos SQL que, con sólo dos columnas, acopla dos elementos de datos correspondientes diferentes. Este modelo prevé que se asocien claves específicas a cada valor, por lo que es el propio conjunto de datos el que actúa a la vez como clave y como valor. La clave sustituye al concepto de índice y sirve como elemento a través del cual se pueden realizar búsquedas dentro de la base de datos.
Base de datos de familias de columnas
Se organiza como un conjunto de columnas y esto tiene ventajas prácticas a la hora de realizar análisis sobre los datos, ya que requiere menos recursos informáticos, a diferencia de las bases de datos SQL que almacenan los datos en filas y los leen fila por fila. Sin embargo, hay que pagar un precio: organizar los datos en columnas requiere más eventos de escritura en disco, una desventaja que no sufren las bases de datos SQL porque los datos de las filas se escriben de forma contigua sin acceso continuo al disco.
Base de datos gráfica
Se encarga de crear relaciones entre elementos, cada uno de los cuales se almacena como un nodo independiente y se guarda directamente, sin recurrir a una estructura de varias tablas típica de las bases de datos SQL que crean relaciones entre los datos. Esto facilita la búsqueda de conexiones entre los datos, hasta el punto de que es especialmente utilizada por las redes sociales
Las ventajas de NoSQL: flexibilidad, escalabilidad y rendimiento
La flexibilidad, la escalabilidad y el rendimiento son tres de los requisitos más importantes que han hecho destacar el valor de las bases de datos NoSQL en la era de Internet, que genera tantos datos que las arquitecturas SQL tradicionales están, al menos potencialmente, bajo tensión.
Las bases de datos NoSQL manejan big data a gran velocidad y con arquitecturas escalables y, además, trabajan con datos no estructurados, semiestructurados e incluso estructurados. La administración de las tecnologías NoSQL es más inmediata e intuitiva, lo que facilita también el trabajo de los desarrolladores, y además saca el máximo partido de las arquitecturas en nube, al tiempo que reduce el tiempo de lectura y organización de los datos. Los datos no estructurados no se ajustan a las bases de datos SQL, y esta es una condición más que relevante, ya que Internet -y especialmente la web- es una enorme base de datos de archivos y contenidos de diferentes formatos, inmensos contenedores de información no estructurada.
También hay que destacar la escalabilidad horizontal de las bases de datos NoSQL, que permite repartir los datos entre varios servidores, mientras que las soluciones SQL, cuya escalabilidad es vertical, aprovechan la eficacia de un único servidor. Esto significa que, cuando se necesite más capacidad, será necesario adquirir servidores más potentes y esto, además de suponer un coste, corre el riesgo de limitar el desarrollo de las aplicaciones. Siempre que sea necesario trabajar con big data, las bases de datos NoSQL son una elección casi obligatoria.
Cómo apoya NoSQL el procesamiento de big data en las empresas
Las bases de datos NoSQL no utilizan tablas de filas y columnas para organizar y almacenar los datos, sino que hacen uso de técnicas más flexibles con las arquitecturas vistas anteriormente (es decir, documentos, gráficos, pares de valores y columnas) y esto permite procesar grandes cantidades de datos. La mano de obra se distribuye uniformemente entre los servidores, pudiendo así manejar cargas de trabajo que no podrían soportar las bases de datos SQL.
Utilizan servidores en la nube y arquitecturas de clúster, lo que hace que las bases de datos NoSQL sean más potentes en términos de rendimiento. Y no menos importante, los datos se almacenan y recuperan a través de API basadas en objetos.
Los bajos tiempos de latencia y la capacidad de manejar grandes volúmenes de transacciones son prerrogativas de las bases de datos NoSQL, junto con el hecho de que, salvo en unos pocos casos, las implementaciones NoSQL están exentas de la necesidad de definir la estructura de la base de datos (esquema).
Para concretar esto, hay que tener en cuenta que la configuración de los usuarios en los sitios web, así como las correlaciones de seguidores en las plataformas sociales y los sistemas de gestión de contenidos dependen de las bases de datos NoSQL.
Comparar NoSQL y SQL: entender qué solución es más adecuada
En los párrafos anteriores ya hemos desvelado la mayoría de las cartas. Existen tres diferencias principales entre las bases de datos relacionales (SQL) y las no relacionales (NoSQL):
-se adaptan a los datos no estructurados y semiestructurados
-se escalan más fácilmente
-son más flexibles
Estas variables ya son suficientes para inclinarse por una u otra tecnología. Sin embargo, para ofrecer una imagen más completa, podemos considerar algunos otros parámetros, entre ellos
Tipo
Las bases de datos SQL son idénticas para todas las aplicaciones, mientras que las bases de datos NoSQL ofrecen diferentes modelos de bases de datos (documento, clave-valor, columna-familia y grafo son los más comunes)
Esquema: la estructura de las bases de datos SQL debe definirse antes de poblarlas con datos, y si es necesario realizar cambios, éstos deben extenderse a toda la base de datos. En el caso de las bases de datos NoSQL, se pueden añadir nuevos conjuntos de datos sin problemas y se pueden archivar datos de distintos tipos (estructurados, no estructurados y semiestructurados) sin conversiones
Archivado
Los datos se almacenan en las filas clásicas contenidas en las tablas igualmente clásicas (por ejemplo, la tabla Artículo, o la tabla Materiales, etc.). Las bases de datos NoSQL no utilizan tablas, sino archivos de distintos tipos
Escalabilidad
Las bases de datos SQL son escalables verticalmente, es decir, un único servidor (o un clúster de varios nodos) debe proporcionar el rendimiento necesario, mientras que cuando se trata de NoSQL, se pueden añadir servidores (incluso en la Nube) y, en este caso, se habla de escalabilidad horizontal
Rendimiento
Las bases de datos SQL utilizan índices y esto puede ralentizar el rendimiento cuando el volumen de datos es grande. Las bases de datos NoSQL, que utilizan servidores en la nube y clusters, ofrecen un rendimiento muy superior, especialmente con big data.
Hay otras dos razones que inclinan la balanza claramente hacia las bases de datos NoSQL o SQL. Los datos se acceden y almacenan utilizando el lenguaje de consulta estructurado (SQL). Las bases de datos NoSQL realizan las mismas operaciones mediante API basadas en objetos.
También hay que tener en cuenta las características fundacionales de las dos tecnologías. Por un lado, las bases de datos SQL tienen características Ácidas, mientras que las otras explotan el modelo Base.
La diferencia se explica por las propias siglas. ACID significa Atomicidad, Consistencia, Aislamiento, Durabilidad, mientras que BASE significa Básicamente Disponible, Estado Suave, Consistencia Eventual. Las bases de datos NoSQL evalúan la disponibilidad y solo después la consistencia, y la mayoría de ellas no admiten transacciones ACID. Estos elementos también forman un camino obligatorio en función del resultado al que se orienten las bases de datos.
En cuanto a las licencias, ambas pueden ser de código abierto y de pago, entendiéndose que en el entorno corporativo deben evitarse las soluciones completamente gratuitas (que por tanto no van acompañadas de soporte oficial).
Aspectos de seguridad y fiabilidad en las bases de datos NoSQL
Las cuestiones relativas a la seguridad y la fiabilidad de las bases de datos NoSQL son de actualidad y están destinadas a permanecer parcialmente abiertas, porque ya no se trata solo de almacenar y recuperar datos en una o varias bases de datos, sino de hacerlo a través de una amplia distribución de aplicaciones basadas en la nube y en el IoT. No solo aumenta el tráfico de red, sino también los recursos de hardware y software necesarios, y esto tiene implicaciones para la seguridad, que ya no puede entenderse como la defensa de una fortaleza (los servidores de la empresa), sino que se convierte en una defensa distribuida entre todos los puntos de recogida, procesamiento o utilización de los datos.
Se necesitan requisitos de autenticación y autorización, certificación de datos y privacidad que no pueden tratarse en un artículo o un documento técnico.
Además, al igual que las bases de datos SQL, las arquitecturas NoSQL también sufren males atávicos, como los ataques de inyección y las vulnerabilidades conocidas que pueden identificarse con una evaluación.
El panorama de las bases de datos NoSQL es vasto, y cada una de ellas, al menos en las versiones de pago, prevé modos de cifrado de datos que, sin embargo, deben ser implementados por quienes las utilizan según sus especificaciones.
La seguridad y la fiabilidad de las bases de datos NoSQL deben determinarse en función del uso que se haga de ellas, entre aplicaciones que pueden distribuirse a través de la web o por otros canales, y entre puntos finales, ya sean sensores, dispositivos móviles, dispositivos IoT, etc.
Tendencias futuras de NoSQL y su impacto en las estrategias empresariales
La digitalización y la Industria 4.0 están impulsando la adopción de las bases de datos NoSQL. Conviene precisar que el tamaño de la empresa y el mercado en el que opera son relativamente importantes para la elección de la base de datos. Las telcos, por ejemplo, pueden utilizar bases de datos SQL para registrar las llamadas telefónicas y los datos de tráfico de red de sus clientes, independientemente de que los datos a almacenar sean de gran tamaño.
La IA, incluso y especialmente la IA conversacional, es precursora de datos no estructurados y semiestructurados, lo mismo ocurre con la web y lo mismo puede decirse de los diversos surtidos de sensores y cámaras. Todo esto marca el rumbo: las bases de datos NoSQL estarán cada vez más extendidas pero, en lugar de cambiar las estrategias empresariales, permiten a las empresas darles forma, incluso sobre la marcha si es necesario, proporcionando apoyo a las decisiones empresariales.
Consideraciones sobre los límites y los retos de las bases de datos NoSQL
Toda tecnología tiene límites, razón por la cual la innovación debe considerarse una obra inacabada, una evolución sin fin.
Concretamente, los límites también provienen de una cierta narrativa según la cual las bases de datos NoSQL son una alternativa (más o menos válida según los rumores) a las relacionales, pero, en realidad, corren el riesgo de ser cualquier cosa menos una alternativa allí donde los escenarios de aplicación no puedan ser interpretados por las bases de datos SQL.
Las principales ventajas de las bases de datos NoSQL tienen un costo en términos de limitaciones, como una menor capacidad de análisis de datos y un uso relativamente poco eficaz para comprender lógicas empresariales demasiado complejas.
Ambas tecnologías tienen su lugar en una empresa, pero limitando las bases de datos SQL y NoSQL a fines bien definidos y separados.
Prohibida su reproducción total o parcial.