No existe una empresa importante a nivel mundial que no use una base de datos para almacenar toda la información que genera su negocio. De hecho muchos empresarios ni saben que están pagando licencias de bases de datos, porque muchas veces vienen incorporadas dentro del precio que paga por una solución tecnológica. ¿Pero, porqué seguir pagando licencias de base de datos? si las grandes corporaciones de tecnología como Facebook, Google, Netflix, AOL, eBay, Twitter y otras similares hace muchos años que ya no pagan licencias de bases de datos. ¿Cómo hicieron ellos para no pagar más licencias de bases de datos?
Pues simplemente como el volumen de datos de Google empezó a crecer exponencialmente, se cansaron de pagar cientos de miles de dólares en licencias y decidieron hace muchos años desarrollar su propio proyecto para tener una base de datos libre de licencias. Este proyecto se llamó HADOOP por el nombre de un elefante de peluche del científico de datos que creo esta nueva tecnología.
Hoy en día se han generado varias bases de datos libres con tecnología no estructurada No SQL basadas en el proyecto de Hadoop, tales como Cassandra y Mongo DB, las cuales son bases de datos libres de pago de licencias que no son estructuradas como las tradicionales, para poder soportar el crecimiento explosivo de los datos a nivel mundial. Son muy robustas y funcionan con un sistema de granja de servidores en clusters con una metodología «map reduce» que permiten su fácil escalabilidad. A continuación presento un cuadro resumen de cómo funciona esta tecnología:
Hoy en día esta nueva tecnología de bases de datos No SQL no es tan rígida como las tradicionales bases de datos que tienen la mayoría de las empresas a nivel mundial. Al ser no estructuradas, permiten un rápido escalamiento a grandes volúmenes y variedad de datos, por lo que son ideales para proyectos de Big Data. Las ventajas más significativas de la arquitectura de bases de datos No SQL son:
- Escalabilidad: Se pueden escalar con relativa facilidad ante demandas puntuales de sobre carga de datos.
- Rendimiento: Para obtener un mejor rendimiento en el procesamiento de los datos, sólo es necesario añadir más recursos en la plataforma hardware o priorizar cual son los servicios críticos en cada momento.
- Estructura: Los desarrolladores de aplicaciones que trabajan con bases de datos relacionales muchas veces encuentran problemas con la carga de los datos y su granularidad. En las bases de datos No SQL, esto no es generalmente un problema, ya que los datos no se almacenan en la misma manera.
- Activación/Desactivación: Debido a la naturaleza distribuida de los datos, los modelos No SQL responden muy bien ante la activación/desactivación de los servicios en base a las necesidades puntuales de demanda por parte de los usuarios del mismo sistema.
Por lo que ten en mente que si tu negocio maneja grandes volúmenes de datos y vas a invertir en tecnología, no te olvides de considerar este tipo de tecnología que te puede hacer ahorrar mucho dinero y sentar las bases sólidas para un crecimiento sostenido de los datos de tu negocio con un presupuesto razonable.
Contacto: luis.barragan@maximixetic.com