Las lecciones de MongoDB sobre las tendencias en bases de datos

Esta semana se celebra MongoDB World 2022, y para aquellos de nosotros que estuvimos presentes en MongoDB 2014 (como yo), es justo decir que mucho ha cambiado en los últimos ocho años para la compañía y la industria.

Aunque claramente estoy sesgado -trabajé para MongoDB en 2014, y después de algunos años con AWS y Adobe, me reincorporé a mediados de 2021- es interesante ver cómo ha evolucionado el mercado de bases de datos en menos de una década. Pero quizás igual de interesante es ver cómo algunas cosas han permanecido iguales.

Índice de Contenido
  1. No solo datos relacionales: Un cambio clave en el mercado de las bases de datos
  2. El auge y auge de las bases de datos de propósito general
  3. Las bases de datos se convierten en plataformas de datos

No solo datos relacionales: Un cambio clave en el mercado de las bases de datos

En junio de 2014, los cinco bases de datos más populares eran exactamente los mismos que en junio de 2022: Oracle, MySQL, Microsoft SQL Server, PostgreSQL y MongoDB.

La diferencia está en su popularidad relativa: PostgreSQL y MongoDB han ido ganando popularidad en relación con los competidores relacionales. PostgreSQL, por ejemplo, ha ganado terreno a expensas de Oracle y hoy en día tiene aproximadamente la mitad de la cuota de mercado de Oracle (medido en términos de cosas como ofertas de trabajo y menciones en perfiles de LinkedIn), en comparación con aproximadamente el 16% de popularidad en relación con Oracle en 2014.

Existen varias razones para este cambio en el mercado. Ya he escrito antes sobre el ascenso de PostgreSQL. Aquí me voy a centrar en MongoDB y lo que significa.

En su discurso de apertura, el CEO de MongoDB, Dev Ittycheria, compartió estadísticas que mostraban que MongoDB se ha convertido en la infraestructura de datos principal para más de 35,000 clientes, desde empresas Fortune 500 hasta startups de garaje.

Vale la pena invertir en minería de datos

Los clientes son una métrica para medir la adopción, pero la influencia de MongoDB es aún más amplia. Aunque las descargas ya no son una métrica principal para esta empresa enfocada principalmente en la nube (el 60% de los ingresos de la compañía proviene de Atlas, su servicio en la nube), en 2014 la compañía contaba las descargas en decenas de miles. Hoy en día, ese número asciende a 265 millones, con más personas descargando el producto comunitario de MongoDB en 2022 que en los primeros 11 años de existencia de MongoDB juntos.

Eso es mucha adopción para un producto que en 2014 todavía generaba escepticismo en términos de escalabilidad en la web. El video era divertido, aunque MongoDB nunca tuvo realmente problemas de escala. Si algo, ese video capturó la sensación de que las bases de datos relacionales podrían satisfacer la mayoría de los requisitos de las aplicaciones. Por lo tanto, el desafío para MongoDB en 2014 era convencer a los desarrolladores de considerar un mundo más allá de los datos relacionales y las estructuras de datos tabulares.

MongoDB siempre ha manejado muy bien las relaciones de datos; las ha manejado de manera diferente a una base de datos relacional. Por lo tanto, en aquel entonces, la compañía aceptó la etiqueta de NoSQL, a pesar de sus problemas (¿quién quiere ser definido por lo que no es?), porque ayudó a los desarrolladores a pensar más allá de las estructuras de datos tabulares.

Desde entonces, ha habido una explosión de bases de datos no relacionales, o de múltiples modelos. Hoy en día, DB-Engines incluye casi 400 bases de datos, pero menos de la mitad de ellas son bases de datos relacionales. Desde documentos hasta series temporales, grafos, columnas y clave-valor, la industria ha seguido utilizando bases de datos relacionales a la vez que ha encontrado un lugar para una amplia variedad de nuevas bases de datos.

Como ha escrito el analista de RedMonk, Steve O’Grady: "La era de una única categoría de bases de datos de propósito general dejó paso a una época de especialización, con tipos de bases de datos seleccionados en función de la carga de trabajo y las necesidades".

En 2018, el CTO de Amazon, Werner Vogels, capturó este movimiento en un artículo de blog:

Fase de análisis: Entendiendo lo que el cliente quiere

"Durante décadas, porque la única opción de base de datos era una base de datos relacional, sin importar la forma o función de los datos en la aplicación, los datos se modelaban de manera relacional", dijo Vogels. "En lugar de que el caso de uso impulsara los requisitos de la base de datos, sucedía lo contrario. La base de datos conducía el modelo de datos para el caso de uso de la aplicación. ¿Está una base de datos relacional diseñada a medida para un esquema desnormalizado y para garantizar la integridad referencial en la base de datos? Por supuesto, pero el punto clave aquí es que no todos los modelos de datos de aplicación o casos de uso coinciden con el modelo relacional".

Vogels fue el orador principal de ese primer MongoDB World en 2014. Para aprovechar el interés de los clientes, luego ayudó a AWS a lanzar más de una docena de nuevos servicios de bases de datos "diseñados a medida" en los siguientes ocho años.

El auge y auge de las bases de datos de propósito general

Más recientemente, hemos visto que el mercado de bases de datos ha "vuelto al promedio", por así decirlo, con los desarrolladores volviendo a las bases de datos de propósito general como MongoDB y PostgreSQL. La razón, según explicó O'Grady, es simple, o más bien tiene que ver con la simplicidad: "La sobrecarga de tener que aprender e interactuar con múltiples bases de datos se ha convertido en una carga más que en un beneficio".

Continuó diciendo que las empresas han presionado a los proveedores de bases de datos para mejorar sus capacidades porque no quieren "cambiar de contexto entre diferentes bancos de datos, porque quieren la capacidad de realizar análisis en un conjunto de datos en su lugar sin tener que migrarlo, porque quieren consolidar la gran cantidad de proveedores con los que tratan, o alguna combinación de todas estas razones".

En 2014, MongoDB ayudó a impulsar una tendencia en la industria hacia la especialización; en 2022, es parte de un movimiento alejándose de la especialización. La ironía es que MongoDB nunca se promocionó como una base de datos especializada, sino como una base de datos de propósito general desde el principio. ¿Por qué? Porque, como explicó O'Grady, "propósito general" facilita la vida de los desarrolladores, y MongoDB siempre se ha centrado en la comodidad de los desarrolladores.

Es por eso que algunas de las noticias más importantes de MongoDB World 2022 no deberían ser noticias en absoluto: la compañía cada vez más posiciona MongoDB como una plataforma de datos para desarrolladores, no solo como una base de datos.

Los 12 errores más comunes al trabajar con el objeto Recordset en Access

Las bases de datos se convierten en plataformas de datos

Nuevamente, veamos esto en el contexto de la industria: una serie de compañías están tratando de ofrecer soluciones integrales para científicos de datos, analistas de negocios u otros grupos, y por lo tanto están comercializando nubes de datos y plataformas de datos. Lo que parece único en el enfoque de MongoDB, en contraste, es su enfoque en los desarrolladores.

Aunque MongoDB puede afirmar de manera creíble que su modelo de documentos ha mejorado significativamente la productividad de los desarrolladores, los requisitos de las aplicaciones siguen obligando a los desarrolladores a asumir la incómoda responsabilidad de conectar un conjunto de sistemas de datos backend, incluyendo búsqueda, análisis en tiempo real y más. Estos servicios, a su vez, requieren gestión, como registro de actividad y alertas. ¿Adivina quién tiene que unirlos todos? Los desarrolladores. Como bromeó el CTO de MongoDB, Mark Porter, esto deja a los desarrolladores con "más pegamento que modelo".

De hecho, a lo largo de las presentaciones de apertura, los ejecutivos de MongoDB destacaron una y otra vez el enfoque de la compañía en los desarrolladores. Pero ahora, en lugar de centrarse en el esquema flexible o la escala horizontal, la compañía promociona una experiencia de desarrollo elegante que abarca un conjunto cada vez más amplio de servicios para respaldar todo el ciclo de vida de los datos, lo que permite una variedad de casos de uso, desde transaccionales hasta operativos y analíticos.

Al abstraer en gran medida el movimiento de datos entre servicios o productos, la plataforma de datos para desarrolladores de MongoDB tiene como objetivo ayudar a las empresas a reducir significativamente las inversiones en middleware en términos de personal y software/sistemas, al tiempo que reduce la necesidad de reconciliar datos entre sistemas y ayuda a las organizaciones a garantizar una única fuente de verdad.

La idea de una plataforma de datos o nube de datos no es nueva, y no es exclusiva de MongoDB. Como dije, esta es una tendencia de la industria hacia la integración vertical para facilitar la vida de los desarrolladores (o la de los analistas de datos, en el caso de los proveedores de almacenamiento de datos). Pero lo que es diferente, y parece completamente único en MongoDB, es esta idea de una plataforma de datos para desarrolladores: algo que hace que los desarrolladores sean mucho más productivos con los datos.

Claramente, una parte clave de esto para MongoDB es el análisis, pero no ese tipo de análisis. Incluso si no trabajara en la compañía, sería difícil salir de MongoDB World con la idea de que MongoDB planea competir en cargas de trabajo de almacén de datos.

Las mejores herramientas de inteligencia empresarial para tomar decisiones basadas en datos

En cambio, las presentaciones revelaron mucho pensamiento sobre cargas de trabajo analíticas que impulsan experiencias atractivas en las aplicaciones. ¿Como qué? Bueno, como aplicaciones de personalización que determinan las promociones que se mostrarán en el proceso de pago en función de lo que se haya mostrado recientemente. O, como aplicaciones de seguridad que analizan la actividad de la red para separar los dominios buenos de los malos.

Tradicionalmente, los sistemas analíticos adecuados para estas cargas de trabajo estaban separados de los sistemas operativos. Si la separación suena bien, realmente no lo es, ya que introduce costos y complejidad a través de cosas como la extracción, transformación y carga (ETL), distanciando las aplicaciones de los datos en la oficina central que les proporcionan los datos.

Este mundo de procesamiento por lotes puede ser el estado actual, pero ofrece una mala experiencia de aplicación para los clientes. MongoDB está claramente de acuerdo y lo afirmó repetidamente en el evento a través de una variedad de anuncios.

Lo que me lleva de vuelta a lo diferentes que es nuestra industria hoy en día en comparación con 2014 y cuánto se mantiene igual. Aún dependemos de las bases de datos relacionales y lo haremos durante algún tiempo, como escribí anteriormente en 2016. Y sin embargo, también es cierto que las empresas dependen cada vez más de bases de datos no relacionales como MongoDB.

En ambos grupos, hemos visto a los desarrolladores flirtear con bases de datos especializadas, mientras invierten más en bases de datos de propósito general y, más recientemente, en plataformas de datos de propósito general. Como dirían los Talking Heads: "Same as it ever was".

Divulgación: Trabajo para MongoDB, pero las opiniones expresadas aquí son mías y no las de mi empleador. Pueden contradecirme: a menudo están en desacuerdo conmigo.

Cómo agregar una barra de desplazamiento a un gráfico en Excel

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Big Data, allí encontraras muchos artículos similares a Las lecciones de MongoDB sobre las tendencias en bases de datos , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.