top_10-base_de_donnees_0.png

Top 10 des bases de données en 2020 (par popularité)

31/03/2020
Données

Grâce au site web DB-engines.com, nous avons établi un top 10 des moteurs de bases de données relationnelles et NoSQL en fonction de leur popularité.

Dans cet article, nous étudierons les critères et sources utilisés par DB-Engines pour établir ce classement puis le classement en lui-même. Ensuite, nous étudierons plus en profondeur plusieurs classements de bases de données par catégorie (open source, commerciale, Clé valeur, Documents, Search Engine...).

DB-engines.com : un calculateur de popularité des moteurs de bases de données

Les créateurs du site db-engines.com ont eu la brillante idée de mesurer la popularité des principaux moteurs de bases de données (350 au 08/01/2020), et l'évolution de leur popularité sur une longue période... Voilà qui peut alimenter votre réflexion quant aux choix stratégiques liés aux moteurs de bases de données.

Quelle méthode de calcul est utilisée par DB-Engines ?

La mesure de popularité d'un logiciel de bases de données est calculée par ce site db-engines.com en utilisant les paramètres suivants:

  • Nombre de mentions du logiciel sur les sites Web, mesuré en nombre de résultats dans les requêtes des moteurs de recherche. À l'heure actuelle, Google et Bing sont utilisés pour cette mesure. Afin de compter uniquement les résultats pertinents, le mot database est associé au nom du logiciel (ex. "oracle" et "database").
  • L'intérêt général pour ce logiciel : pour cette mesure, la fréquence des recherches est prise en compte, à partir de Google Trends.
  • Fréquence de discussions techniques sur ce logiciel : est pris en compte le nombre de questions liées et le nombre d'utilisateurs intéressés sur les sites spécialisés d'entraide les plus connus : Stack Overflow et DBA Stack Exchange.
  • Nombre d'offres d'emploi, dans lesquelles le logiciel est mentionné : est pris en compte le nombre d'offres sur les principaux moteurs de recherche d'emploi retenus par DB-Engines : Indeed et Simply Hired.
  • Nombre de profils de réseaux professionnels, dans lequel le logiciel est mentionné : c'est LinkedIn qui est pris en compte pour ce nombre de profils.
  • Pertinence sur les réseaux sociaux : est pris en compte le nombre de tweets dans Twitter, dans lesquels le système est mentionné.

DB-Engines calcule la valeur de popularité d'un logiciel en normalisant et en faisant la moyenne des paramètres individuels. Ces transformations mathématiques sont faites de façon à ce que la distance entre chaque logiciel soit préservée. Cela signifie que, lorsque le logiciel A est deux fois plus populaire dans le classement ci-dessus que le logiciel B, alors c'est qu'il est deux fois plus populaire en faisant la moyenne sur tous les critères d'évaluation individuels.

Afin d'éliminer les effets causés par la modification des quantités d'informations sources collectées, le score de popularité est toujours une valeur relative, qui doit être interprétée uniquement en la comparant au score des autres logiciels.

Le classement DB-Engines ne mesure ni le nombre d'installations des logiciels, ni leur utilisation dans les services informatiques. Il est donc possible qu'une augmentation de popularité d'un logiciel, tel que mesurée par le classement DB-Engines (par exemple en fonction des discussions ou des offres d'emploi), précède une large utilisation du logiciel concerné un certain temps plus tard. De ce fait, le classement DB-Engines peut se comporter comme un indicateur précoce.

Top 10 des bases de données par popularité en 2020

Voici le TOP 10 des moteurs bases de données sous l'angle de l'évolution de leur popularité, mois par mois :

Evolution de la popularite des bases de données, mois par mois

Voici les données chiffrées correspondantes, pour le même TOP 10 des bases de données, avec l'évolution de leur classement et de leur score par rapport à un mois plus tôt et un an plus tôt :

Top 10 des bases de données en 2020

En janvier 2020, les moteurs de bases de données les plus populaires sont donc :

  1. Oracle (score = 1346)
  2. MySQL (score = 1274)
  3. Microsoft SQL Server (score = 1098)
  4. PostgreSQL (score = 507)
  5. MongoDB (score = 426)
  6. IBM Db2 (score = 168)
  7. Elasticsearch (score = 151)
  8. Redis (score = 148)
  9. Microsoft Access (score = 128)
  10. SQLite (score = 122)

Quelques précisions sur les graphiques

Il est important de noter que l'échelle verticale des graphiques est de type logarithmique, ce qui atténue fortement l'écart entre les valeurs les plus faibles et les valeurs plus élevées. 

C'est ainsi que, pour janvier 2020, le score de popularité d'Oracle est de 1346 et celui de PostgreSQL est de 507. Si l'échelle n'était pas logarithmique, le graphique serait illisible.

L'échelle horizontale présente les valeurs sur 8 années : de 2013 à 2020.

Analyses et comparaisons

Dans la première partie de cet article sur le Top 10 des bases de données nous avons vu un classement des moteurs de bases de données par popularité, grâce au  site DB-engine.com. Dans cette seconde partie, nous comparerons les bases commerciales aux bases open source, nous étudierons les bases relationnelles face au NoSQL, etc.

Popularité des bases relationnelles et NoSQL, et évolution de leur popularité depuis 2013

Commençons par examiner la popularité actuelle des bases relationnelles et NoSQL.

Dans le graphique ci-dessous, concentrons-nous sur les catégories suivantes :

  • Relational DBMS
  • NoSQL
  • Colonnes (Wide column stores)
  • Document stores
  • Graph DBMS
  • Key-value Stores

Classement des bases de données par categorie

Examinons l'évolution de la popularité des bases relationnelles et NoSQL depuis Janvier 2013 (avec une base 100 pour chaque catégorie en 2013) :

Evolution de la popularité des bases de données par categorie

Examinons l'évolution de la popularité des bases relationnelles et NoSQL depuis 24 mois (avec une base 100 pour chaque catégorie il y a 24 mois) :

Evolution de la popularité des bases de données par catégorie, focus sur 24 mois

Examinons l'évolution de la popularité des bases relationnelles et NoSQL depuis 12 mois (avec une base 100 pour chaque catégorie il y a 12 mois) :

Evolution de la popularité des bases données par catégorie, focus sur 12 mois

Nous notons une forte montée de la popularité des différents types de bases de données NoSQL depuis quelques années. Néanmoins, ces chiffres ne doivent pas masquer le fait que les bases relationnelles font à elles seules plus de 75% de l'indice de popularité à ce jour, toutes bases confondues, comme indiqué dans le graphique en camembert présenté plus haut - toutefois en légère baisse depuis 2016 (80 %).

La percée des bases NoSQL s’expliquent par le fait qu’elles sont fortement utilisées, depuis ces dernières années, dans le contexte d’applications Web temps réel.

Top 20 des bases de données relationnelles (mode lignes, colonnes ou mixte)

Examinons maintenant la popularité des produits pour chacune des 5 catégories mentionnées ci-dessus.

Voici le top 20 des bases relationnelles, tant commerciales qu'Open Source :

Top 20 des bases de données relationnelles

Les 4 premières lignes du classement montrent la relative bonne tenue des bases commerciales (Oracle, +77.85, SQL Server, +58.29) par rapport aux bases Open Source (MySQL, +120.39, PostgreSQL, +41.08) sur la dernière période annuelle, par rapport aux périodes précédentes qui avaient vu une forte poussée de bases Open Source.

Voyons un graphique reprenant les 12 bases relationnelles commerciales parmi le Top 20 des bases relationnelles :

Evolution des bases de données relationnelles commerciales

Il ne surprendra personne de constater qu'Oracle et SQL Server sont les leaders des bases commerciales, loin devant DB2 et Microsoft Access.

On note toutefois une forte progression de :

  • Vertica, qui est un système optimisé pour les gros entrepôts de données, dont le nombre s’est fortement accru ces dernières années.
  • SAP Hana, apparu en 2010, est un SGBD fourni par SAP. Sa progression est notamment due au fait qu’il est de plus en plus proposé par SAP afin d’héberger les données de son ERP en lieu et place de SGBD traditionnels tels Oracle

Voyons maintenant un graphique reprenant les 8 bases relationnelles Open Source (au moins dans leur version d'entrée) parmi le Top 20 des bases relationnelles :

Evolution des bases de données relationnelles open source

A nouveau, l'indice de popularité de MySQL et PostgreSQL est conforme à la vision du marché que nous constatons aujourd'hui. Maria DB, dérivée de MySQL connait une montée significative – sans doute due au fait qu’il est perçu comme un « véritable » SGBD Open Source, depuis que MySQL est détenu par Oracle.

Top 20 des Bases de données NoSQL de type Clé-Valeur

Voici le top 20 des bases NoSQL de type Clé-Valeur :

Top 20 des bases de données de type clé valeur

Et le graphique associé, pour une sélection (arbitraire) de produits :

Evolution des bases de données de type clé valeur

Sortent nettement du lot : Redis et Amazon DynamoDB.

Redis est un système hautes-performances, dont le principe repose sur le chargement en mémoire de l’intégrité des données. Il a été mis en œuvres par de gros sites Web tels The Guardian, GitHub, Stack Overflow (source : https://fr.wikipedia.org/wiki/Redis)

Top 20 des Bases NoSQL de type Documents

Voici le top 20 des bases NoSQL de type Documents (le site DB-engine inclut ici certaines bases également présentes dans la catégorie Clé-Valeur) :

Top 20 des bases de données NoSQL de type documents

Et le graphique associé, pour une sélection (arbitraire) de produits :

Evolution des bases de données NoSQL de type documents

Nous notons ici la suprématie incontestable de MongoDB, sur lequel DIGORA a développé une expertise.

Il est toutefois à noter la forte progression de Microsoft Azure Cosmos DB.

MongoDB est leader du marché des bases NoSQL depuis les origines et a su conforter sa position. Il est notamment utilisé par des grands sites Web tels que eBay, pagesjaunes, New York Times (source : http://fr.wikipedia.org/wiki/MongoDB)

Microsoft Azure Cosmos DB est la solution NoSQL de Microsoft. Il est encore tout récent, d’où sa forte progression.

Top 20 des Bases NoSQL de type Graphes

Ces bases s’appuient sur des structures graphiques ; elles sont typiquement adaptées aux réseaux sociaux.

Voici le top 20 des bases de type Graphes (le site DB-engine inclut également ici certaines bases de type multi-modèles) :

Top 20 des bases de données NoSQL graphes

Et le graphique associé :

Evolution des bases de données NoSQL graphes

Nous notons ici la suprématie de Neo4j, avec toutefois une forte progression de Microsoft Azure Cosmos DB, que nous avons déjà constatée précédemment.

La popularité de Neo4j s’explique par la palette de fonctionnalités qu’il offre, particulièrement adaptées aux réseaux sociaux, mais aussi par sa facilité d’approche grâce à la qualité de la documentation et des tutoriels.

Top 10 des Bases de données NoSQL de type Wide Column Stores

Voici le top 10 des bases de type Colonnes (le site DB-engine inclut également ici 1 base de type multi-modèles) :

Top 10 des bases de données Wide Column Stores

Et le graphique associé :

Evolution des bases de données Wide Column Stores

Dans une base Wide Column-Store, une table a des lignes et des colonnes, mais à l’inverse d’une base relationnelle classique, le nom et le format des colonnes peuvent varier d’une ligne à l’autre dans la même table.

Nous notons ici la suprématie de Cassandra, sur lequel DIGORA a développé une expertise, notamment avec les extensions apportées par DATASTAX.

Cassandra possède le gros avantage de pouvoir organiser les données de manière distribuée et redondante, ce qui permet la flexibilité et la robustesse en cas de panne.

Les gros utilisateurs de Cassandra incluent Aple, BlackRock, CERN, Cisco’s WebEx, Discord, Netflix …

Top 10 des Bases orientées objet

Voici le top 10 des bases de Orientées Objet :

Top 10 des bases de données orientées objet

Les bases dite « Muti Model » supportent plusieurs types de modélisation, exemple pour InterSystems Caché :

Multimodel

Et le graphique associé :

Evolution des bases de données orientées objet

On note une suprématie confirmée pour la base InterSystems Caché, ainsi qu’une forte progression pour la base InterSystems IRIS, apparue récemment.

Le succès de ces solutions est due à leur aspect multi-modèle : DB Orientée objet, NoSQL Clé-Valeur, SGBD Relationnel pour Caché et Iris, ainsi que Document pour Iris.

Intersystem Caché et IRIS

Top 10 des outils de type Search Engines

Voici le top 10 des bases de type Search Engines :

Top 10 des bases de données de type Search engines

Et le graphique associé :

Evolution des bases de données de type Search engines

On constate la forte progression d’Elasticsearch ces dernières années, qui a pris la tête du classement.

Elasticsearch est le serveur de recherche d’entreprise le plus populaire.

La principale force d’Elasticsearch provient de ses outils intégrés d’aide à la visualisation et à l’analyse des données.

Vous avez aimé cet article ? Nos experts vous proposent ici un nouvel article consacré au TOP 10 des bases de données. Ils y décryptent pour vous le degré de popularité des principaux moteurs de bases de données relationnels et NoSQL

Pour rester au courant de nos derniers articles, n'hésitez pas à vous abonner à notre newsletter, pour les recevoir directement dans votre boîte mail. 

 

 

Cet article a été mis à jour par Emmanuel Humblot, Consultant DBA

copy-link