Connaissez-vous le TOP 10 des bases de données (partie 2) ?
Il y a peu nous avions fait un Top 10 des bases de données avec DB-engine.com, un calculateur de popularité des moteurs de bases de données. Abordons aujourd’hui quelques aspects supplémentaires de ce site.
Voici quelques points que nous aborderons dans ce billet :
- Comparaison entre la popularité des bases commerciales et la popularité des bases Open Source et évolutions ;
- Evolution de la popularité par catégories de bases de données (relationnel, différents types de bases NoSQL, etc...) ;
- Graphiques et tableaux par catégories.
Pour plus d'informations sur le principe des bases NoSQL ainsi que les 4 grandes catégories de bases NoSQL, c'est dans cet article.
En fait, le TOP 15 contient parfois 20 produits...
Popularité des bases relationnelles et NoSQL, et évolution de leur popularité depuis 2013
Commençons par examiner la popularité actuelle des bases relationnelles et NoSQL.
Dans le graphique ci-dessous, concentrons-nous sur les catégories suivantes :
- Relationnal DBMS
- NoSQL
- Colonnes (Wide column stores)
- Document stores
- Graph DBMS
- Key-value Stores
Examinons l'évolution de la popularité des bases relationnelles et NoSQL depuis Janvier 2013 (avec une base 100 pour chaque catégorie en 2013) :
Examinons l'évolution de la popularité des bases relationnelles et NoSQL depuis 24 mois (avec une base 100 pour chaque catégorie il y a 24 mois) :
Examinons l'évolution de la popularité des bases relationnelles et NoSQL depuis 12 mois (avec une base 100 pour chaque catégorie il y a 12 mois) :
Remarque : Nous notons une forte montée de la popularité des différents types de bases de données NoSQL depuis quelques années. Néanmoins, ces chiffres ne doivent pas masquer le fait que les bases relationnelles font à elles seules plus de 70% de l'indice de popularité à ce jour, toutes bases confondues, comme indiqué dans le graphique en camembert présenté plus haut - toutefois en baisse depuis 2016 (80%).
La percée des bases NoSQL s’expliquent par le fait qu’elles sont fortement utilisées, depuis ces dernières années, dans le contexte d’applications Web temps réel.
Bases relationnelles (mode lignes, colonnes ou mixte)
Examinons maintenant la popularité des produits pour chacune des 5 catégories mentionnées ci-dessus.
Voici le top 20 des bases relationnelles, tant commerciales qu'Open Source :
- Les 4 premières lignes du classement montrent la relative bonne tenue de la première base du classement, Oracle (+5,32) sur la période annuelle, et un léger tassement de Microsoft SQL Server, qui conserve toutefois la 3ème place (-12,17). Les deux premières bases Open Source (MySQL et PostgreSQL) sont en légère progression (+0,17 et + 0,44), consolidant ainsi leurs deuxième et quatrième places respectives.
Voyons un graphique reprenant les 10 bases relationnelles commerciales parmi le Top 20 des bases relationnelles :
Il ne surprendra personne de constater qu'Oracle et SQL Server sont les leaders des bases commerciales, loin devant DB2 et Microsoft Access.
On note toutefois une forte progression de :
• Snowflake, qui est un système de données stockées dans le cloud, dont le score s’est fortement accru ces dernières années.
• Google BigQuery, qui est un entrepôt de données d’entreprise multicloud.
Voyons maintenant un graphique reprenant les 6 bases relationnelles Open Source (au moins dans leur version d'entrée) parmi le Top 20 des bases relationnelles :
A nouveau, l'indice de popularité de MySQL et PostgreSQL est conforme à la vision du marché que nous constatons aujourd'hui. Maria DB, dérivée de MySQL connait une montée significative – sans doute car il est perçu comme un « véritable » SGBD Open Source, depuis que MySQL est détenu par Oracle.
Bases NoSQL de type Clé-Valeur
Voici le top 20 des bases NoSQL de type Clé-Valeur :
Et le graphique associé, pour une sélection (arbitraire) de produits :
Sortent nettement du lot : REDIS et Amazon DynamoDB.
Redis est un système hautes-performances, dont le principe repose sur le chargement en mémoire de l’intégrité des données. Il a été mis en œuvres par de gros sites Web tels The Guardian, GitHub, Stack Overflow (source : Wikipedia)
Bases NoSQL de type Documents
Voici le top 20 des bases NoSQL de type Documents (le site DB-engine inclut ici certaines bases également présentes dans la catégorie Clé-Valeur) :
Il est toutefois à noter la forte progression de Microsoft Azure Cosmos DB et AmazonDynamoDB.
MongoDB est leader du marché des bases NoSQL depuis les origines et a su conforter sa position. Il est notamment utilisé par des grands sites Web tels que eBay, pagesjaunes, New York Times (source : Wikipedia)
Microsoft Azure Cosmos DB est la solution NoSQL de Microsoft.
Amazon DynamoDB est la solution NoSQL d’Amazon.
Bases NoSQL de type Graphes
Voici le top 20 des bases de type Graphes (le site DB-engine inclut également ici certaines bases de type multi-modèles) :
Nous notons ici la suprématie de Neo4j, avec toutefois une forte progression de Microsoft Azure Cosmos DB, que nous avons déjà constatée précédemment.
La popularité de Neo4j s’explique par la palette de fonctionnalités qu’il offre, particulièrement adaptées aux réseaux sociaux, mais aussi par sa facilité d’approche grâce à la qualité de la documentation et des tutoriels
Bases NoSQL de type Colonnes (Wide Column Stores)
Voici le top 10 des bases de type Colonnes (le site DB-engine inclut également ici 1 base de type multi-modèles) :
Et le graphique associé :
Dans une base Wide Column-Store, une table a des lignes et des colonnes, mais à l’inverse d’une base relationnelle classique, le nom et le format des colonnes peuvent varier d’une ligne à l’autre dans la même table.
Nous notons ici la suprématie de Cassandra, sur lequel DIGORA a développé une expertise, notamment avec les extensions apportées par DATASTAX.
Cassandra possède le gros avantage de pouvoir organiser les données de manière distribuée et redondante, ce qui permet la flexibilité et la robustesse en cas de panne.
Les gros utilisateurs de Cassandra incluent Aple, BlackRock, CERN, Cisco’s WebEx, Discord, Netflix …
Bases Orientées objet
Voici le top 10 des bases de Orientées Objet :
Les bases dite « Muti Model » supportent plusieurs types de modélisation, exemple pour InterSystems Caché :
Et le graphique associé :
On note une suprématie confirmée pour la base InterSystems Caché, ainsi qu’une forte progression pour la base InterSystems IRIS, apparue récemment.
Le succès de ces solutions est due à leur aspect multi-modèle : DB Orientée objet, NoSQL Clé-Valeur, SGBD Relationnel pour Caché et Iris, ainsi que Document pour Iris.
Outils de type Search Engines
Voici le top 10 des bases de type Search Engines :
Et le graphique associé :
On constate la présence persistante d’Elasticsearch en tête du classement. Elasticsearch est le serveur de recherche d’entreprise le plus populaire. La principale force d’Elasticsearch provient de ses outils intégrés d’aide à la visualistion et à l’analyse des données.
Il reste quelques points à examiner sur le site db-engines.com
- Méthode de calcul de la valeur de popularité présentées pour les produits ci-dessus ;
- Evolution de la popularité des produits Open Source comparée à la popularité des produits commerciaux ;
- Liste impressionnante des systèmes de bases de données suivies par le site db-engines.com ;
N'hésitez pas à consulter notre cas client qui montre comment nous avons accompagné le CHU de Bordeaux pour la migration et la nouvelle infrastructure de ses bases de données.