Qu’est-ce qu’Apache Cassandra ?

Apache Cassandra® est la seule base de données NoSQL distribuée qui fournit la disponibilité permanente, la rapidité fulgurante de lecture/écriture et l’évolutivité linéaire illimitée nécessaires pour répondre aux exigences des applications modernes performantes.

Créer un compte Astra

Cassandra 4.0 est arrivée ! Découvrez la version Cassandra open source la plus rapide, la plus fiable et la plus facile à utiliser à ce jour.

Vous souhaitez exécuter Cassandra open source en ayant l’esprit tranquille ? Découvrez DataStax Luna, le support entreprise pour Apache Cassandra.

Présentation d’Apache Cassandra

Apache Cassandra est une base de données NoSQL distribuée créée par Facebook puis mise à disposition comme projet open source en juillet 2008.

Cassandra présente la disponibilité continue (indisponibilité zéro), la haute performance et l’évolutivité linéaire requises par les applications modernes, tout en offrant une simplicité opérationnelle et la réplication sans effort entre datacenters et zones géographiques. Elle peut traiter des pétaoctets d’informations et des milliers d’opérations simultanées par seconde, ce qui permet aux organisations de gérer de gros volumes de données dans des environnements hybrides et multi-cloud.

Infographie Apache Cassandra détaillant l’historique des versions d’avril 2010 à 2018

Voir l’historique d’Apache Cassandra

Apache Cassandra comparée aux bases de données relationnelles traditionnelles

Cassandra se différencie d’une base de données relationnelle typique sur les points suivants :

Apache Cassandra	Base de données relationnelle
Gère une vitesse de données entrantes élevée	Gère une vitesse de données entrantes modérée
Prend en charge les transactions simples	Prend en charge les transactions complexes/imbriquées
Pas de point unique de défaillance ; disponibilité de service constante	Points uniques de défaillance avec basculement
Prend en charge des volumes de données très élevés	Prend en charge des volumes de données modérés
Déploiements décentralisés	Déploiements centralisés
Écriture de données sur de nombreux sites	Écriture de données principalement sur un site
Prend en charge l’évolutivité en lecture et écriture	Prend en charge l’évolutivité en lecture (avec des pertes de cohérence)
Déployée avec scalabilité horizontale	Déployée avec scalabilité verticale

Consultez notre introduction à NoSQL si vous souhaitez en savoir plus sur les différences entre Cassandra et d’autres bases de données NoSQL par rapport aux bases de données relationnelles.

Historique d’Apache Cassandra

Fonctionnalités et avantages clés d’Apache Cassandra

Que vous ayez besoin de traiter des journaux serveurs, des e-mails, des posts sur les réseaux sociaux ou des PDF, Cassandra s’en occupe. Vous pourrez prendre des décisions plus éclairées sans négliger aucune de vos données.

Voici quelques-uns des avantages et fonctionnalités clés de Cassandra :

Open source : Les organisations modernes de développement logiciel ont majoritairement adopté les technologies open source, en commençant par le système d’exploitation Linux pour aller vers l’infrastructure de gestion de données. Les technologies open source sont attrayantes par leur caractère abordable et évolutif, leur flexibilité permet aussi d’éviter l’enfermement propriétaire. Les organisations adeptes de l’open source font état d’une innovation et d’une adoption plus rapides.

Interface familière et flexible : Le langage de requête Cassandra (CQL) est similaire à SQL. La plupart des développeurs devraient donc se familiariser rapidement avec celui-ci. Voir plus loin pour en savoir plus sur CQL.

Haute performance : la majorité des bases de données traditionnelles présentent une architecture primaire / secondaire. Dans ces configurations, un seul réplica primaire effectue les opérations de lecture et d’écriture tandis que les réplicas secondaires peuvent seulement réaliser les opérations de lecture. Les inconvénients de cette architecture sont une latence élevée, des coûts importants et une disponibilité moindre à grande échelle. Avec Cassandra, la réplication des données dans un cluster ne dépend pas que d’un seul nœud. Chaque nœud peut effectuer toutes les opérations de lecture et d’écriture. Cela améliore les performances et renforce la résilience de la base de données.

Active everywhere sans indisponibilité : comme chaque nœud Cassandra peut effectuer des opérations de lecture et d’écriture, les données sont rapidement répliquées dans les environnements cloud hybrides et les zones géographiques. Si un nœud tombe en panne, les utilisateurs seront automatiquement dirigés vers le nœud fonctionnel le plus proche. Ils ne remarqueront même pas qu’un nœud est indisponible parce que les applications se comportent comme prévu même en cas de panne. Par conséquent, les applications sont toujours disponibles et les données toujours accessibles et jamais perdues. Par ailleurs, les services de réparation intégrés de Cassandra résolvent les problèmes dès leur apparition, sans intervention manuelle. La productivité n’est pas affectée si des nœuds tombent en panne.

Évolutivité : dans les environnements traditionnels, la mise à l’échelle est un processus long et onéreux habituellement obtenu par scalabilité verticale avec des appareils plus coûteux. Cassandra vous permet la scalabilité horizontale par le simple ajout de nœuds supplémentaires dans le cluster. Si, par exemple, quatre nœuds peuvent gérer 200 000 transactions/seconde, huit nœuds pourront gérer 400 000 transactions/seconde.

Réplication fluide : les plus grandes entreprises actuelles se tournent de plus en plus vers les multi-datacenters, le cloud hybride, voire les déploiements multicloud pour profiter des avantages de chacun sans s’enfermer dans l’écosystème d’un seul fournisseur. Tirer pleinement parti de la plupart des environnements multicloud implique toutefois de disposer en premier lieu d’une base de données cloud sous-jacente qui offre évolutivité, sécurité, performance et disponibilité. Par conséquent, il n’est pas surprenant que la croissance attendue du marché des bases de données cloud soit évaluée à environ 65 % par an pour atteindre 68,9 milliards de dollars d’ici 2022.

NoSQL, qu’est-ce que c’est ? Découvrez ce qui différencie Cassandra et d’autres bases de données NoSQL des bases de données relationnelles

Comprendre le langage de requête de Cassandra (CQL)

Quel avenir pour Apache Cassandra ?

Chez DataStax, nous travaillons avec la communauté open source pour solidifier la position de Cassandra en tant que base de données leader pour les applications cloud natives en nous appuyant sur ses quelque dix ans de maturité.

Cassandra est traditionnellement connue comme une base de données extrêmement puissante capable de faire face aux cas d’utilisation les plus exigeants, mais qui est aussi difficile à apprendre et utiliser. DataStax s’engage avec la communauté Cassandra à la rendre plus facile à utiliser, adopter et faire évoluer en fonction de vos besoins.

Vois quelques idées que nous explorons :

Fournir des API développeurs simplifiées comme REST et GraphQL
Ajouter plus de fonctionnalités similaires à SQL dans CQL, dont l’indexation, les jointures, ACID et le support complet JSON.
Des API de gestion des standards et un opérateur Kubernetes officiel appuyé par un projet
Rendre le moteur de stockage intégrable avec d’autres API pour permettre la personnalisation de la base de données pour différents déploiements et profils d’usage

Comment se lancer ?

Si vous souhaitez en savoir plus sur Apache Cassandra, nous avons réuni plusieurs ressources pour vous aider à démarrer.

DataStax pour les développeurs

Découvrez comment réussir avec Apache Cassandra™.

Voir maintenant

Essayer DataStax Astra DB

Créez rapidement des applications cloud natives avec DataStax Astra DB, une base de données en tant que service reposant sur Apache Cassandra.

Essayer gratuitement

Livre blanc sur Apache Cassandra 4.0

Obtenez votre exemplaire numérique gratuit pour tirer parti de la performance et de la fiabilité de Cassandra 4.0

Obtenir le livre blanc