Was ist Apache Cassandra?

Als einzige verteilte NoSQL-Datenbank bietet Apache Cassandra® die ständige Verfügbarkeit, die ultraschnelle Lese-/Schreib-Performance und die unbegrenzte lineare Skalierbarkeit, die erfolgreiche moderne Anwendungen benötigen.

Astra-Konto erstellen

Cassandra 4.0 ist da! Erfahren Sie mehr über die bisher schnellste, zuverlässigste und benutzerfreundlichste Open-Source-Version von Cassandra.

Mehr erfahren

Möchten Sie die Vorteile der Open-Source-Version von Cassandra entspannt genießen? Erfahren Sie mehr über DataStax Luna, den Enterprise-Support für Apache Cassandra.

Mehr erfahren

Allgemeines über Apache Cassandra

Apache Cassandra ist eine verteilte NoSQL-Datenbank, die bei Facebook entwickelt und dann im Juli 2008 als Open-Source-Projekt veröffentlicht wurde.

Cassandra bietet die kontinuierliche Verfügbarkeit (null Ausfallzeiten), hohe Performance und lineare Skalierbarkeit, die moderne Anwendungen erfordern. Gleichzeitig zeichnet sie sich durch Benutzerfreundlichkeit und unkomplizierte Replikation über Rechenzentren und Regionen hinweg aus. Cassandra kann Petabyte an Informationen und Tausende von gleichzeitigen Operationen pro Sekunde verarbeiten, sodass Unternehmen große Datenmengen in Hybrid- und Multi-Cloud-Umgebungen handhaben können.

Apache Cassandra-Infografik zum Versionsverlauf von April 2010 bis 2018

Zeitleiste zu Apache Cassandra anzeigen

Apache Cassandra im Vergleich zu traditionellen relationalen Datenbanken

Cassandra unterscheidet sich in den folgenden Punkten von einer typischen relationalen Datenbank:

Apache Cassandra	Relationale Datenbank
Für schnelle ankommende Daten geeignet	Für moderat schnelle ankommende Daten geeignet
Unterstützt einfache Transaktionen	Unterstützt komplexe/verschachtelte Transaktionen
Keine Single Points of Failure; ständige Verfügbarkeit	Single Points of Failure mit Failover
Unterstützt sehr hohe Datenvolumen	Unterstützt moderate Datenvolumen
Dezentralisierte Bereitstellungen	Zentralisierte Bereitstellungen
Daten werden an vielen Standorten geschrieben	Daten werden zumeist an einem Standort geschrieben
Unterstützt Lese- und Schreib-Skalierbarkeit	Unterstützt Lese-Skalierbarkeit (mit Konsistenzeinbußen)
Bereitstellung im horizontalen Scale-out-Modus	Bereitstellung im vertikalen Scale-up-Modus

Lesen Sie unseren NoSQL-Leitfaden, wenn Sie mehr darüber erfahren möchten, wie sich Cassandra und andere NoSQL-Datenbanken von relationalen Datenbanken unterscheiden.

Geschichte von Apache Cassandra

Haupt-Features und -vorteile von Apache Cassandra

Egal, ob Sie Serverprotokolle, E-Mails, Social-Media-Beiträge oder PDFs verarbeiten müssen, Cassandra hat alles, was Sie brauchen. Sie können fundiertere Entscheidungen treffen und dabei wirklich jeden Datensatz einbeziehen.

Hier sind einige der wichtigsten Vorteile und Features von Cassandra:

Open-Source: Die große Mehrheit der heutigen Softwareentwicklungsunternehmen hat sich für die Einführung von Open-Source-Technologien entschieden, angefangen beim Linux-Betriebssystem bis hin zur Infrastruktur für die Verwaltung von Daten. Open-Source-Technologien sind nicht nur aufgrund ihrer Erschwinglichkeit und Erweiterbarkeit attraktiv, sie bieten auch Flexibilität, da eine einseitige Bindung an bestimmte Anbieter vermieden wird. Unternehmen, die auf Open-Source setzen, profitieren laut eigener Aussage von einer höheren Innovationsgeschwindigkeit und einer schnelleren Einführung.

Flexible, vertraute Oberfläche: Cassandra Query Language (CQL) ähnelt SQL. Es sollte den meisten Entwicklern also ziemlich leicht fallen, sich damit vertraut zu machen. Erfahren Sie unten mehr über CQL.

Hohe Performance: Die meisten traditionellen Datenbanken weisen eine primäre/sekundäre Architektur auf. In diesen Konfigurationen führt ein einzelnes primäres Replikat Lese- und Schreibvorgänge durch, während sekundäre Replikate nur Lesevorgänge durchführen können. Zu den Nachteilen dieser Architektur gehören eine erhöhte Latenz, höhere Kosten und eine geringere Verfügbarkeit bei großen Datenmengen. Bei Cassandra ist kein einzelner Knoten für die Replikation von Daten über einen Cluster hinweg verantwortlich. Stattdessen ist jeder Knoten in der Lage, alle Lese- und Schreibvorgänge durchzuführen. Dies verbessert die Performance und verleiht der Datenbank eine höhere Resilienz.

Active Everywhere ohne Ausfallzeiten: Da jeder Cassandra-Knoten Lese- und Schreibvorgänge durchführen kann, werden Daten schnell über Hybrid-Cloud-Umgebungen und -Regionen hinweg repliziert. Wenn ein Knoten ausfällt, werden Benutzer automatisch zum nächsten funktionierenden Knoten umgeleitet. Sie werden nicht einmal bemerken, dass ein Knoten offline gegangen ist, da sich Anwendungen auch bei einem Ausfall wie vorgesehen verhalten. Dadurch sind Anwendungen immer verfügbar und die Daten sind immer zugänglich und gehen nie verloren. Darüber hinaus werden Probleme sofort, wenn sie auftreten, durch die integrierten Reparaturfunktionen von Cassandra behoben – ohne dass Sie einen Finger rühren müssen. Die Produktivität wird durch den Ausfall eines Knotens also in keiner Weise beeinträchtigt.

Skalierbarkeit: In traditionellen Umgebungen ist die Skalierung von Anwendungen ein zeitaufwändiger und kostspieliger Prozess, der normalerweise durch vertikale Skalierung mit teureren Maschinen umgesetzt wird. Bei Cassandra können Sie horizontal skalieren, indem Sie einfach weitere Knoten zum Cluster hinzufügen. Wenn beispielsweise vier Knoten 200.000 Transaktionen/Sekunde verarbeiten können, können acht Knoten 400.000 Transaktionen/Sekunde verarbeiten.

Nahtlose Replikation: Führende Unternehmen setzen heute zunehmend auf Multi-Data-Center-, Hybrid-Cloud- und sogar Multi-Cloud-Bereitstellungen, um größtmögliche Vorteile zu erzielen, ohne sich an das Ökosystem eines bestimmten Anbieters zu binden. Voraussetzung für die optimale Nutzung von Multi-Cloud-Umgebungen ist jedoch eine zugrunde liegende Cloud-Datenbank, die Skalierbarkeit, Sicherheit, Performance und Verfügbarkeit bietet. Daher ist es wenig überraschend, dass der Markt für Cloud-Datenbanken voraussichtlich jährlich um fast 65 Prozent wachsen und bis 2022 68,9 Milliarden US-Dollar erreichen wird.

Was ist NoSQL? Erfahren Sie, wie sich Cassandra und andere NoSQL-Datenbanken von relationalen Datenbanken unterscheiden

Cassandra Query Language (CQL) verstehen

Wie geht es mit Apache Cassandra weiter?

Bei DataStax arbeiten wir intensiv mit der Open-Source-Community zusammen. Dabei bauen wir auf der mehr als zehnjährigen Entwicklung von Cassandra auf, um ihre Position als führende Datenbank für cloudnative Anwendungen zu festigen.

Cassandra gilt seit jeher als extrem leistungsstarke Datenbank, die sich für die anspruchsvollsten Szenarien eignet, aber auch schwierig zu erlernen und zu bedienen ist. DataStax setzt auf die Zusammenarbeit mit der Cassandra-Community, um im Sinne der Anforderungen unserer Kunden die Einführung, Anwendung und Erweiterung zu vereinfachen.

Dabei evaluieren wir u. a. die folgenden Ideen:

Bereitstellung vereinfachter Entwickler-APIs, einschließlich REST und GraphQL
Erweiterung von CQL um weitere SQL-ähnliche Funktionen, einschließlich Indizierung, Verknüpfungen und ACID sowie vollständiger JSON-Unterstützung
Standardisierte Management-APIs und ein offizieller, projektgestützter Kubernetes-Operator
Plugin-fähige Speicherengine (zusammen mit anderen APIs), um die Anpassung der Datenbank für verschiedene Bereitstellungen und Nutzungsprofile zu ermöglichen

Wie kann ich einsteigen?

Wenn Sie mehr über Apache Cassandra erfahren möchten, gibt es hier verschiedene Ressourcen, die Ihnen den Einstieg erleichtern.

DataStax für Entwickler

Erfahren Sie, wie Sie Apache Cassandra™ erfolgreich einsetzen.

Jetzt besuchen

DataStax Astra DB testen

Erstellen Sie schnell cloudnative Anwendungen mit DataStax Astra DB, einer Database-as-a-Service-Lösung auf Basis von Apache Cassandra.

Kostenlos testen

Whitepaper zu Apache Cassandra 4.0

Laden Sie das Whitepaper kostenlos herunter und erfahren Sie, wie Sie von der Leistungsstärke und Zuverlässigkeit von Cassandra 4.0 profitieren können

Whitepaper herunterladen