Was ist Apache Cassandra?
Als einzige verteilte NoSQL-Datenbank bietet Apache Cassandra® die ständige Verfügbarkeit, die ultraschnelle Lese-/Schreib-Performance und die unbegrenzte lineare Skalierbarkeit, die erfolgreiche moderne Anwendungen benötigen.
Cassandra 4.0 ist da! Erfahren Sie mehr über die bisher schnellste, zuverlässigste und benutzerfreundlichste Open-Source-Version von Cassandra.
Mehr erfahrenMöchten Sie die Vorteile der Open-Source-Version von Cassandra entspannt genießen? Erfahren Sie mehr über DataStax Luna, den Enterprise-Support für Apache Cassandra.
Mehr erfahrenAllgemeines über Apache Cassandra
Apache Cassandra ist eine verteilte NoSQL-Datenbank, die bei Facebook entwickelt und dann im Juli 2008 als Open-Source-Projekt veröffentlicht wurde.
Cassandra bietet die kontinuierliche Verfügbarkeit (null Ausfallzeiten), hohe Performance und lineare Skalierbarkeit, die moderne Anwendungen erfordern. Gleichzeitig zeichnet sie sich durch Benutzerfreundlichkeit und unkomplizierte Replikation über Rechenzentren und Regionen hinweg aus. Cassandra kann Petabyte an Informationen und Tausende von gleichzeitigen Operationen pro Sekunde verarbeiten, sodass Unternehmen große Datenmengen in Hybrid- und Multi-Cloud-Umgebungen handhaben können.
Apache Cassandra im Vergleich zu traditionellen relationalen Datenbanken
Cassandra unterscheidet sich in den folgenden Punkten von einer typischen relationalen Datenbank:
Apache Cassandra | Relationale Datenbank |
---|---|
Für schnelle ankommende Daten geeignet | Für moderat schnelle ankommende Daten geeignet |
Unterstützt einfache Transaktionen | Unterstützt komplexe/verschachtelte Transaktionen |
Keine Single Points of Failure; ständige Verfügbarkeit | Single Points of Failure mit Failover |
Unterstützt sehr hohe Datenvolumen | Unterstützt moderate Datenvolumen |
Dezentralisierte Bereitstellungen | Zentralisierte Bereitstellungen |
Daten werden an vielen Standorten geschrieben | Daten werden zumeist an einem Standort geschrieben |
Unterstützt Lese- und Schreib-Skalierbarkeit | Unterstützt Lese-Skalierbarkeit (mit Konsistenzeinbußen) |
Bereitstellung im horizontalen Scale-out-Modus | Bereitstellung im vertikalen Scale-up-Modus |
Lesen Sie unseren NoSQL-Leitfaden, wenn Sie mehr darüber erfahren möchten, wie sich Cassandra und andere NoSQL-Datenbanken von relationalen Datenbanken unterscheiden.
Geschichte von Apache Cassandra
Haupt-Features und -vorteile von Apache Cassandra
Egal, ob Sie Serverprotokolle, E-Mails, Social-Media-Beiträge oder PDFs verarbeiten müssen, Cassandra hat alles, was Sie brauchen. Sie können fundiertere Entscheidungen treffen und dabei wirklich jeden Datensatz einbeziehen.
Hier sind einige der wichtigsten Vorteile und Features von Cassandra:
Open-Source: Die große Mehrheit der heutigen Softwareentwicklungsunternehmen hat sich für die Einführung von Open-Source-Technologien entschieden, angefangen beim Linux-Betriebssystem bis hin zur Infrastruktur für die Verwaltung von Daten. Open-Source-Technologien sind nicht nur aufgrund ihrer Erschwinglichkeit und Erweiterbarkeit attraktiv, sie bieten auch Flexibilität, da eine einseitige Bindung an bestimmte Anbieter vermieden wird. Unternehmen, die auf Open-Source setzen, profitieren laut eigener Aussage von einer höheren Innovationsgeschwindigkeit und einer schnelleren Einführung.
Flexible, vertraute Oberfläche: Cassandra Query Language (CQL) ähnelt SQL. Es sollte den meisten Entwicklern also ziemlich leicht fallen, sich damit vertraut zu machen. Erfahren Sie unten mehr über CQL.
Hohe Performance: Die meisten traditionellen Datenbanken weisen eine primäre/sekundäre Architektur auf. In diesen Konfigurationen führt ein einzelnes primäres Replikat Lese- und Schreibvorgänge durch, während sekundäre Replikate nur Lesevorgänge durchführen können. Zu den Nachteilen dieser Architektur gehören eine erhöhte Latenz, höhere Kosten und eine geringere Verfügbarkeit bei großen Datenmengen. Bei Cassandra ist kein einzelner Knoten für die Replikation von Daten über einen Cluster hinweg verantwortlich. Stattdessen ist jeder Knoten in der Lage, alle Lese- und Schreibvorgänge durchzuführen. Dies verbessert die Performance und verleiht der Datenbank eine höhere Resilienz.
Active Everywhere ohne Ausfallzeiten: Da jeder Cassandra-Knoten Lese- und Schreibvorgänge durchführen kann, werden Daten schnell über Hybrid-Cloud-Umgebungen und -Regionen hinweg repliziert. Wenn ein Knoten ausfällt, werden Benutzer automatisch zum nächsten funktionierenden Knoten umgeleitet. Sie werden nicht einmal bemerken, dass ein Knoten offline gegangen ist, da sich Anwendungen auch bei einem Ausfall wie vorgesehen verhalten. Dadurch sind Anwendungen immer verfügbar und die Daten sind immer zugänglich und gehen nie verloren. Darüber hinaus werden Probleme sofort, wenn sie auftreten, durch die integrierten Reparaturfunktionen von Cassandra behoben – ohne dass Sie einen Finger rühren müssen. Die Produktivität wird durch den Ausfall eines Knotens also in keiner Weise beeinträchtigt.
Skalierbarkeit: In traditionellen Umgebungen ist die Skalierung von Anwendungen ein zeitaufwändiger und kostspieliger Prozess, der normalerweise durch vertikale Skalierung mit teureren Maschinen umgesetzt wird. Bei Cassandra können Sie horizontal skalieren, indem Sie einfach weitere Knoten zum Cluster hinzufügen. Wenn beispielsweise vier Knoten 200.000 Transaktionen/Sekunde verarbeiten können, können acht Knoten 400.000 Transaktionen/Sekunde verarbeiten.
Nahtlose Replikation: Führende Unternehmen setzen heute zunehmend auf Multi-Data-Center-, Hybrid-Cloud- und sogar Multi-Cloud-Bereitstellungen, um größtmögliche Vorteile zu erzielen, ohne sich an das Ökosystem eines bestimmten Anbieters zu binden. Voraussetzung für die optimale Nutzung von Multi-Cloud-Umgebungen ist jedoch eine zugrunde liegende Cloud-Datenbank, die Skalierbarkeit, Sicherheit, Performance und Verfügbarkeit bietet. Daher ist es wenig überraschend, dass der Markt für Cloud-Datenbanken voraussichtlich jährlich um fast 65 Prozent wachsen und bis 2022 68,9 Milliarden US-Dollar erreichen wird.
Cassandra Query Language (CQL) verstehen
Wie geht es mit Apache Cassandra weiter?
Bei DataStax arbeiten wir intensiv mit der Open-Source-Community zusammen. Dabei bauen wir auf der mehr als zehnjährigen Entwicklung von Cassandra auf, um ihre Position als führende Datenbank für cloudnative Anwendungen zu festigen.
Cassandra gilt seit jeher als extrem leistungsstarke Datenbank, die sich für die anspruchsvollsten Szenarien eignet, aber auch schwierig zu erlernen und zu bedienen ist. DataStax setzt auf die Zusammenarbeit mit der Cassandra-Community, um im Sinne der Anforderungen unserer Kunden die Einführung, Anwendung und Erweiterung zu vereinfachen.
Dabei evaluieren wir u. a. die folgenden Ideen:
- Bereitstellung vereinfachter Entwickler-APIs, einschließlich REST und GraphQL
- Erweiterung von CQL um weitere SQL-ähnliche Funktionen, einschließlich Indizierung, Verknüpfungen und ACID sowie vollständiger JSON-Unterstützung
- Standardisierte Management-APIs und ein offizieller, projektgestützter Kubernetes-Operator
- Plugin-fähige Speicherengine (zusammen mit anderen APIs), um die Anpassung der Datenbank für verschiedene Bereitstellungen und Nutzungsprofile zu ermöglichen
Wie kann ich einsteigen?
Wenn Sie mehr über Apache Cassandra erfahren möchten, gibt es hier verschiedene Ressourcen, die Ihnen den Einstieg erleichtern.
DataStax Astra DB testen
Erstellen Sie schnell cloudnative Anwendungen mit DataStax Astra DB, einer Database-as-a-Service-Lösung auf Basis von Apache Cassandra.
Whitepaper zu Apache Cassandra 4.0
Laden Sie das Whitepaper kostenlos herunter und erfahren Sie, wie Sie von der Leistungsstärke und Zuverlässigkeit von Cassandra 4.0 profitieren können