Apache Cassandra란?

Apache Cassandra®는 상시 가용성, 눈부시게 빠른 읽기-쓰기 성능, 최신 애플리케이션이 요구하는 무제한적 선형 확장성을 제공하는 유일한 분산형 NoSQL 데이터베이스입니다.

Astra 계정 만들기
Apache Cassandra 로고

Cassandra 4.0이 출시되었습니다! 가장 빠르고 믿을 수 있으며 간편하게 사용할 수 있는 최신 버전의 오픈 소스 Cassandra에 대해 자세히 알아보세요.

더 알아보기

오픈 소스 Cassandra를 마음 편하게 사용하고 싶으신가요? Apache Cassandra에 대한 엔터프라이즈급 지원 서비스인 DataStax Luna에 대해 알아보세요.

더 알아보기

Apache Cassandra에 대하여

Apache Cassandra는 Facebook이 만든 분산형 NoSQL 데이터베이스로서 2008년 7월에 오픈 소스 프로젝트로 릴리스 되었습니다.

Cassandra는 지속적 가용성(다운타임 없음)과 뛰어난 성능을 비롯해 최신 애플리케이션에 필요한 선형적 확장성을 제공하면서도 운영이 간편하며, 여러 데이터 센터 및 지역으로 간편하게 데이터를 복제할 수 있습니다. 조직에서는 초당 페타바이트 단위의 정보 및 수천 건의 동시 오퍼레이션을 처리할 수 있는 Cassandra를 통해 하이브리드 및 멀티 클라우드 환경에서 대규모의 데이터를 관리할 수 있습니다.

Apache Cassandra와 기존 관계형 데이터베이스

Cassandra는 기존의 관계형 데이터베이스와는 다음과 같은 차이점이 있습니다.

Apache Cassandra관계형 데이터베이스
높은 수신 데이터 속도 처리 가능적당한 수준의 수신 데이터 속도 처리 가능
단순 트랜잭션 지원복잡하고 중첩된 트랜잭션 지원
단일 실패 지점 없음, 꾸준한 업타임장애 극복 기능을 갖춘 단일 실패 지점 존재
대량의 데이터 지원적당한 양의 데이터 지원
분산식 배포중앙집중식 배포
다양한 위치에서 데이터를 씀대부분 하나의 위치에서 데이터를 씀
읽기 및 쓰기 확장성 지원일관성을 희생하여 읽기 확장성 지원
수평 확장 방식으로 배포수직 확장 방식으로 배포

Cassandra 및 기타 NoSQL 데이터베이스와 관계형 데이터베이스와의 차이점을 자세히 알고 싶다면 NoSQL에 대한 입문 자료를 확인해 보세요.

Apache Cassandra의 역사

Apache Cassandra의 핵심 특성과 장점

서버 로그, 이메일, 소셜 미디어 게시물, PDF 그 무엇이든 Cassandra는 처리할 수 있습니다. 따라서 모든 데이터를 남김없이 활용하여 더욱 올바른 의사결정을 내릴 수 있게 됩니다.

Cassandra의 주요 장점과 기능은 다음과 같습니다.


오픈 소스

오픈 소스: 오늘날의 소프트웨어 개발 조직들은 Linux 운영 체제부터 시작하여 데이터 관리용 인프라로 옮겨가면서 오픈 소스 기술을 대거 채택하고 있습니다. 오픈 소스 기술의 매력은 적은 비용 부담, 우수한 확장성, 벤더 종속을 배제할 수 있는 유연함입니다. 오픈 소스 기술을 도입하는 조직은 혁신이 가속화되었으며 채택 속도가 빨라졌다고 입을 모읍니다.

유연하고 익숙한 인터페이스: Cassandra 쿼리 언어(CQL)는 SQL과 유사합니다. 따라서 대부분의 개발자가 CQL에 금방 익숙해질 수 있습니다. 아래에서 CQL에 대해 자세히 알아보세요.

뛰어난 성능

뛰어난 성능: 대다수의 기존 데이터베이스는 주/보조 아키텍처를 활용합니다. 이러한 구성에서는 하나의 주 레플리카가 읽기와 쓰기 오퍼레이션을 수행하며, 보조 레플리카는 읽기 오퍼레이션만을 수행할 수 있습니다. 이 아키텍처의 단점은 지연이 다소 길며 비용이 많이 들고 대규모에서 가용성이 떨어진다는 점입니다. Cassandra를 사용한다면 클러스터에서 단일 노드가 데이터 복제를 맡는 일은 없어집니다. 대신 모든 노드가 모든 읽기 및 쓰기 오퍼레이션을 수행할 수 있게 됩니다. 이는 성능을 향상하며 데이터베이스의 탄력성을 높여줍니다.


다운타임 없음

어디서든 다운타임 없이 활용 가능: 모든 Cassandra 노드가 읽기 및 쓰기 오퍼레이션을 수행할 수 있으므로 데이터가 여러 하이브리드 클라우드 환경과 지역으로 신속하게 복제될 수 있습니다. 만약 노드 하나에 장애가 발생하면 사용자는 인근의 정상적 노드로 자동 라우팅 됩니다. 덕분에 장애가 발생해도 애플리케이션은 정상적으로 작동할 것이며 노드 하나가 오프라인이 되었다는 것도 전혀 체감되지 않을 것입니다. 따라서 애플리케이션을 항상 사용할 수 있으며, 데이터는 언제나 액세스가 가능하며 절대 손실되지 않습니다. 게다가 문제가 발생하면 사용자가 개입할 필요 없이 Cassandra의 내장 수리 서비스가 이를 즉각 해결합니다. 노드 장애가 발생하더라도 생산성이 훼손되지 않는 것입니다.


확장성

확장성: 예전의 환경에서는 애플리케이션을 확장하려면 일반적으로 값비싼 장비를 들여 수직 확장을 해야 했는데, 이는 지난하고도 큰 비용이 드는 과정입니다. 하지만 Cassandra에서는 클러스터에 노드를 추가하여 간단하게 수평적 확장을 할 수 있습니다. 예를 들어 4개의 노드가 초당 20만 건의 트랜잭션을 처리할 수 있다면 8개의 노드로 확장해 초당 40만 건의 트랜잭션을 처리할 수 있는 것입니다.

원활한 복제

원활한 복제: 현재 선두 기업들은 점차 멀티 데이터 센터와 하이브리드 클라우드를 도입하고 있으며, 심지어 멀티 클라우드 배포를 통해 단일 공급자의 에코시스템에 종속되지 않으면서 각각의 장점을 취사선택해 활용하고 있습니다. 하지만 멀티 클라우드 환경을 최대한 활용하려면 먼저 확장성, 보안, 성능, 가용성을 제공하는 클라우드 데이터베이스가 바탕에 필요합니다. 그런 만큼 클라우드 데이터베이스 시장 규모가 매년 거의 65%씩 성장하여 2022년에는 689억 달러에 이를 것으로 예상된다는 전망은 그리 놀랍지 않은 소식일 것입니다.


Cassandra의 쿼리 언어(CQL) 이해하기

Apache Cassandra

Apache Cassandra의 미래는?

저희 DataStax는 10년 이상의 시간 동안 무르익어온 Cassandra가 클라우드 네이티브 애플리케이션용 데이터베이스의 선두 주자 자리를 더욱 공고하게 다질 수 있도록 오픈 소스 커뮤니티와 함께 최선을 다하고 있습니다.

Cassandra는 극히 까다로운 사용 사례들도 처리할 수 있는 강력한 데이터베이스로서 오래전부터 인정을 받아왔지만, 학습 및 운영이 어렵다는 의견도 많았습니다. DataStax는 간편하게 사용하고 채택할 수 있으며 여러분의 요구를 충족시킬 수 있는 Cassandra를 만들기 위해 커뮤니티와 함께 최선을 다할 것입니다.

저희가 현재 모색 중인 아이디어는 다음과 같습니다.

  • REST, GraphQL 등의 개발자 API 단순화하기
  • 완전한 JSON 지원 외에도 인덱스, 조인, ACID와 같이 SQL과 유사한 기능을 CQL에 더 추가하기
  • 표준 관리 API와 프로젝트가 지원하는 공식 Kubernetes 오퍼레이터
  • 다양한 배포 및 사용 프로필을 위해 데이터베이스를 맞춤 설정할 수 있도록 저장소 엔진을 다른 API와 함께 플러그 방식으로 만들기

어떻게 시작하면 될까요?

Apache Cassandra에 대해 자세히 알고 싶은 경우 확인하면 좋을 자료가 몇 가지 준비되어 있습니다.

개발자를 위한 DataStax

개발자를 위한 DataStax

Apache Cassandra™로 성공적 성과를 거두는 법을 익히세요.

지금 방문하기
DataStax Astra DB

DataStax Astra DB 사용해보기

Apache Cassandra로 구축된 서비스형 데이터베이스인 DataStax Astra DB로 신속하게 클라우드 네이티브 애플리케이션을 구축하세요.

무료 이용 신청
Apache Cassandra 4.0 백서

Apache Cassandra 4.0 백서

Cassandra 4.0의 뛰어난 성능과 신뢰성을 활용하도록 도와주는 백서를 디지털로 무료 다운로드 받으세요.

백서 다운로드