Cassandra: A Distributed Database With No Single Point of Failure

Cassandra is a distributed database with no single point of failure. It favors availability over consistency, allowing queries to specify consistency levels. Cassandra has no master node; every node runs the same software and performs the same functions. It uses a non-relational data model similar to BigTable and HBase, with a limited CQL query language. Cassandra is well-suited for fast access to rows of information and integrating with Spark for analytics on replicated data.

Uploaded by

Bora Yüret

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

100% found this document useful (1 vote)

85 views9 pages

Cassandra: A Distributed Database With No Single Point of Failure

Uploaded by

Bora Yüret

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

CASSANDRA

A distributed database with no single point of

failure
Cassandra – NoSQL with a twist

■ Unlike HBase, there is no master node at all – every node runs exactly the
same software and performs the same functions
■ Data model is similar to BigTable / Hbase
■ It’s non-relational, but has a limited CQL query language as its interface
Cassandra’s Design Choices

■ The CAP Theorem says you can only have 2 out of 3: consistency, availability,
partition-tolerance
– And partition-tolerance is a requirement with “big data,” so you really
only get to choose between consistency and availability
■ Cassandra favors availability over consistency
– It is “eventually consistent”
– But you can specify your consistency requirements as part of your
requests. So really it’s “tunable consistency”
Where Cassandra Fits in CAP
tradeoffs
Availability

Consistency Partition-Tolerance
Cassandra architecture
Node

Node Node

Node
Node

Node
Cassandra and your cluster

■ Cassandra’s great for fast access to rows of information

■ Get the best of both worlds – replicate Cassandra to a another ring that is used
for analytics and Spark integration

Node Node

Node Node Node Node

Node Node
CQL (Wait, I thought this was
NoSQL!)
■ Cassandra’s API is CQL, which makes it easy to look like existing database
drivers to applications.
■ CQL is like SQL, but with some big limitations!
– NO JOINS
■ Your data must be de-normalized
■ So, it’s still non-relational
– All queries must be on some primary key
■ Secondary indices are supported, but…
■ CQLSH can be used on the command line to create tables, etc.
■ All tables must be in a keyspace – keyspaces are like databases
Cassandra and Spark

■ DataStax offers a Spark-Cassandra connector

■ Allows you to read and write Cassandra tables as DataFrames
■ Is smart about passing queries on those DataFrames down to the appropriate
level
■ Use cases:
– Use Spark for analytics on data stored in Cassandra
– Use Spark to transform data and store it into Cassandra for transactional
use
Let’s Play

■ Install Cassandra on our virtual Hadoop node

■ Set up a table for MovieLens users
■ Write into that table and query it from Spark!

DataStax Ebook The 5 Main Benefits of Apache Cassandra PDF
100% (1)
DataStax Ebook The 5 Main Benefits of Apache Cassandra PDF
12 pages
Presentation Cassandra Datastax
100% (1)
Presentation Cassandra Datastax
151 pages
Real Time Analytics With Apache Kafka and Spark: Rahul Jain
100% (1)
Real Time Analytics With Apache Kafka and Spark: Rahul Jain
54 pages
Python OOP for Beginners
No ratings yet
Python OOP for Beginners
36 pages
Databricks Features
100% (1)
Databricks Features
2 pages
Kafka Streams for Data Engineers
100% (1)
Kafka Streams for Data Engineers
93 pages
Complex Analysis: Balram Dubey
No ratings yet
Complex Analysis: Balram Dubey
57 pages
Data Lake Bootcamp: Building Reliable Data Lakes
100% (1)
Data Lake Bootcamp: Building Reliable Data Lakes
29 pages
OS Book Basic To Advance
100% (1)
OS Book Basic To Advance
141 pages
Hive and Presto For Big Data
100% (1)
Hive and Presto For Big Data
31 pages
Kafka Core Concepts Guide
100% (1)
Kafka Core Concepts Guide
76 pages
IBM Cloud Object Storage Solutions
100% (1)
IBM Cloud Object Storage Solutions
42 pages
Vector-04 - Exercise
100% (1)
Vector-04 - Exercise
28 pages
Business Data Fabric Guide
No ratings yet
Business Data Fabric Guide
14 pages
25 Basic Linux Commands For Beginners
100% (1)
25 Basic Linux Commands For Beginners
2 pages
Deepanshu Machine Learning
100% (1)
Deepanshu Machine Learning
108 pages
Eb Attunity Streaming Change Data Capture en
100% (1)
Eb Attunity Streaming Change Data Capture en
60 pages
Constrained Motion of Particles
No ratings yet
Constrained Motion of Particles
8 pages
Bring Data Lakes and Data Warehouses Together
100% (1)
Bring Data Lakes and Data Warehouses Together
19 pages
Benchmarking Warehouse Workloads On The Data Lake Using Presto
100% (1)
Benchmarking Warehouse Workloads On The Data Lake Using Presto
13 pages
Google Cloud Analytics Lakehouse
No ratings yet
Google Cloud Analytics Lakehouse
47 pages
Add Maths Quadratics
No ratings yet
Add Maths Quadratics
11 pages
Getting Started With Hazelcast - Second Edition - Sample Chapter
50% (2)
Getting Started With Hazelcast - Second Edition - Sample Chapter
14 pages
Accelerating Data Modernization With Azure
No ratings yet
Accelerating Data Modernization With Azure
7 pages
Top 10 Machine Learning Algorithms
No ratings yet
Top 10 Machine Learning Algorithms
12 pages
Optimize LLM Output: Top 7 Parameters
100% (1)
Optimize LLM Output: Top 7 Parameters
9 pages
IIT-JEE Maths: Functions Guide
100% (1)
IIT-JEE Maths: Functions Guide
54 pages
Applied Ai Enterprise Java ER Red Hat Developer
100% (1)
Applied Ai Enterprise Java ER Red Hat Developer
64 pages
Netapp Ontap Select On Ibm Solution Architecture: Cloud
No ratings yet
Netapp Ontap Select On Ibm Solution Architecture: Cloud
12 pages
Nasdaq Data Link Data Fabric
100% (1)
Nasdaq Data Link Data Fabric
12 pages
Model Selection Strategies
No ratings yet
Model Selection Strategies
20 pages
Unleashing The Power of AI - Whitepaper 2024
No ratings yet
Unleashing The Power of AI - Whitepaper 2024
27 pages
Data-Level Parallelism in Vector, SIMD, And: GPU Architectures
100% (1)
Data-Level Parallelism in Vector, SIMD, And: GPU Architectures
29 pages
Number Play Class 6
100% (2)
Number Play Class 6
20 pages
Plane Curvilinear Motion:: Displacement
100% (1)
Plane Curvilinear Motion:: Displacement
18 pages
Use Delta Lake in Azure Synapse Analytics
No ratings yet
Use Delta Lake in Azure Synapse Analytics
37 pages
Turbonomic User Guide 8.5.0
100% (1)
Turbonomic User Guide 8.5.0
452 pages
Painless Docker
100% (1)
Painless Docker
317 pages
Alteryx + Snowflake Retail Solutions
100% (1)
Alteryx + Snowflake Retail Solutions
19 pages
Lame - Linux Administration For Beginners
100% (5)
Lame - Linux Administration For Beginners
85 pages
Integral Calculus
100% (1)
Integral Calculus
70 pages
Fabric Fundamentals
50% (2)
Fabric Fundamentals
759 pages
Linux Crash Course For Beginners - Kodecloud
0% (1)
Linux Crash Course For Beginners - Kodecloud
270 pages
Informatica B2B Data Transformation 9.1 DS
No ratings yet
Informatica B2B Data Transformation 9.1 DS
3 pages
Build Run and Manage Kubernetes: in SDDC or Cloud
100% (1)
Build Run and Manage Kubernetes: in SDDC or Cloud
37 pages
Body Systems Interactions Chart
100% (1)
Body Systems Interactions Chart
11 pages
Class 12th Maths Chapter 1 (Relations and Functions) Unsolved PDF
No ratings yet
Class 12th Maths Chapter 1 (Relations and Functions) Unsolved PDF
7 pages
Lenovo Reference Architecture For OpenShift - 2024-03-27
No ratings yet
Lenovo Reference Architecture For OpenShift - 2024-03-27
78 pages
Trigonometry Practice for Students
100% (1)
Trigonometry Practice for Students
10 pages
Cassandra
No ratings yet
Cassandra
10 pages
Cassandra PPT Final
No ratings yet
Cassandra PPT Final
23 pages
Apache Cassandra Database - Instaclustr
No ratings yet
Apache Cassandra Database - Instaclustr
8 pages
Module 4
No ratings yet
Module 4
22 pages
Intro To NoSQL
No ratings yet
Intro To NoSQL
18 pages
Apache Cassandra: by Chethan Gowda
No ratings yet
Apache Cassandra: by Chethan Gowda
12 pages
Cassandra Article Review
No ratings yet
Cassandra Article Review
10 pages
Cassandra Presentation Final
100% (3)
Cassandra Presentation Final
71 pages
Apache Cassandra
No ratings yet
Apache Cassandra
7 pages
Learn Cassandra
100% (2)
Learn Cassandra
37 pages
Cassandra
No ratings yet
Cassandra
7 pages
Mongodb Tutorial
100% (4)
Mongodb Tutorial
101 pages
Most One-Star Movies
No ratings yet
Most One-Star Movies
1 page
Introduction To Kubernetes
No ratings yet
Introduction To Kubernetes
182 pages
Zeppelin: A Notebook Interface To Your Big Data
No ratings yet
Zeppelin: A Notebook Interface To Your Big Data
5 pages
Section3-17 UsingPigAndUsingScripts
No ratings yet
Section3-17 UsingPigAndUsingScripts
1 page
Apache Drill: SQL For Nosql
No ratings yet
Apache Drill: SQL For Nosql
7 pages
Oozie: Hadoop Job Orchestration
No ratings yet
Oozie: Hadoop Job Orchestration
10 pages
Apache Pig
No ratings yet
Apache Pig
23 pages
Hadoop User Experience
No ratings yet
Hadoop User Experience
5 pages
Mesos: Beyond Hadoop Resource Management
No ratings yet
Mesos: Beyond Hadoop Resource Management
7 pages
Hbase
No ratings yet
Hbase
15 pages
Flink: Another Data Stream Framework!
No ratings yet
Flink: Another Data Stream Framework!
7 pages
Linux Magazine USAIssue 243 February 2021
No ratings yet
Linux Magazine USAIssue 243 February 2021
102 pages
Energy & Environment Projects
No ratings yet
Energy & Environment Projects
5 pages
Detailed Syllabus For Agniveer All Exams by Ubotz Learning Hub
No ratings yet
Detailed Syllabus For Agniveer All Exams by Ubotz Learning Hub
19 pages
Community-Based Data Integration of Course and Job Data in Support of Personalized Career-Education Recommendations
No ratings yet
Community-Based Data Integration of Course and Job Data in Support of Personalized Career-Education Recommendations
6 pages
5 Parallel and Distributed Computing
No ratings yet
5 Parallel and Distributed Computing
9 pages
Write-Off Article
No ratings yet
Write-Off Article
4 pages
Time Table Summer 2024 SMME V1.1
No ratings yet
Time Table Summer 2024 SMME V1.1
1 page
GHM STM40-00-E Manual
No ratings yet
GHM STM40-00-E Manual
2 pages
EC5 10 20 User Manual
No ratings yet
EC5 10 20 User Manual
27 pages
MTU Mining Brochure 3061641 1505796036
No ratings yet
MTU Mining Brochure 3061641 1505796036
29 pages
Configure JVCA (Joint Venture Consortium Association)
No ratings yet
Configure JVCA (Joint Venture Consortium Association)
1 page
Python Machine Learning in 7 Days
No ratings yet
Python Machine Learning in 7 Days
10 pages
Fault and Alarm Troubleshooting Guide
No ratings yet
Fault and Alarm Troubleshooting Guide
10 pages
Salt Spray Cabinet BGD 800S
No ratings yet
Salt Spray Cabinet BGD 800S
5 pages
FB-7000 Series Catalog (2013)
No ratings yet
FB-7000 Series Catalog (2013)
4 pages
Price List 1st Feb 2024 New
No ratings yet
Price List 1st Feb 2024 New
2 pages
UNFPA Video Post-Production Handbook
No ratings yet
UNFPA Video Post-Production Handbook
36 pages
Laserfiche - CDI Microsoft Dynamics CRM
No ratings yet
Laserfiche - CDI Microsoft Dynamics CRM
1 page
Assignment
No ratings yet
Assignment
6 pages
The Ethical Implications of Artificial Intelligence Essay
No ratings yet
The Ethical Implications of Artificial Intelligence Essay
5 pages
B.Tech, M.Tech, MCA Students CGPA List
No ratings yet
B.Tech, M.Tech, MCA Students CGPA List
17 pages
Cisco Certified CyberOps Professional Certification Program
No ratings yet
Cisco Certified CyberOps Professional Certification Program
3 pages
Diplomat Flyer A4
No ratings yet
Diplomat Flyer A4
1 page
Allwave ZWP Fiber: (Zero Water Peak)
No ratings yet
Allwave ZWP Fiber: (Zero Water Peak)
2 pages
Mental Health
No ratings yet
Mental Health
2 pages
S12 Water Flushing Circuit
No ratings yet
S12 Water Flushing Circuit
24 pages
Accounts 31.10.2020 11-30
No ratings yet
Accounts 31.10.2020 11-30
5 pages
Boq Say-001
No ratings yet
Boq Say-001
12 pages
Maths Assignment Unit 2
No ratings yet
Maths Assignment Unit 2
3 pages
PS 710 Power Survey PFC Catalog
No ratings yet
PS 710 Power Survey PFC Catalog
12 pages
Winter 24 Key Points
No ratings yet
Winter 24 Key Points
56 pages

Cassandra: A Distributed Database With No Single Point of Failure

Uploaded by

Cassandra: A Distributed Database With No Single Point of Failure

Uploaded by

CASSANDRA

A distributed database with no single point of

■ Cassandra’s great for fast access to rows of information

Node Node Node Node

Node Node Node Node

■ DataStax offers a Spark-Cassandra connector

■ Install Cassandra on our virtual Hadoop node

You might also like