ক্যাসান্দ্রা (Cassandra)

425

Apache Cassandra হলো একটি ওপেন-সোর্স, ডিস্ট্রিবিউটেড NoSQL ডাটাবেস ম্যানেজমেন্ট সিস্টেম, যা বিশেষভাবে বড় আকারের ডেটা স্টোরেজ এবং হাই-অ্যাভেইলেবিলিটি নিশ্চিত করার জন্য ডিজাইন করা হয়েছে। এটি মূলত Facebook এ তৈরি হয়েছিল এবং পরে Apache Software Foundation এর অধীনে রিলিজ করা হয়েছে। Cassandra অত্যন্ত স্কেলেবল এবং ডিস্ট্রিবিউটেড আর্কিটেকচার ব্যবহার করে, যা বড় ডেটা সেটগুলিকে বিভিন্ন সার্ভারে ছড়িয়ে স্টোর করতে এবং দ্রুত অ্যাক্সেস করতে সাহায্য করে।

Apache Cassandra: একটি বিস্তারিত বাংলা টিউটোরিয়াল

ভূমিকা

Apache Cassandra একটি ওপেন-সোর্স, ডিস্ট্রিবিউটেড NoSQL ডেটাবেস ম্যানেজমেন্ট সিস্টেম, যা বড় আকারের ডেটা সংরক্ষণ এবং উচ্চতর স্কেলেবিলিটি ও অভ্যন্তরীণ স্থায়িত্ব নিশ্চিত করে। এটি বিগ ডেটা এবং রিয়েল-টাইম ডেটা প্রসেসিং এর জন্য ব্যবহৃত হয় এবং মূলত CAP theorem অনুসারে Availability এবং Partition Tolerance এর মধ্যে ভারসাম্য বজায় রাখে।

Cassandra মূলত Facebook এ তৈরি হয়েছিল, তবে এখন এটি বিভিন্ন বড় প্রতিষ্ঠান যেমন Netflix, Twitter, এবং Instagram এ ব্যবহার করা হয়। এটি এমন ডেটাবেস আর্কিটেকচারে তৈরি হয়েছে, যেখানে Single Point of Failure (SPOF) নেই, এবং এটি বড় আকারের ডেটাবেস ম্যানেজমেন্ট এবং দ্রুত write-heavy অপারেশন পরিচালনা করতে পারে।

Apache Cassandra এর বৈশিষ্ট্যসমূহ

ডিস্ট্রিবিউটেড আর্কিটেকচার: Cassandra একটি সম্পূর্ণরূপে ডিস্ট্রিবিউটেড ডেটাবেস, যেখানে ডেটা বিভিন্ন নোডে সমানভাবে বিতরণ করা হয়।
Scalability: Cassandra সহজে horizontal scalability সমর্থন করে, অর্থাৎ প্রয়োজনমতো নতুন নোড যোগ করে ক্লাস্টারের ক্ষমতা বাড়ানো যায়।
High Availability: এটি সর্বদা ডেটা অ্যাক্সেসযোগ্য রাখে, এমনকি কোনো নোড ব্যর্থ হলেও ডেটা লস হয় না।
Partition Tolerance: Cassandra ক্লাস্টার বিভাজনের সময়ও ডেটার সঠিকতা এবং স্থায়িত্ব বজায় রাখে।
Schema-less: এটি স্কিমালেস ডাটাবেস হওয়ায়, ডেটার ফর্ম্যাট পরিবর্তন করা বা নতুন ফিল্ড যোগ করা সহজ।
Data Replication: Cassandra প্রতিটি ডেটার কপি বিভিন্ন নোডে সংরক্ষণ করে, যা ডেটা রেডান্ডেন্সি এবং ফল্ট টলারেন্স নিশ্চিত করে।
Tunable Consistency: ব্যবহারকারীরা Consistency Level নির্ধারণ করতে পারে, যাতে রিড এবং রাইট অপারেশনের সময় কোন নোডগুলির সাথে সমন্বয় হবে তা নির্ধারণ করা যায়।
Write Optimization: Cassandra খুবই দ্রুত write-heavy অপারেশন পরিচালনা করতে সক্ষম, কারণ এটি প্রতিটি লেখা নোডের মেমোরিতে সংরক্ষণ করে।
Decentralized: Cassandra এর কোনো মাস্টার নোড নেই, প্রতিটি নোড সমান ক্ষমতা রাখে, যা এটিকে দ্রুত ও নির্ভরযোগ্য করে তোলে।

Apache Cassandra এর আর্কিটেকচার

Cassandra এর আর্কিটেকচার Peer-to-Peer ভিত্তিক, যেখানে প্রতিটি নোড সমান ক্ষমতার অধিকারী এবং Master-Slave সম্পর্ক নেই। এর ফলে Single Point of Failure (SPOF) এর সমস্যা নেই। নিচে Cassandra এর আর্কিটেকচারের মূল উপাদানগুলো নিয়ে আলোচনা করা হলো:

১. Cluster

Cassandra ক্লাস্টার হল একাধিক নোডের সমন্বয়, যেখানে ডেটা সংরক্ষণ এবং প্রক্রিয়াজাত করা হয়। একটি ক্লাস্টার বিভিন্ন ডাটা সেন্টারে বিভক্ত হতে পারে এবং ক্লাস্টারের প্রতিটি নোড সমানভাবে ডেটা স্টোর এবং প্রোসেস করতে সক্ষম।

২. Node

Node হল Cassandra-তে ডেটা সংরক্ষণের একক ইউনিট, যেখানে ডেটার একটি অংশ রাখা হয়। প্রতিটি নোড একে অপরের সাথে যোগাযোগ করতে সক্ষম এবং ডেটার একটি কপি বা অংশ সংরক্ষণ করে। যখন একটি নোডে ডেটা লেখা বা পড়া হয়, তখন সেই ডেটা বিভিন্ন নোডে ছড়িয়ে পড়ে।

৩. Keyspace

Keyspace হল একটি লজিক্যাল ডেটাবেস, যেখানে এক বা একাধিক টেবিল থাকে। Keyspace টেবিলের স্টোরেজ এবং Replication এর কনফিগারেশন সংরক্ষণ করে। এটি মূলত ডেটাবেসের মতো কাজ করে।

৪. Table

Cassandra-তে Table হল যেখানে ডেটা রো এবং কলামের আকারে সংরক্ষণ করা হয়। এটি RDBMS এর মতো টেবিল, তবে এখানে স্কিমালেস ফিচার রয়েছে, যা ডেটার ফিল্ডগুলো নমনীয় করে তোলে।

৫. Partition

Cassandra ডেটাকে বিভিন্ন Partition আকারে বিভক্ত করে। প্রতিটি Partition একটি নির্দিষ্ট নোডে সংরক্ষণ করা হয়। Partition এর মাধ্যমে Cassandra বড় ডেটাসেটকে ছোট ছোট অংশে ভাগ করে এবং ডেটা দ্রুত রিড এবং রাইট করতে সক্ষম হয়।

৬. Replication

Cassandra তে ডেটার Replication ব্যবস্থাপনা খুবই গুরুত্বপূর্ণ। Replication Factor দ্বারা নির্ধারিত হয় যে ডেটার কতটি কপি তৈরি হবে এবং সেগুলো কত নোডে বিতরণ হবে।

৭. Consistency Level

Cassandra তে Consistency Level নির্ধারণ করা যায়, যার মাধ্যমে নির্ধারণ করা হয় একটি রিড বা রাইট অপারেশনে কতটি নোড থেকে সঠিক ফলাফল আশা করা হচ্ছে। এটি Eventual Consistency এবং Strong Consistency এর মধ্যে ভারসাম্য তৈরি করতে সাহায্য করে।

Apache Cassandra ইনস্টলেশন এবং সেটআপ

Cassandra ব্যবহার করতে হলে প্রথমে এটি আপনার সিস্টেমে ইনস্টল করতে হবে। নিচে Ubuntu সিস্টেমে Cassandra ইনস্টল করার ধাপগুলো দেওয়া হলো:

ধাপ ১: Java ইনস্টল করা

Cassandra চালানোর জন্য Java প্রয়োজন। যদি Java ইন্সটল না থাকে, তাহলে নিচের কমান্ড দিয়ে Java ইন্সটল করুন:

sudo apt update
sudo apt install openjdk-11-jdk

ধাপ ২: Apache Cassandra ডাউনলোড করা

Cassandra ডাউনলোড এবং ইনস্টল করতে নিম্নলিখিত ধাপগুলো অনুসরণ করুন:

echo "deb http://www.apache.org/dist/cassandra/debian 311x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list

তারপর Cassandra এর GPG key যোগ করুন:

curl https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -

Cassandra ইনস্টল করতে:

sudo apt update
sudo apt install cassandra

ধাপ ৩: Cassandra সার্ভার চালানো

Cassandra সার্ভার চালাতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:

sudo systemctl start cassandra

Cassandra সার্ভার চালু হয়েছে কিনা তা যাচাই করতে:

nodetool status

ধাপ ৪: Cassandra Shell (cqlsh) এ প্রবেশ করা

Cassandra এর CQL (Cassandra Query Language) শিখতে এবং ব্যবহার করতে, cqlsh ব্যবহার করা হয়। CQL চালাতে:

cqlsh

এখন আপনি Cassandra তে SQL-এর মতো কুয়েরি লিখে ডেটা ম্যানেজ করতে পারবেন।

Cassandra এর মৌলিক CQL কুয়েরি

Cassandra-তে SQL এর মতো Cassandra Query Language (CQL) ব্যবহার করা হয়। নিচে কিছু মৌলিক CQL কুয়েরি দেখানো হলো:

১. Keyspace তৈরি করা

Keyspace তৈরি করতে নিচের কুয়েরি ব্যবহার করা হয়:

CREATE KEYSPACE mykeyspace WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 3};

২. Table তৈরি করা

Keyspace এর মধ্যে Table তৈরি করতে:

CREATE TABLE mykeyspace.users (
    id UUID PRIMARY KEY,
    name TEXT,
    email TEXT
);

৩. ডেটা ইনসার্ট করা

টেবিলে ডেটা ইনসার্ট করতে:

INSERT INTO mykeyspace.users (id, name, email) VALUES (uuid(), 'John Doe', 'john@example.com');

৪. ডেটা রিট্রিভ করা

ডেটা রিট্রিভ করতে:

SELECT * FROM mykeyspace.users;

৫. ডেটা আপডেট করা

টেবিলের ডেটা আপডেট করতে:

UPDATE mykeyspace.users SET email = 'john.doe@example.com' WHERE id = ;

৬. ডেটা ডিলিট করা

ডেটা ডিলিট করতে:

DELETE FROM mykeyspace.users WHERE id = ;

Apache Cassandra এর সুবিধা

High Scalability: Cassandra সহজেই বড় ডেটাবেসের জন্য স্কেল করা যায় এবং এতে কোনো Single Point of Failure (SPOF) নেই।
High Availability: এটি সর্বদা অ্যাক্সেসযোগ্য থাকে এবং নোড ব্যর্থ হলেও ডেটা লস হয় না।
Fault Tolerance: Cassandra ডেটার একাধিক রেপ্লিকা সংরক্ষণ করে, যা সিস্টেম ব্যর্থতা থেকেও ডেটা রক্ষা করে।
Flexible Schema: এটি স্কিমালেস হওয়ায় ডেটার কাঠামো পরিবর্তন করা সহজ এবং দ্রুত।
Fast Write Performance: এটি দ্রুত write-heavy অ্যাপ্লিকেশনগুলো পরিচালনা করতে পারে।

Apache Cassandra এর অসুবিধা

Complex Consistency Model: Cassandra এর Consistency Model একটু জটিল, যা নতুনদের জন্য শিখতে কিছুটা সময় লাগতে পারে।
Slow Read Operations: লেখার পারফরম্যান্স খুব দ্রুত হলেও, কিছু ক্ষেত্রে রিড অপারেশন তুলনামূলকভাবে ধীর হতে পারে।
Full Scans Not Supported: Cassandra টেবিলের সম্পূর্ণ Scan সমর্থন করে না, তাই কুয়েরি তৈরি করার সময় Primary Key এবং Partition Key এর সঠিক ব্যবহার করতে হয়।

Apache Cassandra বনাম অন্যান্য NoSQL ডাটাবেস

বৈশিষ্ট্য	Apache Cassandra	MongoDB	HBase
ডেটা মডেল	Wide Column Store	Document Store	Wide Column Store
স্কেলেবিলিটি	Horizontal Scalability	Horizontal Scalability	Horizontal Scalability
কনসিসটেন্সি	Tunable Consistency	Strong Consistency	Strong Consistency
প্রসেসিং টাইপ	রিয়েল-টাইম ডেটা প্রসেসিং	রিয়েল-টাইম এবং ব্যাচ প্রসেসিং	ব্যাচ প্রসেসিং
Replication and Failover	Multi-datacenter replication, Fault-tolerant	Replica Sets, Sharding	Master-Slave Architecture
ব্যবহার ক্ষেত্র	বড় ডেটা অ্যাপ্লিকেশন, IoT, টাইম-সিরিজ ডেটা	ডকুমেন্ট স্টোরেজ, ওয়েব অ্যাপ্লিকেশন	বড় ডেটা প্রসেসিং, Hadoop ইন্টিগ্রেশন

উপসংহার

Apache Cassandra হল একটি শক্তিশালী, স্কেলযোগ্য, এবং নির্ভরযোগ্য NoSQL ডেটাবেস, যা বড় আকারের ডেটা ম্যানেজমেন্ট এবং দ্রুত রাইট অপারেশনগুলোর জন্য আদর্শ। এর ডিস্ট্রিবিউটেড আর্কিটেকচার, ডেটা রেপ্লিকেশন, এবং পার্টিশন টলারেন্স এর মতো বৈশিষ্ট্যগুলি এটি বড় প্রতিষ্ঠান এবং রিয়েল-টাইম ডেটা প্রসেসিং এর জন্য উপযুক্ত করে তোলে।

যদিও Consistency এবং Read Performance কিছু ক্ষেত্রে একটি চ্যালেঞ্জ হতে পারে, তবে Cassandra এর high scalability এবং high availability ফিচারগুলো একে বড় আকারের ডেটাবেস ব্যবস্থাপনার জন্য একটি কার্যকরী সমাধান হিসেবে তুলে ধরে।

Cassandra এর পরিচিতি

Cassandra কী এবং কেন ব্যবহার করা হয়?

Cassandra এর ইতিহাস এবং বিকাশ

NoSQL Database এবং Cassandra এর পার্থক্য

Cassandra এর বৈশিষ্ট্য এবং সুবিধা

Cassandra Architecture এবং Components

Cassandra এর Distributed Architecture

Node, Cluster এবং Datacenter এর ধারণা

Gossip Protocol এবং Consistency Model

Partitioner, Token, এবং Data Distribution

Cassandra Installation এবং Setup

Cassandra ইনস্টলেশন (Local এবং Cluster Setup)

Cassandra Configuration Files (cassandra.yaml)

Cluster Management এবং Nodes Configuration

Cassandra Command Line Tools (cqlsh)

Data Model এবং Schema Design

Cassandra এর Data Model এর ধারণা

Keyspace এবং Table তৈরি

Primary Key এবং Clustering Key এর ধারণা

Partitioning এবং Clustering এর মাধ্যমে Data Distribution

CQL (Cassandra Query Language) এর মৌলিক ধারণা

CQL Syntax এবং Commands

Data Definition Language (DDL) এর ব্যবহার

Data Manipulation Language (DML) এর ব্যবহার

CQL এর মাধ্যমে Data Query করা (SELECT, INSERT, UPDATE, DELETE)

Cassandra এর Read এবং Write Operations

Read এবং Write Path এর ধারণা

Memtable এবং SSTable এর ব্যবহার

Read Repair এবং Hinted Handoff

Tunable Consistency এবং Quorum Read/Write

Replication এবং Consistency

Replication Factor এবং Strategy এর ধারণা

NetworkTopologyStrategy এবং SimpleStrategy

Consistency Level এর গুরুত্ব (ONE, QUORUM, ALL)

CAP Theorem এবং Cassandra এর Consistency Model

Data Compaction এবং Garbage Collection

SSTable Compaction এর ভূমিকা

Compaction Strategies (Size-Tiered, Leveled, Time-Window)

Tombstones এবং Data Deletion এর ধারণা

Garbage Collection এবং Data Cleanup

Cassandra এর জন্য Performance Tuning

Data Model Optimization Techniques

Write এবং Read Performance Tuning

JVM Tuning এবং Garbage Collection Optimization

Cache এবং Compaction Tuning

Cassandra এর জন্য Advanced Indexing Techniques

Primary Index এবং Secondary Index এর ব্যবহার

Materialized Views এবং তাদের প্রয়োগ

Index এর Performance Impact এবং Best Practices

Full-Text Search এবং External Indexing Techniques

Cassandra এর জন্য Batch Processing এবং Transactions

Batch Statements এবং তাদের ব্যবহার

Lightweight Transactions (LWT) এর ধারণা

Compare-and-Set (CAS) Operations

Batch Operations এর জন্য Best Practices

Cassandra Cluster Management এবং Monitoring

Cluster Setup এবং Node Management Techniques

Data Balancing এবং Repair Operations

Cassandra Monitoring Tools (OpsCenter, JMX, Prometheus)

Cluster Health এবং Performance Metrics

Backup এবং Recovery Techniques

Cassandra এর জন্য Snapshot Backup এবং Incremental Backup

Node এবং Cluster Recovery Techniques

Point-in-time Recovery এবং Backup Strategies

Backup Automation এবং Best Practices

Cassandra এবং Hadoop Integration

Hadoop এবং Cassandra এর মধ্যে পার্থক্য

Cassandra এবং Hadoop এর Integration Techniques

Data Loading এবং Processing এর জন্য Hadoop ব্যবহার

Cassandra এবং Hadoop Cluster Setup

Cassandra এবং Apache Spark Integration

Apache Spark এর সাথে Cassandra Integration

Spark এবং Cassandra Connector এর ব্যবহার

Real-time Data Processing এর জন্য Spark এবং Cassandra

DataFrame এবং Dataset API ব্যবহার করে Data Query করা

Cassandra এবং Apache Kafka Integration

Kafka এর সাথে Cassandra Integration

Cassandra Sink Connector এর ব্যবহার

Real-time Data Ingestion এবং Processing এর জন্য Kafka ব্যবহার

Data Streaming এবং Cassandra এর মধ্যে Interoperability

Cassandra Security এবং Authentication

Data Encryption এবং SSL/TLS ব্যবহার

Authentication এবং Authorization Techniques

Role-Based Access Control (RBAC)

Kerberos Integration এবং Data Security Best Practices

Cassandra এর জন্য Schema Design Best Practices

Denormalization এবং Query-Based Schema Design

Data Modeling এর জন্য Anti-Patterns

Partitioning এবং Clustering Keys এর জন্য Best Practices

Read এবং Write Performance এর জন্য Schema Optimization

Cassandra এবং Cloud Integration

Cloud Providers (AWS, Azure, GCP) এর জন্য Cassandra Setup

Cassandra এবং Cloud-native Databases এর মধ্যে পার্থক্য

Cloud Storage থেকে Data Load এবং Store করা

Cassandra এর জন্য Cloud-based Monitoring এবং Backup Solutions

Real-world Use Cases of Cassandra

Big Data এবং Analytics এর জন্য Cassandra

Real-time Fraud Detection Systems

Social Media এবং Recommendation Systems

IoT Data Processing এবং Sensor Data Analysis

Cassandra এর ভবিষ্যৎ এবং Community Support

Apache Cassandra এর ভবিষ্যৎ এবং নতুন Features

Cassandra এর Open Source Community এবং Collaborations

Cassandra এর জন্য Third-party Tools এবং Libraries

Community Contributions এবং Cassandra Improvements

Apache Cassandra হলো একটি ওপেন-সোর্স, ডিস্ট্রিবিউটেড NoSQL ডাটাবেস ম্যানেজমেন্ট সিস্টেম, যা বিশেষভাবে বড় আকারের ডেটা স্টোরেজ এবং হাই-অ্যাভেইলেবিলিটি নিশ্চিত করার জন্য ডিজাইন করা হয়েছে। এটি মূলত Facebook এ তৈরি হয়েছিল এবং পরে Apache Software Foundation এর অধীনে রিলিজ করা হয়েছে। Cassandra অত্যন্ত স্কেলেবল এবং ডিস্ট্রিবিউটেড আর্কিটেকচার ব্যবহার করে, যা বড় ডেটা সেটগুলিকে বিভিন্ন সার্ভারে ছড়িয়ে স্টোর করতে এবং দ্রুত অ্যাক্সেস করতে সাহায্য করে।

Apache Cassandra: একটি বিস্তারিত বাংলা টিউটোরিয়াল

ভূমিকা

Apache Cassandra এর বৈশিষ্ট্যসমূহ

ডিস্ট্রিবিউটেড আর্কিটেকচার: Cassandra একটি সম্পূর্ণরূপে ডিস্ট্রিবিউটেড ডেটাবেস, যেখানে ডেটা বিভিন্ন নোডে সমানভাবে বিতরণ করা হয়।
Scalability: Cassandra সহজে horizontal scalability সমর্থন করে, অর্থাৎ প্রয়োজনমতো নতুন নোড যোগ করে ক্লাস্টারের ক্ষমতা বাড়ানো যায়।
High Availability: এটি সর্বদা ডেটা অ্যাক্সেসযোগ্য রাখে, এমনকি কোনো নোড ব্যর্থ হলেও ডেটা লস হয় না।
Partition Tolerance: Cassandra ক্লাস্টার বিভাজনের সময়ও ডেটার সঠিকতা এবং স্থায়িত্ব বজায় রাখে।
Schema-less: এটি স্কিমালেস ডাটাবেস হওয়ায়, ডেটার ফর্ম্যাট পরিবর্তন করা বা নতুন ফিল্ড যোগ করা সহজ।
Data Replication: Cassandra প্রতিটি ডেটার কপি বিভিন্ন নোডে সংরক্ষণ করে, যা ডেটা রেডান্ডেন্সি এবং ফল্ট টলারেন্স নিশ্চিত করে।
Tunable Consistency: ব্যবহারকারীরা Consistency Level নির্ধারণ করতে পারে, যাতে রিড এবং রাইট অপারেশনের সময় কোন নোডগুলির সাথে সমন্বয় হবে তা নির্ধারণ করা যায়।
Write Optimization: Cassandra খুবই দ্রুত write-heavy অপারেশন পরিচালনা করতে সক্ষম, কারণ এটি প্রতিটি লেখা নোডের মেমোরিতে সংরক্ষণ করে।
Decentralized: Cassandra এর কোনো মাস্টার নোড নেই, প্রতিটি নোড সমান ক্ষমতা রাখে, যা এটিকে দ্রুত ও নির্ভরযোগ্য করে তোলে।

Apache Cassandra এর আর্কিটেকচার

১. Cluster

২. Node

৩. Keyspace

৪. Table

৫. Partition

৬. Replication

৭. Consistency Level

Apache Cassandra ইনস্টলেশন এবং সেটআপ

ধাপ ১: Java ইনস্টল করা

sudo apt update
sudo apt install openjdk-11-jdk

ধাপ ২: Apache Cassandra ডাউনলোড করা

Cassandra ডাউনলোড এবং ইনস্টল করতে নিম্নলিখিত ধাপগুলো অনুসরণ করুন:

echo "deb http://www.apache.org/dist/cassandra/debian 311x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list

তারপর Cassandra এর GPG key যোগ করুন:

curl https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -

Cassandra ইনস্টল করতে:

sudo apt update
sudo apt install cassandra

ধাপ ৩: Cassandra সার্ভার চালানো

Cassandra সার্ভার চালাতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:

sudo systemctl start cassandra

Cassandra সার্ভার চালু হয়েছে কিনা তা যাচাই করতে:

nodetool status

ধাপ ৪: Cassandra Shell (cqlsh) এ প্রবেশ করা

Cassandra এর CQL (Cassandra Query Language) শিখতে এবং ব্যবহার করতে, cqlsh ব্যবহার করা হয়। CQL চালাতে:

cqlsh

এখন আপনি Cassandra তে SQL-এর মতো কুয়েরি লিখে ডেটা ম্যানেজ করতে পারবেন।

Cassandra এর মৌলিক CQL কুয়েরি

১. Keyspace তৈরি করা

Keyspace তৈরি করতে নিচের কুয়েরি ব্যবহার করা হয়:

CREATE KEYSPACE mykeyspace WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 3};

২. Table তৈরি করা

Keyspace এর মধ্যে Table তৈরি করতে:

CREATE TABLE mykeyspace.users (
    id UUID PRIMARY KEY,
    name TEXT,
    email TEXT
);

৩. ডেটা ইনসার্ট করা

টেবিলে ডেটা ইনসার্ট করতে:

INSERT INTO mykeyspace.users (id, name, email) VALUES (uuid(), 'John Doe', 'john@example.com');

৪. ডেটা রিট্রিভ করা

ডেটা রিট্রিভ করতে:

SELECT * FROM mykeyspace.users;

৫. ডেটা আপডেট করা

টেবিলের ডেটা আপডেট করতে:

UPDATE mykeyspace.users SET email = 'john.doe@example.com' WHERE id = ;

৬. ডেটা ডিলিট করা

ডেটা ডিলিট করতে:

DELETE FROM mykeyspace.users WHERE id = ;

Apache Cassandra এর সুবিধা

High Scalability: Cassandra সহজেই বড় ডেটাবেসের জন্য স্কেল করা যায় এবং এতে কোনো Single Point of Failure (SPOF) নেই।
High Availability: এটি সর্বদা অ্যাক্সেসযোগ্য থাকে এবং নোড ব্যর্থ হলেও ডেটা লস হয় না।
Fault Tolerance: Cassandra ডেটার একাধিক রেপ্লিকা সংরক্ষণ করে, যা সিস্টেম ব্যর্থতা থেকেও ডেটা রক্ষা করে।
Flexible Schema: এটি স্কিমালেস হওয়ায় ডেটার কাঠামো পরিবর্তন করা সহজ এবং দ্রুত।
Fast Write Performance: এটি দ্রুত write-heavy অ্যাপ্লিকেশনগুলো পরিচালনা করতে পারে।

Apache Cassandra এর অসুবিধা

Complex Consistency Model: Cassandra এর Consistency Model একটু জটিল, যা নতুনদের জন্য শিখতে কিছুটা সময় লাগতে পারে।
Slow Read Operations: লেখার পারফরম্যান্স খুব দ্রুত হলেও, কিছু ক্ষেত্রে রিড অপারেশন তুলনামূলকভাবে ধীর হতে পারে।
Full Scans Not Supported: Cassandra টেবিলের সম্পূর্ণ Scan সমর্থন করে না, তাই কুয়েরি তৈরি করার সময় Primary Key এবং Partition Key এর সঠিক ব্যবহার করতে হয়।

Apache Cassandra বনাম অন্যান্য NoSQL ডাটাবেস

বৈশিষ্ট্য	Apache Cassandra	MongoDB	HBase
ডেটা মডেল	Wide Column Store	Document Store	Wide Column Store
স্কেলেবিলিটি	Horizontal Scalability	Horizontal Scalability	Horizontal Scalability
কনসিসটেন্সি	Tunable Consistency	Strong Consistency	Strong Consistency
প্রসেসিং টাইপ	রিয়েল-টাইম ডেটা প্রসেসিং	রিয়েল-টাইম এবং ব্যাচ প্রসেসিং	ব্যাচ প্রসেসিং
Replication and Failover	Multi-datacenter replication, Fault-tolerant	Replica Sets, Sharding	Master-Slave Architecture
ব্যবহার ক্ষেত্র	বড় ডেটা অ্যাপ্লিকেশন, IoT, টাইম-সিরিজ ডেটা	ডকুমেন্ট স্টোরেজ, ওয়েব অ্যাপ্লিকেশন	বড় ডেটা প্রসেসিং, Hadoop ইন্টিগ্রেশন

ক্যাসান্দ্রা (Cassandra)

Apache Cassandra: একটি বিস্তারিত বাংলা টিউটোরিয়াল

ভূমিকা

Apache Cassandra এর বৈশিষ্ট্যসমূহ

Apache Cassandra এর আর্কিটেকচার

১. Cluster

২. Node

৩. Keyspace

৪. Table

৫. Partition

৬. Replication

৭. Consistency Level

Apache Cassandra ইনস্টলেশন এবং সেটআপ

ধাপ ১: Java ইনস্টল করা

ধাপ ২: Apache Cassandra ডাউনলোড করা

ধাপ ৩: Cassandra সার্ভার চালানো

ধাপ ৪: Cassandra Shell (cqlsh) এ প্রবেশ করা

Cassandra এর মৌলিক CQL কুয়েরি

১. Keyspace তৈরি করা

২. Table তৈরি করা

৩. ডেটা ইনসার্ট করা

৪. ডেটা রিট্রিভ করা

৫. ডেটা আপডেট করা

৬. ডেটা ডিলিট করা

Apache Cassandra এর সুবিধা

Apache Cassandra এর অসুবিধা

Apache Cassandra বনাম অন্যান্য NoSQL ডাটাবেস

উপসংহার

Apache Cassandra: একটি বিস্তারিত বাংলা টিউটোরিয়াল

ভূমিকা

Apache Cassandra এর বৈশিষ্ট্যসমূহ

Apache Cassandra এর আর্কিটেকচার

১. Cluster

২. Node

৩. Keyspace

৪. Table

৫. Partition

৬. Replication

৭. Consistency Level

Apache Cassandra ইনস্টলেশন এবং সেটআপ

ধাপ ১: Java ইনস্টল করা

ধাপ ২: Apache Cassandra ডাউনলোড করা

ধাপ ৩: Cassandra সার্ভার চালানো

ধাপ ৪: Cassandra Shell (cqlsh) এ প্রবেশ করা

Cassandra এর মৌলিক CQL কুয়েরি

১. Keyspace তৈরি করা

২. Table তৈরি করা

৩. ডেটা ইনসার্ট করা

৪. ডেটা রিট্রিভ করা

৫. ডেটা আপডেট করা

৬. ডেটা ডিলিট করা

Apache Cassandra এর সুবিধা

Apache Cassandra এর অসুবিধা

Apache Cassandra বনাম অন্যান্য NoSQL ডাটাবেস

উপসংহার

Related Books

Big Data and Analytics

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!