Teradata এর জন্য Table Creation

টেরাডেটা (Teradata) - Big Data and Analytics

434

Teradata তে টেবিল তৈরি করা একটি গুরুত্বপূর্ণ প্রক্রিয়া, কারণ সঠিক টেবিল ডিজাইন ডেটাবেসের কার্যকারিতা এবং পারফরম্যান্সে সরাসরি প্রভাব ফেলে। টেবিল তৈরি করার জন্য SQL কমান্ড ব্যবহৃত হয়, যার মাধ্যমে আপনি বিভিন্ন ধরনের ডেটা সঞ্চয় করতে পারেন। টেবিল তৈরির সময় আপনাকে কলাম, ডেটাটাইপ, কীগুলি, ইন্ডেক্স এবং অন্যান্য কনস্ট্রেইন (constraints) নির্ধারণ করতে হয়।

Teradata তে Table Creation এর প্রাথমিক পদক্ষেপ

1. CREATE TABLE কমান্ড

টেবিল তৈরি করার জন্য CREATE TABLE কমান্ড ব্যবহার করা হয়। এই কমান্ডে টেবিলের নাম, কলাম এবং তাদের ডেটাটাইপের পাশাপাশি প্রাথমিক কনস্ট্রেইন (যেমন: প্রাইমারি কি, ফরেন কি) নির্ধারণ করা হয়।

CREATE TABLE <database_name>.<table_name> (
   <column_name_1> <data_type> [constraints],
   <column_name_2> <data_type> [constraints],
   ...
   [PRIMARY KEY (<column_name>)],
   [FOREIGN KEY (<column_name>) REFERENCES <referenced_table>]
);

<database_name>: টেবিলটি যেখানে তৈরি হবে, সেই ডেটাবেসের নাম।
<table_name>: টেবিলের নাম।
<column_name>: টেবিলের কলামের নাম।
<data_type>: কলামের ডেটাটাইপ (যেমন VARCHAR, INTEGER, DATE, ইত্যাদি)।
[constraints]: কনস্ট্রেইন, যেমন NOT NULL, UNIQUE, DEFAULT, ইত্যাদি।

Table Creation এর উদাহরণ

1. সাধারণ Table Creation

এখানে একটি সাধারণ টেবিল তৈরি করার উদাহরণ দেয়া হলো, যেখানে একটি Employee টেবিল তৈরি করা হয়েছে যার মধ্যে Employee_ID, Name, Join_Date, এবং Salary নামে ৪টি কলাম রয়েছে।

CREATE TABLE Employee (
   Employee_ID INTEGER NOT NULL,
   Name VARCHAR(100) NOT NULL,
   Join_Date DATE,
   Salary DECIMAL(10, 2),
   PRIMARY KEY (Employee_ID)
);

Employee_ID: একটি ইনটিজার (INTEGER) কলাম, যা প্রাথমিক কী (PRIMARY KEY) হিসেবে ব্যবহৃত হচ্ছে।
Name: একটি ভ্যারচারের (VARCHAR) কলাম, যেটি নাম সংরক্ষণ করবে।
Join_Date: একটি ডেট টাইপ কলাম, যেখানে কর্মচারীর যোগদানের তারিখ থাকবে।
Salary: একটি ডেসিমাল (DECIMAL) টাইপ কলাম, যেখানে কর্মচারীর বেতন থাকবে।

2. Foreign Key সহ Table Creation

এখানে একটি Department টেবিল তৈরি করা হয়েছে যেখানে একটি Department_ID রয়েছে, এবং Employee টেবিলের Employee_ID কলামকে ফরেন কি (FOREIGN KEY) হিসেবে ব্যবহার করা হয়েছে।

CREATE TABLE Department (
   Department_ID INTEGER NOT NULL,
   Department_Name VARCHAR(100) NOT NULL,
   Manager_ID INTEGER,
   PRIMARY KEY (Department_ID),
   FOREIGN KEY (Manager_ID) REFERENCES Employee(Employee_ID)
);

Manager_ID: এটি Employee টেবিলের Employee_ID কলামের ফরেন কি (FOREIGN KEY)।

বিভিন্ন Data Type

Teradata বিভিন্ন ধরনের ডেটাটাইপ সাপোর্ট করে, যেমন:

INTEGER: পূর্ণসংখ্যা (whole number) সংরক্ষণ করতে ব্যবহৃত হয়।
VARCHAR(n): ভ্যারিয়েবল লেংথ স্ট্রিং সংরক্ষণ করতে ব্যবহৃত হয়।
CHAR(n): নির্দিষ্ট দৈর্ঘ্যের স্ট্রিং সংরক্ষণ করতে ব্যবহৃত হয়।
DATE: তারিখ সংরক্ষণ করার জন্য ব্যবহৃত হয়।
DECIMAL(p, s): দশমিক সংখ্যা, যেখানে p মোট সংখ্যা এবং s দশমিক স্থান সংখ্যা নির্ধারণ করে।

কনস্ট্রেইন (Constraints)

টেবিল তৈরি করার সময় আপনি বিভিন্ন কনস্ট্রেইন ব্যবহার করতে পারেন যেমন:

PRIMARY KEY: একটি কলাম বা কলামের সমষ্টি যা টেবিলের জন্য ইউনিক (অনন্য) আইডেন্টিফায়ার হিসেবে কাজ করে।
FOREIGN KEY: একটি কলাম যা অন্য একটি টেবিলের প্রাইমারি কীকে রেফার করে। এটি ডেটা ইন্টিগ্রিটি নিশ্চিত করতে সাহায্য করে।
NOT NULL: এই কনস্ট্রেইনটি নির্ধারণ করে যে, কলামের মান শূন্য (NULL) হতে পারবে না।
UNIQUE: এই কনস্ট্রেইনটি নিশ্চিত করে যে, কলামের প্রতিটি মান ইউনিক হবে, অর্থাৎ, কোনো পুনরাবৃত্তি থাকবে না।
DEFAULT: এই কনস্ট্রেইনটি একটি ডিফল্ট মান নির্ধারণ করে, যদি কলামে কোনো মান প্রদান না করা হয়।

Teradata তে Table Creation এর পরবর্তী পদক্ষেপ

Data Insertion: টেবিল তৈরি করার পর, আপনি ডেটা ইনসার্ট করতে পারেন INSERT INTO কমান্ড ব্যবহার করে।
```
INSERT INTO Employee (Employee_ID, Name, Join_Date, Salary)
VALUES (1, 'John Doe', '2024-01-01', 55000.00);
```
Data Querying: টেবিল থেকে ডেটা নিয়ে আসার জন্য SELECT কমান্ড ব্যবহার করুন।
```
SELECT * FROM Employee;
```

সারাংশ

Teradata তে টেবিল তৈরি করার প্রক্রিয়া সহজ এবং শক্তিশালী। CREATE TABLE কমান্ডের মাধ্যমে আপনি টেবিলের কাঠামো তৈরি করেন, যেখানে আপনি কলাম, ডেটাটাইপ এবং কনস্ট্রেইন সেট করেন। সঠিকভাবে টেবিল তৈরি করলে ডেটা সঞ্চয় এবং পরিচালনা করার জন্য একটি শক্তিশালী ভিত্তি পাওয়া যায়।

Content added By

Rezwan Siddiki Tamim

Table Create এবং Drop করা

393

Teradata ডেটাবেসে টেবিল তৈরি এবং মুছে ফেলার কাজ খুবই গুরুত্বপূর্ণ। এই প্রক্রিয়া দুটি মূল SQL কমান্ডের মাধ্যমে করা হয়: CREATE TABLE এবং DROP TABLE। নিচে এগুলোর বিস্তারিত ব্যাখ্যা দেওয়া হলো।

১. টেবিল তৈরি করা (CREATE TABLE)

CREATE TABLE কমান্ড ব্যবহৃত হয় একটি নতুন টেবিল তৈরি করতে। এই কমান্ডে টেবিলের নাম, কলাম (columns) এবং তাদের ডেটাটাইপ (data types) নির্ধারণ করতে হয়।

টেবিল তৈরি করার সঠিক সিনট্যাক্স:

CREATE TABLE [ডেটাবেস নাম].[টেবিল নাম] (
    কলাম ১ নাম ডেটাটাইপ [অপশন],
    কলাম ২ নাম ডেটাটাইপ [অপশন],
    ...
);

উদাহরণ:

ধরা যাক, একটি টেবিল তৈরি করতে চান যার নাম Employee এবং এতে তিনটি কলাম থাকবে: EmployeeID, EmployeeName, এবং Salary।

CREATE TABLE Employee (
    EmployeeID INT,
    EmployeeName VARCHAR(100),
    Salary DECIMAL(10, 2)
);

এই উদাহরণে:

EmployeeID হলো একটি পূর্ণসংখ্যা (integer) ফিল্ড।
EmployeeName হলো একটি স্ট্রিং (string) ফিল্ড যার সর্বোচ্চ দৈর্ঘ্য ১০০ ক্যারেকটার।
Salary হলো একটি দশমিক (decimal) সংখ্যা যার সর্বোচ্চ ১০টি ডিজিট এবং ২টি দশমিক স্থান থাকবে।

২. টেবিল তৈরি করার অতিরিক্ত অপশন

কিছু অতিরিক্ত অপশন রয়েছে যা টেবিল তৈরি করার সময় ব্যবহার করা যায়:

PRIMARY KEY: একটি কলাম বা কলাম সমষ্টি যাকে টেবিলের প্রতিটি রেকর্ডের জন্য একক চিহ্নিতকারী হিসেবে ব্যবহার করা হয়।
UNIQUE: একটি কলামে একাধিক ডুপ্লিকেট মান না আসতে দেয়।
NOT NULL: কলামটিতে শূন্য মান (null) রাখতে না দেয়।
DEFAULT: যদি কোনো মান দেওয়া না হয়, তবে একটি ডিফল্ট মান ব্যবহার করা হয়।

উদাহরণ (অতিরিক্ত অপশন):

CREATE TABLE Employee (
    EmployeeID INT PRIMARY KEY,
    EmployeeName VARCHAR(100) NOT NULL,
    Salary DECIMAL(10, 2) DEFAULT 50000
);

এখানে:

EmployeeID কলামটি PRIMARY KEY হিসেবে সেট করা হয়েছে।
EmployeeName কলামে NOT NULL শর্ত দেওয়া হয়েছে।
Salary কলামে একটি DEFAULT মান দেওয়া হয়েছে, যা হবে ৫০,০০০ যদি অন্য কোন মান না দেওয়া হয়।

৩. টেবিল মুছে ফেলা (DROP TABLE)

DROP TABLE কমান্ড ব্যবহার করে কোনো টেবিল সম্পূর্ণভাবে মুছে ফেলা হয়। এই কমান্ডটি ব্যবহার করার মাধ্যমে টেবিলের সমস্ত ডেটা এবং গঠন (structure) মুছে যায়।

টেবিল মুছে ফেলার সঠিক সিনট্যাক্স:

DROP TABLE [ডেটাবেস নাম].[টেবিল নাম];

উদাহরণ:

যদি আপনি Employee নামক টেবিলটি মুছে ফেলতে চান, তাহলে নিচের SQL কমান্ডটি ব্যবহার করবেন:

DROP TABLE Employee;

এই কমান্ডটি চলানোর পর Employee টেবিলটি পুরোপুরি মুছে যাবে এবং এর মধ্যে থাকা সমস্ত ডেটা হারিয়ে যাবে। এটি একটি বিপজ্জনক কমান্ড, কারণ এটি ডেটা পুনরুদ্ধারযোগ্য নয়।

৪. টেবিল মুছে ফেলার অতিরিক্ত অপশন

কিছু ক্ষেত্রেও টেবিলটি মুছে ফেলার আগে সিস্টেমকে সতর্ক করতে চাইলে IF EXISTS অপশন ব্যবহার করা যায়। এর মাধ্যমে যদি টেবিলটি আগে থেকেই না থাকে, তবে এর মুছে ফেলার চেষ্টা করা হয় না।

উদাহরণ:

DROP TABLE IF EXISTS Employee;

এই কমান্ডটি ব্যবহার করলে, যদি Employee নামের টেবিলটি না থাকে, তবে কোনো ত্রুটি (error) হবে না।

সারাংশ

CREATE TABLE কমান্ডের মাধ্যমে আপনি নতুন টেবিল তৈরি করতে পারেন এবং এতে বিভিন্ন কলাম এবং ডেটাটাইপ নির্ধারণ করতে পারেন। এছাড়া DROP TABLE কমান্ডের মাধ্যমে টেবিল মুছে ফেলা হয়, যা টেবিলের সমস্ত ডেটা এবং গঠন মুছে দেয়। এই কমান্ডগুলো ব্যবহার করে আপনি আপনার ডেটাবেসে টেবিল পরিচালনা করতে পারবেন।

Content added By

Rezwan Siddiki Tamim

Primary Key, Foreign Key এবং Unique Constraints

392

টেরাডেটা (Teradata) একটি রিলেশনাল ডেটাবেস ম্যানেজমেন্ট সিস্টেম (RDBMS), যা ডেটাবেস টেবিলের মধ্যে ডেটার সংহতি এবং সঠিকতা রক্ষা করার জন্য বিভিন্ন ধরনের কনস্ট্রেইন্ট (Constraints) ব্যবহার করে। এর মধ্যে Primary Key, Foreign Key, এবং Unique Constraints অন্যতম গুরুত্বপূর্ণ কনস্ট্রেইন্ট। এই কনস্ট্রেইন্টগুলি টেবিলের ডেটার গুণগত মান নিশ্চিত করতে সহায়তা করে।

এই কনস্ট্রেইন্টগুলোর কাজ এবং ব্যবহার সম্পর্কে বিস্তারিতভাবে আলোচনা করা হলো:

Primary Key

Primary Key একটি টেবিলের মধ্যে এমন একটি কনস্ট্রেইন্ট যা প্রতিটি রেকর্ডকে অনন্য (Unique) করে তোলে এবং কোনো দুটি রেকর্ডে একই Primary Key থাকতে পারে না। Primary Key কলামটি সাধারণত টেবিলের মূল বা প্রাথমিক শনাক্তকরণ হিসেবে ব্যবহৃত হয়।

বৈশিষ্ট্য:

অনন্য মান: Primary Key কলামে থাকা প্রতিটি মান অনন্য হতে হবে, অর্থাৎ, এটি কোনও ডুপ্লিকেট মান গ্রহণ করতে পারে না।
নাল (NULL) মান নিষিদ্ধ: Primary Key কলামে কোনও নাল (NULL) মান থাকতে পারে না।
একটি টেবিলের একটিমাত্র Primary Key: একটি টেবিলে শুধু একটিমাত্র Primary Key থাকতে পারে, তবে এটি একাধিক কলামের সমন্বয়ে (Composite Primary Key) হতে পারে।

ব্যবহার:

উদাহরণ হিসেবে, যদি একটি Customer টেবিলের Customer_ID কলামকে Primary Key হিসেবে নির্ধারণ করা হয়, তাহলে প্রতিটি গ্রাহকের জন্য একটি অনন্য Customer_ID থাকতে হবে এবং কোনো দুই গ্রাহকের Customer_ID একই হবে না।

Foreign Key

Foreign Key একটি টেবিলের কলাম বা কলামগুলোর একটি সেট যা অন্য টেবিলের Primary Key বা Unique Key এর সাথে সম্পর্কিত। এটি দুইটি টেবিলের মধ্যে সম্পর্ক স্থাপন করতে ব্যবহৃত হয় এবং রিলেশনাল ডেটাবেসের অবিচ্ছেদ্য অংশ। Foreign Key মূলত ডেটা ইন্টেগ্রিটি (Data Integrity) বজায় রাখার জন্য ব্যবহৃত হয়।

বৈশিষ্ট্য:

সম্পর্ক স্থাপন: Foreign Key কলামটি অন্য টেবিলের Primary Key অথবা Unique Key এর মানের সাথে সম্পর্কিত থাকে।
নাল (NULL) মান অনুমোদিত: Foreign Key কলামে নাল মান থাকতে পারে, তবে এটি ওই টেবিলের Primary Key কলামের মানের সাথে সম্পর্কিত হবে না।
ডেটা ইন্টিগ্রিটি: Foreign Key ব্যবহারের মাধ্যমে একটি টেবিলের রেকর্ড অন্য টেবিলের রেকর্ডের সাথে যুক্ত থাকে এবং ডেটা ইন্টেগ্রিটি নিশ্চিত হয়।

ব্যবহার:

উদাহরণস্বরূপ, একটি Orders টেবিলের Customer_ID কলাম যদি Customer টেবিলের Primary Key Customer_ID এর সাথে Foreign Key হিসেবে সংযুক্ত থাকে, তাহলে এটি নিশ্চিত করে যে Orders টেবিলের প্রতিটি Customer_ID অবশ্যই Customer টেবিলের একটি বৈধ Customer_ID হবে।

Unique Constraint

Unique Constraint একটি টেবিলের এমন একটি কনস্ট্রেইন্ট, যা একটি কলামে অথবা একাধিক কলামের সম্মিলিত মানকে অনন্য (Unique) করে তোলে। যদিও Primary Key এবং Unique Constraint দুটি অনন্য মান নিশ্চিত করে, তাদের মধ্যে কিছু পার্থক্য আছে।

বৈশিষ্ট্য:

অনন্য মান: Unique Constraint কলামে থাকা প্রতিটি মান অনন্য হতে হবে, অর্থাৎ, ডুপ্লিকেট মান থাকতে পারবে না।
নাল (NULL) মান অনুমোদিত: একটি Unique Constraint কলামে নাল মান থাকতে পারে (ভিন্নভাবে, Primary Key তে নাল মান থাকতে পারে না)।
একাধিক Unique Constraint: একটি টেবিলে একাধিক Unique Constraint থাকতে পারে, কিন্তু শুধুমাত্র একটি Primary Key থাকতে পারে।

ব্যবহার:

উদাহরণস্বরূপ, একটি Employees টেবিলের Email_Address কলামে Unique Constraint দেওয়া হলে, এটি নিশ্চিত করবে যে একই ইমেল ঠিকানা দুটি রেকর্ডে থাকবে না।

Primary Key, Foreign Key এবং Unique Constraints এর মধ্যে পার্থক্য

কনস্ট্রেইন্ট	অর্থ	নাল (NULL) অনুমোদিত	ডুপ্লিকেট মান অনুমোদিত	একাধিক কনস্ট্রেইন্ট থাকতে পারে কি না
Primary Key	টেবিলের প্রতিটি রেকর্ডের জন্য একটি অনন্য শনাক্তকারী	না (NULL মান নিষিদ্ধ)	না (ডুপ্লিকেট মান নিষিদ্ধ)	একটি টেবিলে একটিমাত্র Primary Key
Foreign Key	অন্য টেবিলের Primary Key বা Unique Key এর সাথে সম্পর্ক স্থাপন করে	হ্যাঁ (NULL মান থাকতে পারে)	হ্যাঁ (ডুপ্লিকেট মান থাকতে পারে)	একাধিক Foreign Key থাকতে পারে
Unique Key	একটি কলামে অনন্য মান নিশ্চিত করে	হ্যাঁ (NULL মান থাকতে পারে)	না (ডুপ্লিকেট মান নিষিদ্ধ)	একাধিক Unique Key থাকতে পারে

সারাংশ

Teradata ডেটাবেসে Primary Key, Foreign Key, এবং Unique Constraint তিনটি গুরুত্বপূর্ণ কনস্ট্রেইন্ট যা ডেটার সঠিকতা এবং এক্সেস নিশ্চিত করতে ব্যবহৃত হয়। Primary Key টেবিলের প্রতিটি রেকর্ডের জন্য একটি অনন্য শনাক্তকারী হিসেবে কাজ করে, Foreign Key দুটি টেবিলের মধ্যে সম্পর্ক স্থাপন করে এবং Unique Constraint একটি কলামের মধ্যে অনন্য মান নিশ্চিত করে। এই কনস্ট্রেইন্টগুলি ডেটাবেসের ডেটা ইন্টিগ্রিটি এবং রিলেশনাল কাঠামো বজায় রাখে।

Content added By

Rezwan Siddiki Tamim

Primary এবং Secondary Index এর ব্যবহার

320

Teradata একটি বিশাল এবং জটিল ডেটাবেস সিস্টেম যেখানে ডেটা দ্রুত অ্যাক্সেস এবং কার্যকরী পারফরম্যান্সের জন্য ইনডেক্সিং গুরুত্বপূর্ণ ভূমিকা পালন করে। এখানে দুই ধরনের ইনডেক্স ব্যবহৃত হয়—Primary Index (PI) এবং Secondary Index (SI)। প্রতিটি ইনডেক্সের নিজস্ব বৈশিষ্ট্য এবং ব্যবহারিক সুবিধা রয়েছে যা ডেটাবেসের কার্যকারিতা এবং পারফরম্যান্সে গুরুত্বপূর্ণ প্রভাব ফেলে।

Primary Index (PI)

Primary Index (PI) হল একটি ইনডেক্স যা ডেটাবেস টেবিলের ডেটা ডিস্কে সঞ্চয় করার সময় ব্যবহৃত হয়। এটি ডেটার লজিক্যাল সঞ্চালন এবং ফিজিক্যাল সঞ্চালনকে একত্রিত করে। PI দিয়ে টেবিলের প্রতি রেকর্ডের স্থান নির্ধারণ করা হয়, এবং এটি ডেটাবেসের পারফরম্যান্স উন্নত করার জন্য ব্যবহৃত হয়।

Primary Index এর বৈশিষ্ট্য:

প্রাথমিক কীগুলির ভিত্তিতে ডেটার সংরক্ষণ: Primary Index ডেটার ফিজিক্যাল অবস্থান নির্ধারণ করে, অর্থাৎ যেকোনো নির্দিষ্ট রেকর্ডকে দ্রুত খুঁজে পাওয়া যায়।
ইউনিক এবং নন-ইউনিক: Primary Index দুটি ধরনের হতে পারে—ইউনিক (Uniquely Defined) এবং নন-ইউনিক (Non-Unique)।
- ইউনিক PI: যখন Primary Indexে যে কলামটি নির্বাচিত হয়, সেটি টেবিলের জন্য একটি একক মান (Unique) নির্ধারণ করে।
- নন-ইউনিক PI: যখন Primary Indexে নির্বাচিত কলামটি টেবিলের মধ্যে একাধিক রেকর্ডের জন্য সাধারণ হতে পারে।
ডিস্ট্রিবিউশন প্রক্রিয়া: Primary Index এর মাধ্যমে, Teradata নির্ধারণ করে কোন সার্ভারে ডেটা সঞ্চিত হবে। এটি ডেটা ডিসট্রিবিউশনের জন্য দায়ী।
সোর্স টেবিলের পারফরম্যান্স: যখন Primary Index ব্যবহার করা হয়, তখন সিস্টেমের ফিজিক্যাল পারফরম্যান্সও বৃদ্ধি পায়।

Primary Index এর ব্যবহার:

ডেটা সঞ্চয় এবং অ্যাক্সেস: ডেটা ডিস্কে সঞ্চিত হওয়ার সময় Primary Index ব্যবহার করা হয় যাতে দ্রুত অ্যাক্সেস করা যায়।
প্যারালাল প্রসেসিং: PI ডেটাকে প্যারালাল প্রসেসিংয়ের জন্য প্রস্তুত করে, ফলে ডেটা দ্রুত অ্যাক্সেস করা সম্ভব হয়।

Secondary Index (SI)

Secondary Index (SI) হল একটি অতিরিক্ত ইনডেক্স যা টেবিলের ডেটাকে অন্য একটি কলামের ভিত্তিতে দ্রুত অ্যাক্সেস করার জন্য তৈরি করা হয়। Primary Index ব্যবহার করে যখন নির্দিষ্ট একটি কলাম দ্বারা ডেটা ডিস্ট্রিবিউট করা হয়, তখন Secondary Index অন্য যেকোনো কলামের উপর ইনডেক্স তৈরি করতে ব্যবহৃত হয়।

Secondary Index এর বৈশিষ্ট্য:

ডেটা অ্যাক্সেসের বিকল্প পথ: Secondary Index একটি বিকল্প পথ তৈরি করে যেটি ব্যবহারকারীদের নির্দিষ্ট কলামের ভিত্তিতে ডেটা অনুসন্ধান করতে সাহায্য করে। এটি সেই ক্ষেত্রগুলোর জন্য ব্যবহৃত হয় যেগুলোর ওপর Primary Index তৈরি করা হয়নি।
ইউনিক এবং নন-ইউনিক SI: Secondary Index এর ক্ষেত্রেও দুটি ধরনের ইনডেক্স ব্যবহার করা যায়:
- ইউনিক SI: যেটি নির্দিষ্ট কলামে একক মান চিহ্নিত করে।
- নন-ইউনিক SI: যেটি একাধিক রেকর্ডের জন্য সাধারণ মান চিহ্নিত করতে ব্যবহৃত হয়।
ফাস্ট কুয়েরি এক্সিকিউশন: Secondary Index কুয়েরি এক্সিকিউশনের গতিকে উন্নত করে। এটি বিশেষ করে ফিল্টার এবং জয়েন অপারেশনগুলির জন্য উপকারী।

Secondary Index এর ব্যবহার:

কাস্টমার ডেটা অনুসন্ধান: Secondary Index সাধারণত সেই কলামগুলোর জন্য তৈরি করা হয় যেগুলির ওপর সাধারণত কুয়েরি প্রয়োগ করা হয়, যেমন কাস্টমার আইডি বা প্রোডাক্ট কোড।
অপারেশন পারফরম্যান্স উন্নতি: যখন Primary Index এর বাইরে কোনও কলাম দিয়ে ডেটা অনুসন্ধান প্রয়োজন, তখন Secondary Index কুয়েরি পারফরম্যান্সে সাহায্য করে।

Primary Index এবং Secondary Index এর মধ্যে পার্থক্য

বৈশিষ্ট্য	Primary Index (PI)	Secondary Index (SI)
ডেটা সঞ্চালন	ফিজিক্যাল ডেটা সঞ্চালনে ব্যবহৃত	কুয়েরি এক্সিকিউশনে ব্যবহৃত
ডিস্ট্রিবিউশন	ডেটা ডিসট্রিবিউশনে সহায়তা করে	ডেটা ডিসট্রিবিউশনে সহায়তা করে না
কলাম	এক বা একাধিক কলাম	নির্দিষ্ট কলাম
পারফরম্যান্স	দ্রুত অ্যাক্সেস এবং ডিস্ট্রিবিউশন	কুয়েরি পারফরম্যান্স উন্নত করে
ইউনিক বা নন-ইউনিক	ইউনিক বা নন-ইউনিক	ইউনিক বা নন-ইউনিক

সারাংশ

Teradata ডেটাবেসে Primary Index এবং Secondary Index দুটি ভিন্ন প্রকারের ইনডেক্স যা ডেটা অ্যাক্সেস এবং পারফরম্যান্স উন্নত করার জন্য ব্যবহৃত হয়। Primary Index টেবিলের ডেটা সঞ্চয় এবং দ্রুত অ্যাক্সেস নিশ্চিত করে, যেখানে Secondary Index নির্দিষ্ট কলামের ভিত্তিতে বিকল্প পথ দিয়ে ডেটা অনুসন্ধানকে সহজ করে। সঠিক ইনডেক্স ব্যবহার করলে ডেটাবেসের কার্যক্ষমতা এবং কার্যকরী সময় উল্লেখযোগ্যভাবে উন্নত হতে পারে।

Content added By

Rezwan Siddiki Tamim

Partitioned Tables এবং Data Distribution Techniques

369

টেরাডেটা ডেটাবেসের পারফরম্যান্স এবং স্কেলেবিলিটি উন্নত করতে বিভিন্ন ধরনের ডেটা ডিস্ট্রিবিউশন এবং টেবিল পার্টিশনিং কৌশল ব্যবহৃত হয়। এই কৌশলগুলো ডেটাবেসের বিশাল পরিমাণ ডেটা দ্রুত এবং কার্যকরীভাবে প্রক্রিয়া করতে সাহায্য করে। দুটি গুরুত্বপূর্ণ ধারণা হলো Partitioned Tables এবং Data Distribution Techniques। এই ধারণাগুলো ডেটার সঞ্চালন, অ্যানালাইসিস এবং পরিসংখ্যানের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Partitioned Tables কী?

Partitioned Tables হল এমন টেবিল যেখানে ডেটা একাধিক পার্টিশনে বিভক্ত থাকে। এটি ডেটাবেসের পারফরম্যান্স উন্নত করতে সাহায্য করে কারণ প্রতিটি পার্টিশন আলাদাভাবে প্রক্রিয়া করা যায়, ফলে পুরো টেবিলের ডেটা একসাথে স্ক্যান করতে হয় না। Teradata এ পার্টিশনিং মূলত বড় আকারের টেবিলকে ছোট অংশে বিভক্ত করে, যাতে ডেটার অ্যাক্সেস গতি বাড়ে এবং কমপ্লেক্স কুয়েরি সহজে এবং দ্রুত চলে।

Partitioning Types in Teradata

টেরাডেটায় দুটি প্রধান পার্টিশনিং কৌশল রয়েছে:

1. Range Partitioning:

Range Partitioning হল একটি পার্টিশনিং কৌশল যেখানে টেবিলের ডেটাকে একটি নির্দিষ্ট পরিসরে ভাগ করা হয়, যেমন একটি তারিখ বা সংখ্যার পরিসরে।

উদাহরণ: ধরা যাক, sales টেবিলের ডেটা প্রতি বছর বিভিন্ন পার্টিশনে বিভক্ত করা হচ্ছে:

CREATE TABLE sales (
    sale_id INT,
    sale_date DATE,
    amount DECIMAL(10, 2)
)
PRIMARY INDEX (sale_id)
PARTITION BY RANGE_N(sale_date BETWEEN DATE '2020-01-01' AND DATE '2023-12-31' EACH INTERVAL '1' YEAR);

এখানে sale_date এর উপর ভিত্তি করে টেবিলের ডেটা বিভিন্ন বছরের পার্টিশনে বিভক্ত হবে।

2. Hash Partitioning:

Hash Partitioning হল একটি কৌশল যেখানে ডেটাকে একটি নির্দিষ্ট কলামের হ্যাশ ভ্যালুর উপর ভিত্তি করে পার্টিশন করা হয়। এটি সাধারণত ডিস্ট্রিবিউশন পদ্ধতির সাথে সম্পর্কিত হয়, যা ডেটাকে সিস্টেমের বিভিন্ন নোডে সমানভাবে ভাগ করতে সহায়তা করে।

উদাহরণ:

CREATE TABLE sales (
    sale_id INT,
    sale_date DATE,
    amount DECIMAL(10, 2)
)
PRIMARY INDEX (sale_id)
PARTITION BY HASH(sale_id);

এটি sale_id কলামের মানের ভিত্তিতে ডেটা পার্টিশন করবে।

Data Distribution Techniques

টেরাডেটার ডেটা ডিস্ট্রিবিউশন কৌশলগুলোর লক্ষ্য হলো ডেটা সমানভাবে বিভিন্ন অ্যাম্বারে বা নোডে ভাগ করা, যাতে পারফরম্যান্স এবং স্কেলেবিলিটি উন্নত হয়। সঠিক ডিস্ট্রিবিউশন কৌশল নির্বাচন করা ডেটার অ্যাক্সেসের গতি বাড়াতে সহায়ক।

1. Even Data Distribution:

ডেটাকে সমানভাবে সিস্টেমের সব নোডে বিতরণ করা হয়। এটি ডেটার প্রক্রিয়াকরণ এবং অ্যাক্সেসের সময় কমিয়ে দেয় এবং সিস্টেমের কার্যকারিতা বাড়ায়।

উদাহরণ:

CREATE TABLE sales (
    sale_id INT,
    sale_date DATE,
    amount DECIMAL(10, 2)
)
PRIMARY INDEX (sale_id);

এই পদ্ধতিতে, sale_id কলামটি ডেটার সমান বিতরণ নিশ্চিত করবে, যাতে সিস্টেমের মধ্যে ভারসাম্য বজায় থাকে।

2. Skewed Data Distribution:

কিছু ক্ষেত্রেও ডেটা অসমভাবে বিতরণ হয়ে যেতে পারে, যা পারফরম্যান্স সমস্যার সৃষ্টি করতে পারে। এই ধরনের সমস্যা তখন হয় যখন কোনও নির্দিষ্ট ডেটার মান খুব বেশি বার বার ব্যবহৃত হয়। উদাহরণস্বরূপ, একটি নির্দিষ্ট অঞ্চলের ডেটা যদি সব সিস্টেমে অত্যধিক থাকে তবে সিস্টেমের একটি অংশ অতিরিক্ত চাপের সম্মুখীন হতে পারে। Teradata এ এই ধরনের সমস্যা দূর করার জন্য partitioning এবং hashing কৌশল ব্যবহার করা হয়।

3. Non-Unique and Unique Data Distribution:

ডেটা যদি সিস্টেমে ভালোভাবে বিতরণ না হয়, তবে সিস্টেমের পারফরম্যান্স ক্ষতিগ্রস্ত হতে পারে। Non-unique data distribution এ ডেটা সঠিকভাবে বিতরণ না হওয়ার কারণে সিস্টেমের কিছু নোডে অধিক চাপ পড়ে, যেখানে unique data distribution এ সিস্টেমের মধ্যে ভারসাম্য থাকে।

Data Distribution Key নির্বাচন

Data Distribution Key (DDK) নির্বাচন করা অত্যন্ত গুরুত্বপূর্ণ, কারণ এটি নির্ধারণ করে ডেটা কীভাবে সিস্টেমের বিভিন্ন নোডে বিতরণ হবে। টেরাডেটায় সাধারণত নিম্নলিখিত পদ্ধতিতে DDK নির্বাচন করা হয়:

Primary Index: একে প্রধান ডিস্ট্রিবিউশন কী (Primary Distribution Key) বলা হয়। এটি টেবিলের মধ্যে ডেটা বিতরণের জন্য ব্যবহৃত হয় এবং সাধারণত কলামের মানের উপর ভিত্তি করে হ্যাশ ভ্যালু তৈরি করে।
Secondary Index: যদিও এটি মূল ডিস্ট্রিবিউশন কী নয়, তবে এটি আরও দ্রুত ডেটা অনুসন্ধানের জন্য সহায়ক হতে পারে।

সারাংশ

Partitioned Tables এবং Data Distribution Techniques টেরাডেটার পারফরম্যান্স এবং স্কেলেবিলিটি উন্নত করতে গুরুত্বপূর্ণ ভূমিকা পালন করে। পার্টিশনিং ডেটাকে কার্যকরভাবে ভাগ করতে সাহায্য করে, যাতে ডেটাবেসের কুয়েরি এবং অপারেশন দ্রুত হয়। ডেটা ডিস্ট্রিবিউশন কৌশলগুলো সঠিকভাবে নির্বাচিত হলে, সিস্টেমের পারফরম্যান্স এবং স্থিতিশীলতা বৃদ্ধি পায়। Teradata-এ সঠিক পার্টিশনিং এবং ডিস্ট্রিবিউশন কৌশল ব্যবহার করলে ডেটার প্রক্রিয়াকরণ আরও দ্রুত এবং দক্ষ হয়।

Content added By

Rezwan Siddiki Tamim

Teradata এর পরিচিতি Teradata Installation এবং Setup Teradata SQL Basics Teradata এর জন্য Indexing এবং Partitioning Teradata এর জন্য Data Loading Techniques

Teradata এর জন্য Table Creation

Teradata তে Table Creation এর প্রাথমিক পদক্ষেপ

1. CREATE TABLE কমান্ড

Table Creation এর উদাহরণ

1. সাধারণ Table Creation

2. Foreign Key সহ Table Creation

বিভিন্ন Data Type

কনস্ট্রেইন (Constraints)

Teradata তে Table Creation এর পরবর্তী পদক্ষেপ

সারাংশ

Table Create এবং Drop করা

১. টেবিল তৈরি করা (CREATE TABLE)

টেবিল তৈরি করার সঠিক সিনট্যাক্স:

উদাহরণ:

২. টেবিল তৈরি করার অতিরিক্ত অপশন

উদাহরণ (অতিরিক্ত অপশন):

৩. টেবিল মুছে ফেলা (DROP TABLE)

টেবিল মুছে ফেলার সঠিক সিনট্যাক্স:

উদাহরণ:

৪. টেবিল মুছে ফেলার অতিরিক্ত অপশন

উদাহরণ:

সারাংশ

Primary Key, Foreign Key এবং Unique Constraints

Primary Key

বৈশিষ্ট্য:

ব্যবহার:

Foreign Key

বৈশিষ্ট্য:

ব্যবহার:

Unique Constraint

বৈশিষ্ট্য:

ব্যবহার:

Primary Key, Foreign Key এবং Unique Constraints এর মধ্যে পার্থক্য

সারাংশ

Primary এবং Secondary Index এর ব্যবহার

Primary Index (PI)

Primary Index এর বৈশিষ্ট্য:

Primary Index এর ব্যবহার:

Secondary Index (SI)

Secondary Index এর বৈশিষ্ট্য:

Secondary Index এর ব্যবহার:

Primary Index এবং Secondary Index এর মধ্যে পার্থক্য

সারাংশ

Partitioned Tables এবং Data Distribution Techniques

Partitioned Tables কী?

Partitioning Types in Teradata

1. Range Partitioning:

2. Hash Partitioning:

Data Distribution Techniques

1. Even Data Distribution:

2. Skewed Data Distribution:

3. Non-Unique and Unique Data Distribution:

Data Distribution Key নির্বাচন

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!