Hive এর Built-in Data Types (Primitive এবং Complex Types) গাইড ও নোট

Big Data and Analytics - হাইভ (Hive) - Data Types এবং File Formats
421

Hive, একটি SQL-অনুরূপ কুয়েরি ভাষা ব্যবহার করে Hadoop প্ল্যাটফর্মে ডেটা প্রক্রিয়া ও বিশ্লেষণ করার জন্য তৈরি। Hive বিভিন্ন ধরনের Data Types সমর্থন করে, যা Primitive Types এবং Complex Types-এ ভাগ করা যায়। এই ডেটা টাইপগুলি Hive টেবিলের কলামগুলিতে ডেটা সংরক্ষণ এবং কুয়েরি করার জন্য ব্যবহৃত হয়।

Primitive Data Types


Primitive Data Types হল মৌলিক ডেটা টাইপ, যেগুলি শুধুমাত্র একক মান ধারণ করতে পারে। Hive-এ সাধারণত যে Primitive Data Types গুলি ব্যবহার করা হয় তা হল:

১. STRING

  • ব্যাখ্যা: এটি টেক্সট ডেটা ধারণ করে, যেমন নাম, ঠিকানা ইত্যাদি।
  • উদাহরণ: 'John Doe', 'Hive Tutorial'
name STRING

২. INT

  • ব্যাখ্যা: পূর্ণসংখ্যা ধারণ করে। এটি ৪ বাইট আকারের একটি ডেটা টাইপ।
  • উদাহরণ: 10, -50
age INT

৩. BIGINT

  • ব্যাখ্যা: এটি বড় পূর্ণসংখ্যা ধারণ করতে ব্যবহৃত হয়, যা INT এর তুলনায় বড় পরিসরের মান ধারণ করতে পারে।
  • উদাহরণ: 123456789, -9876543210
population BIGINT

৪. FLOAT

  • ব্যাখ্যা: দশমিক সংখ্যা ধারণ করার জন্য ব্যবহৃত হয়। এটি ৪ বাইট আকারের একটি ফ্লোটিং পয়েন্ট টাইপ।
  • উদাহরণ: 3.14, -0.001
price FLOAT

৫. DOUBLE

  • ব্যাখ্যা: এটি FLOAT এর মতো, তবে এর মধ্যে আরও সঠিকতার জন্য ডাবল প্রিসিশন ফ্লোটিং পয়েন্ট মান থাকে। এটি ৮ বাইট আকারের একটি ডেটা টাইপ।
  • উদাহরণ: 3.14159, -0.123456
distance DOUBLE

৬. BOOLEAN

  • ব্যাখ্যা: এটি সত্য (TRUE) বা মিথ্যা (FALSE) মান ধারণ করে।
  • উদাহরণ: TRUE, FALSE
is_active BOOLEAN

৭. DATE

  • ব্যাখ্যা: একটি নির্দিষ্ট দিন, মাস এবং বছরের তথ্য ধারণ করে।
  • উদাহরণ: '2024-12-17'
date_of_birth DATE

৮. TIMESTAMP

  • ব্যাখ্যা: একটি নির্দিষ্ট সময় (ঘণ্টা, মিনিট, সেকেন্ড) সহ তারিখ ধারণ করে। এটি সময় সহ দিন, মাস এবং বছর তথ্য ধারণ করে।
  • উদাহরণ: '2024-12-17 14:30:00'
created_at TIMESTAMP

৯. DECIMAL

  • ব্যাখ্যা: এটি দশমিক মান ধারণ করে, যা নির্দিষ্ট সংখ্যক ডিগিট এবং দশমিক স্থান ধরে। এটি সঠিক গাণিতিক হিসাবের জন্য ব্যবহৃত হয়।
  • উদাহরণ: 123.45, -6789.01
balance DECIMAL(10,2)

Complex Data Types


Complex Data Types এমন ডেটা টাইপ যা একাধিক মান ধারণ করতে পারে। Hive-এ কিছু সাধারণ Complex Data Types রয়েছে, যা ব্যবহারকারীরা তালিকা, ম্যাপ, এবং স্ট্রাকচারের মতো জটিল তথ্য গঠন তৈরি করতে ব্যবহার করতে পারেন।

১. ARRAY

  • ব্যাখ্যা: এটি এক ধরনের তালিকা (list), যা একটি নির্দিষ্ট ধরনের একাধিক মান ধারণ করতে পারে।
  • উদাহরণ: [1, 2, 3, 4], ['apple', 'banana', 'cherry']
hobbies ARRAY<STRING>

২. MAP

  • ব্যাখ্যা: এটি কী (key)-ভ্যালু (value) পেয়ার ধারণ করে, যেখানে প্রতিটি কী একটি ইউনিক মান হয়।
  • উদাহরণ: {'key1': 'value1', 'key2': 'value2'}, {'name': 'John', 'age': '30'}
properties MAP<STRING, STRING>

৩. STRUCT

  • ব্যাখ্যা: এটি একটি কমপ্লেক্স টাইপ যা একাধিক উপাদান ধারণ করতে পারে, যেখানে প্রতিটি উপাদান আলাদা ডেটা টাইপ হতে পারে।
  • উদাহরণ: {name: 'John', age: 30}, {id: 1, name: 'Apple', price: 50.5}
address STRUCT<street: STRING, city: STRING, zip: INT>

৪. UNIONTYPE

  • ব্যাখ্যা: এটি এমন একটি ডেটা টাইপ যা একাধিক ডেটা টাইপের মধ্যে যেকোনো একটি মান ধারণ করতে পারে।
  • উদাহরণ: int বা string মধ্যে যেকোনো একটি মান ধারণ করতে পারে। এটি সাধারণত সেক্ষেত্রে ব্যবহৃত হয় যেখানে একটি কলামে বিভিন্ন ধরনের ডেটা থাকতে পারে।
data UNIONTYPE<STRING, INT>

Hive Data Types এর ব্যবহার উদাহরণ


টেবিল তৈরি:

CREATE TABLE employee_details (
  id INT,
  name STRING,
  salary FLOAT,
  is_active BOOLEAN,
  date_of_birth DATE,
  joining_date TIMESTAMP,
  address STRUCT<street: STRING, city: STRING, zip: INT>,
  hobbies ARRAY<STRING>,
  extra_details MAP<STRING, STRING>
)
STORED AS TEXTFILE;

এখানে employee_details টেবিলটি বিভিন্ন Primitive এবং Complex Data Types সমর্থন করে।

ডেটা ইনসার্ট:

INSERT INTO employee_details 
VALUES (1, 'John Doe', 55000.0, TRUE, '1990-04-25', '2024-12-17 14:30:00', 
        named_struct('street', '123 Main St', 'city', 'New York', 'zip', 10001),
        array('reading', 'travelling'), map('Hobby', 'Reading', 'Department', 'HR'));

এখানে address একটি STRUCT টাইপ, hobbies একটি ARRAY, এবং extra_details একটি MAP টাইপ ব্যবহার করা হয়েছে।


উপসংহার


Hive-এ Data Types দুটি প্রধান ক্যাটেগরিতে বিভক্ত: Primitive Types এবং Complex Types। Primitive Types সাধারণ একক মান ধারণ করে, যেমন INT, STRING, BOOLEAN ইত্যাদি, যেখানে Complex Types একাধিক মান ধারণ করতে পারে, যেমন ARRAY, MAP, STRUCT। Hive-এ ডেটা টাইপ সঠিকভাবে ব্যবহার করলে ডেটা ম্যানিপুলেশন এবং বিশ্লেষণ আরও সহজ এবং কার্যকরী হয়ে ওঠে।

Content added By
Promotion

Are you sure to start over?

Loading...