Tajo এর Table Types: Managed এবং External Tables

Tajo Tables এবং Data Storage - অ্যাপাচি তাজো  (Apache Tajo) - Big Data and Analytics

437

Apache Tajo-এর মধ্যে টেবিল দুটি ভিন্ন ধরন রয়েছে: Managed Tables এবং External Tables। এই টেবিলগুলোর ব্যবহার এবং সংরক্ষণ পদ্ধতি বিভিন্ন, যা ব্যবহারকারীর ডেটা ব্যবস্থাপনা এবং প্রসেসিং চাহিদার উপর ভিত্তি করে নির্ধারিত হয়।


Managed Tables

সংজ্ঞা

Managed Tables হলো Tajo দ্বারা সম্পূর্ণ নিয়ন্ত্রিত টেবিল। এই টেবিলের ডেটা এবং মেটাডেটা উভয়ই Tajo-এর ব্যবস্থার অধীনে থাকে।

বৈশিষ্ট্য

  1. ডেটা স্টোরেজ: Tajo ডেটা HDFS (Hadoop Distributed File System)-এ সংরক্ষণ করে।
  2. অটোমেটিক ম্যানেজমেন্ট: টেবিল তৈরি, আপডেট, এবং মুছে ফেলার সময় ডেটা Tajo নিজেই পরিচালনা করে।
  3. ডেটা অপসারণ: Managed টেবিল ড্রপ করলে টেবিলের ডেটাও ডিলিট হয়ে যায়।

টেবিল তৈরির উদাহরণ

CREATE TABLE managed_table (
    id INT,
    name TEXT,
    salary FLOAT
);

ব্যবহারের সুবিধা

  • সহজ ব্যবস্থাপনা।
  • ডেটা এবং মেটাডেটা একত্রে Tajo দ্বারা নিয়ন্ত্রিত।
  • ছোট বা মাঝারি আকারের ডেটাসেট ব্যবস্থাপনায় কার্যকর।

সীমাবদ্ধতা

  • ডেটা সরাসরি Tajo-এর নিয়ন্ত্রণে থাকায় অন্যান্য সিস্টেম থেকে সরাসরি অ্যাক্সেস সীমিত।

External Tables

সংজ্ঞা

External Tables হলো টেবিল, যেখানে ডেটা Tajo দ্বারা নিয়ন্ত্রিত নয়। ডেটা বাহ্যিক উৎসে থাকে, যেমন HDFS, Amazon S3, বা অন্য কোনো ফাইল সিস্টেম। Tajo এই ডেটা প্রসেস করে, কিন্তু এটি সংরক্ষণ বা পরিচালনা করে না।

বৈশিষ্ট্য

  1. ডেটার মালিকানা: ডেটা বাহ্যিক সোর্সে থাকে এবং Tajo এটি সরাসরি সংশোধন করে না।
  2. ডেটা সংরক্ষণ: ডেটার অবস্থান এবং ফরম্যাটের তথ্য শুধুমাত্র মেটাডেটা আকারে Tajo-এর ক্যাটালগে থাকে।
  3. ড্রপ করলে ডেটা অপরিবর্তিত: External টেবিল ড্রপ করলে ডেটা মূল উৎসে থেকে যায়।

টেবিল তৈরির উদাহরণ

CREATE EXTERNAL TABLE external_table (
    id INT,
    name TEXT,
    salary FLOAT
)
USING CSV
LOCATION 'hdfs://path/to/external/data';

ব্যবহারের সুবিধা

  • বড় আকারের ডেটাসেটের জন্য কার্যকর।
  • ডেটা বিভিন্ন সিস্টেম থেকে ব্যবহার করা যায়।
  • Tajo থেকে ডেটা মুছে ফেলার ঝুঁকি নেই।

সীমাবদ্ধতা

  • Tajo ডেটা পরিচালনা করে না, তাই ব্যবস্থাপনায় অতিরিক্ত তত্ত্বাবধানের প্রয়োজন।
  • ডেটা সোর্স অ্যাক্সেসযোগ্য না হলে কুয়েরি চালানো সম্ভব নয়।

Managed এবং External Tables এর তুলনা

বৈশিষ্ট্যManaged TablesExternal Tables
ডেটার অবস্থানTajo দ্বারা পরিচালিত (HDFS)।বাহ্যিক সোর্সে থাকে।
ডেটা মুছে ফেলাটেবিল ড্রপ করলে ডেটা মুছে যায়।টেবিল ড্রপ করলে ডেটা অপরিবর্তিত থাকে।
ডেটা ব্যবস্থাপনাTajo ডেটা নিজেই পরিচালনা করে।বাহ্যিক সিস্টেম দ্বারা পরিচালিত।
ব্যবহার ক্ষেত্রছোট/মাঝারি ডেটাসেট।বড় ডেটাসেট বা বহিরাগত ডেটা।
ফ্লেক্সিবিলিটিকম।বেশি।

কোনটি বেছে নিবেন?

  1. Managed Tables বেছে নিন যদি:
    • ডেটা পুরোপুরি Tajo দ্বারা নিয়ন্ত্রিত রাখতে চান।
    • ছোট বা মাঝারি আকারের ডেটাসেট ব্যবহারের প্রয়োজন হয়।
  2. External Tables বেছে নিন যদি:
    • ডেটা অন্য সিস্টেমেও ব্যবহারের প্রয়োজন হয়।
    • বড় ডেটাসেট পরিচালনার জন্য Tajo ব্যবহার করেন।

Apache Tajo এর Managed এবং External Tables ব্যবহারকারীদের ডেটা ব্যবস্থাপনায় নমনীয়তা এবং নিয়ন্ত্রণ দেয়। আপনার ডেটা স্ট্রাকচার এবং প্রসেসিং চাহিদার ভিত্তিতে সঠিক টেবিল টাইপ নির্বাচন করা উচিত।

Content added By
Promotion

Are you sure to start over?

Loading...