Apache Tajo-এর মধ্যে টেবিল দুটি ভিন্ন ধরন রয়েছে: Managed Tables এবং External Tables। এই টেবিলগুলোর ব্যবহার এবং সংরক্ষণ পদ্ধতি বিভিন্ন, যা ব্যবহারকারীর ডেটা ব্যবস্থাপনা এবং প্রসেসিং চাহিদার উপর ভিত্তি করে নির্ধারিত হয়।
Managed Tables
সংজ্ঞা
Managed Tables হলো Tajo দ্বারা সম্পূর্ণ নিয়ন্ত্রিত টেবিল। এই টেবিলের ডেটা এবং মেটাডেটা উভয়ই Tajo-এর ব্যবস্থার অধীনে থাকে।
বৈশিষ্ট্য
- ডেটা স্টোরেজ: Tajo ডেটা HDFS (Hadoop Distributed File System)-এ সংরক্ষণ করে।
- অটোমেটিক ম্যানেজমেন্ট: টেবিল তৈরি, আপডেট, এবং মুছে ফেলার সময় ডেটা Tajo নিজেই পরিচালনা করে।
- ডেটা অপসারণ: Managed টেবিল ড্রপ করলে টেবিলের ডেটাও ডিলিট হয়ে যায়।
টেবিল তৈরির উদাহরণ
CREATE TABLE managed_table (
id INT,
name TEXT,
salary FLOAT
);
ব্যবহারের সুবিধা
- সহজ ব্যবস্থাপনা।
- ডেটা এবং মেটাডেটা একত্রে Tajo দ্বারা নিয়ন্ত্রিত।
- ছোট বা মাঝারি আকারের ডেটাসেট ব্যবস্থাপনায় কার্যকর।
সীমাবদ্ধতা
- ডেটা সরাসরি Tajo-এর নিয়ন্ত্রণে থাকায় অন্যান্য সিস্টেম থেকে সরাসরি অ্যাক্সেস সীমিত।
External Tables
সংজ্ঞা
External Tables হলো টেবিল, যেখানে ডেটা Tajo দ্বারা নিয়ন্ত্রিত নয়। ডেটা বাহ্যিক উৎসে থাকে, যেমন HDFS, Amazon S3, বা অন্য কোনো ফাইল সিস্টেম। Tajo এই ডেটা প্রসেস করে, কিন্তু এটি সংরক্ষণ বা পরিচালনা করে না।
বৈশিষ্ট্য
- ডেটার মালিকানা: ডেটা বাহ্যিক সোর্সে থাকে এবং Tajo এটি সরাসরি সংশোধন করে না।
- ডেটা সংরক্ষণ: ডেটার অবস্থান এবং ফরম্যাটের তথ্য শুধুমাত্র মেটাডেটা আকারে Tajo-এর ক্যাটালগে থাকে।
- ড্রপ করলে ডেটা অপরিবর্তিত: External টেবিল ড্রপ করলে ডেটা মূল উৎসে থেকে যায়।
টেবিল তৈরির উদাহরণ
CREATE EXTERNAL TABLE external_table (
id INT,
name TEXT,
salary FLOAT
)
USING CSV
LOCATION 'hdfs://path/to/external/data';
ব্যবহারের সুবিধা
- বড় আকারের ডেটাসেটের জন্য কার্যকর।
- ডেটা বিভিন্ন সিস্টেম থেকে ব্যবহার করা যায়।
- Tajo থেকে ডেটা মুছে ফেলার ঝুঁকি নেই।
সীমাবদ্ধতা
- Tajo ডেটা পরিচালনা করে না, তাই ব্যবস্থাপনায় অতিরিক্ত তত্ত্বাবধানের প্রয়োজন।
- ডেটা সোর্স অ্যাক্সেসযোগ্য না হলে কুয়েরি চালানো সম্ভব নয়।
Managed এবং External Tables এর তুলনা
| বৈশিষ্ট্য | Managed Tables | External Tables |
|---|---|---|
| ডেটার অবস্থান | Tajo দ্বারা পরিচালিত (HDFS)। | বাহ্যিক সোর্সে থাকে। |
| ডেটা মুছে ফেলা | টেবিল ড্রপ করলে ডেটা মুছে যায়। | টেবিল ড্রপ করলে ডেটা অপরিবর্তিত থাকে। |
| ডেটা ব্যবস্থাপনা | Tajo ডেটা নিজেই পরিচালনা করে। | বাহ্যিক সিস্টেম দ্বারা পরিচালিত। |
| ব্যবহার ক্ষেত্র | ছোট/মাঝারি ডেটাসেট। | বড় ডেটাসেট বা বহিরাগত ডেটা। |
| ফ্লেক্সিবিলিটি | কম। | বেশি। |
কোনটি বেছে নিবেন?
- Managed Tables বেছে নিন যদি:
- ডেটা পুরোপুরি Tajo দ্বারা নিয়ন্ত্রিত রাখতে চান।
- ছোট বা মাঝারি আকারের ডেটাসেট ব্যবহারের প্রয়োজন হয়।
- External Tables বেছে নিন যদি:
- ডেটা অন্য সিস্টেমেও ব্যবহারের প্রয়োজন হয়।
- বড় ডেটাসেট পরিচালনার জন্য Tajo ব্যবহার করেন।
Apache Tajo এর Managed এবং External Tables ব্যবহারকারীদের ডেটা ব্যবস্থাপনায় নমনীয়তা এবং নিয়ন্ত্রণ দেয়। আপনার ডেটা স্ট্রাকচার এবং প্রসেসিং চাহিদার ভিত্তিতে সঠিক টেবিল টাইপ নির্বাচন করা উচিত।
Read more