Nested Queries এবং Correlated Subqueries

Big Data and Analytics - অ্যাপাচি ইমপালা (Apache Impala) - Impala এর জন্য Complex Queries এবং Subqueries
201

Impala তে Nested Queries এবং Correlated Subqueries দুটি গুরুত্বপূর্ণ কনসেপ্ট, যা SQL কোয়েরি ব্যবহারের মাধ্যমে জটিল বিশ্লেষণ এবং ডেটা এক্সেস করতে সাহায্য করে। এই দুটি কৌশল ব্যবহার করে, আপনি বিভিন্ন টেবিলের মধ্যে সম্পর্ক তৈরি করতে পারেন এবং বিভিন্ন ধরণের তথ্য একসাথে প্রসেস করতে পারেন।


Nested Queries

১. Nested Query কী?

Nested Query, যাকে Subquery বা Inner Query বলা হয়, এমন একটি কোয়েরি যা অন্য কোয়েরির ভিতরে থাকে। এটি সাধারণত Main Query বা Outer Query এর জন্য ডেটা প্রদান করে। Nested Query একাধিক স্তরের কোয়েরি থাকতে পারে এবং সাধারণত SELECT, INSERT, UPDATE, অথবা DELETE স্টেটমেন্টের অংশ হিসেবে ব্যবহৃত হয়।

২. Nested Query এর ব্যবহার

Nested Query ব্যবহৃত হয় যখন আপনি একটি কোয়েরির আউটপুটকে অন্য কোয়েরির ইনপুট হিসেবে ব্যবহার করতে চান। এটি সাধারণত একটি বা একাধিক কলামের জন্য ব্যবহার করা হয়, যা পরবর্তীতে মূল কোয়েরির অংশ হিসেবে কাজ করে।

উদাহরণ:

SELECT emp_name 
FROM employee 
WHERE emp_id IN (SELECT emp_id FROM department WHERE dept_name = 'Sales');

এখানে, ভিতরের SELECT কোয়েরি প্রথমে department টেবিল থেকে Sales ডিপার্টমেন্টের emp_id সংগ্রহ করে, এবং বাইরে থাকা SELECT কোয়েরি সেই emp_id গুলির সাথে মেলানো employee টেবিলের তথ্য বের করে।

৩. Types of Nested Queries in Impala

  • Single-level nested queries: যেখানে শুধুমাত্র একটি উপ-কোয়েরি থাকে।
  • Multiple-level nested queries: যেখানে একাধিক স্তরের উপ-কোয়েরি থাকতে পারে।
  • Scalar subqueries: একটি উপ-কোয়েরি যা একক মান (scalar value) প্রদান করে।
  • IN subqueries: উপ-কোয়েরি যেখানে একাধিক মান ফিরে আসে এবং মূল কোয়েরি সেগুলি তুলনা করে।

Correlated Subqueries

১. Correlated Subquery কী?

Correlated Subquery একটি বিশেষ ধরনের Nested Query যেখানে ভিতরের কোয়েরি (Subquery) বাইরের কোয়েরি (Outer Query) এর প্রতিটি রো (row) এর জন্য পুনরায় চালানো হয়। এটি বাইরের কোয়েরির প্রতিটি রো এর সাথে সম্পর্কিত থাকে এবং বাইরের কোয়েরির কোন কলামের মানের উপর নির্ভর করে কাজ করে। Correlated Subqueries সাধারনত আরও জটিল এবং অনেক ক্ষেত্রে ইনডিপেনডেন্ট কোয়েরির তুলনায় বেশি কার্যকরী হতে পারে।

২. Correlated Subquery এর ব্যবহার

Correlated Subquery ব্যবহার করা হয় যখন বাইরের কোয়েরির প্রতিটি রো এর জন্য নির্দিষ্ট একটি শর্ত প্রযোজ্য হতে হয়। এতে বাইরের কোয়েরি এবং ভিতরের কোয়েরি একে অপরের সাথে সম্পর্কিত থাকে।

উদাহরণ:

SELECT emp_name, emp_id
FROM employee e1
WHERE EXISTS (SELECT 1 FROM department d1 WHERE e1.emp_id = d1.emp_id AND d1.dept_name = 'Sales');

এখানে, বাইরের কোয়েরি employee টেবিল থেকে emp_name এবং emp_id বের করে, এবং ভিতরের কোয়েরি (correlated subquery) প্রতিটি employee রো এর জন্য চেক করে যে তার emp_id Sales ডিপার্টমেন্টের সাথে মিলে কিনা। ভিতরের কোয়েরি বাইরের কোয়েরির রো এর সাথে সম্পর্কিত (correlated)।

৩. Types of Correlated Subqueries

  • EXISTS Subqueries: যেখানে বাইরের কোয়েরি কোনও রো এর জন্য ভিতরের কোয়েরির ফলাফল মেলানোর জন্য চেক করে।
  • Comparison Subqueries: যেখানে বাইরের কোয়েরির কলামের সাথে ভিতরের কোয়েরির আউটপুটের তুলনা করা হয় (যেমন: =, >, <, IN ইত্যাদি)।
  • ANY or ALL Subqueries: যেখানে বাইরের কোয়েরির একটি মানের সাথে ভিতরের কোয়েরি থেকে ফিরে আসা একাধিক মানের তুলনা করা হয়।

Nested Queries এবং Correlated Subqueries এর মধ্যে পার্থক্য

বৈশিষ্ট্যNested QueryCorrelated Subquery
সম্পর্কবাইরের কোয়েরির সাথে সম্পর্কিত নয়।বাইরের কোয়েরির প্রতিটি রো এর সাথে সম্পর্কিত।
এক্সিকিউশনএকবারে একক উপ-কোয়েরি এক্সিকিউট করা হয়।বাইরের কোয়েরির প্রতিটি রো এর জন্য ভিতরের কোয়েরি পুনরায় এক্সিকিউট করা হয়।
ডেটার আউটপুটএকক বা একাধিক মান ফিরে আসে।প্রতিটি রো এর জন্য নির্দিষ্ট মান ফিরে আসে।
কার্যকারিতাসাধারণভাবে কমপ্লেক্সিটি কম, তবে কিছু ক্ষেত্রে স্লো হতে পারে।সাধারণভাবে বেশি জটিল, তবে নির্দিষ্ট পরিস্থিতিতে কার্যকরী।

Impala তে Nested Queries এবং Correlated Subqueries এর পারফরম্যান্স

Impala তে Nested Queries এবং Correlated Subqueries উভয়েই কার্যকরী হতে পারে, তবে যখন খুব বড় ডেটাসেটের সাথে কাজ করা হয়, তখন Correlated Subqueries একটু স্লো হতে পারে কারণ প্রতিটি বাইরের রো এর জন্য ভিতরের কোয়েরি পুনরায় চালানো হয়। তবে, Indexed Columns বা Optimized Execution Plans ব্যবহার করে এই ধরনের কোয়েরির পারফরম্যান্স উন্নত করা সম্ভব।

Tips for Optimizing Nested and Correlated Subqueries in Impala:

  • Indexes: Proper indexing can significantly improve query performance.
  • Join Optimization: Instead of using correlated subqueries, try rewriting queries to use joins where possible.
  • Use of EXISTS/IN: In many cases, rewriting correlated subqueries with EXISTS or IN can improve performance.

এভাবে, Impala তে Nested Queries এবং Correlated Subqueries ব্যবহার করে আপনি আরও জটিল ডেটা বিশ্লেষণ করতে পারেন। তবে, কার্যকারিতা এবং কোয়েরি পারফরম্যান্স উন্নত করার জন্য সঠিক কৌশল বাছাই করা খুব গুরুত্বপূর্ণ।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...