Impala ব্যবহার করে SQL (Structured Query Language) এর মাধ্যমে ডেটা বিশ্লেষণ করা সহজ এবং কার্যকরী। এর মধ্যে SELECT কোয়েরি, যেখানে ডেটার নির্দিষ্ট অংশ বা সম্পূর্ণ ডেটা বের করা হয়, এবং Aggregation Functions, যা ডেটার ওপর বিভিন্ন গণনা বা সারাংশ তৈরি করে, দুটি গুরুত্বপূর্ণ বৈশিষ্ট্য।
Basic SELECT Queries
SELECT কোয়েরি ব্যবহার করে আপনি Impala তে টেবিল থেকে ডেটা এক্সট্র্যাক্ট (extract) করতে পারেন। এটি SQL-এর সবচেয়ে মৌলিক এবং গুরুত্বপূর্ণ কোয়েরি।
১. Simple SELECT Query
একটি সাধারণ SELECT কোয়েরি ব্যবহার করে আপনি একটি টেবিলের সব তথ্য বের করতে পারেন।
SELECT * FROM employees;
এখানে, * নির্দেশ করে যে আপনি সমস্ত কলাম দেখতে চান এবং employees হলো টেবিলের নাম।
২. Specific Columns SELECT Query
যদি আপনি টেবিলের নির্দিষ্ট কলামগুলি দেখতে চান, তাহলে এইভাবে কোয়েরি লিখতে হবে:
SELECT first_name, last_name FROM employees;
এখানে, first_name এবং last_name হলো টেবিলের কলাম নাম এবং আপনি এই কলামগুলির ডেটা বের করতে চাচ্ছেন।
৩. SELECT Query with WHERE Clause
যদি আপনি নির্দিষ্ট শর্তে ডেটা দেখতে চান, তাহলে WHERE ক্লজ ব্যবহার করতে হবে। উদাহরণস্বরূপ:
SELECT * FROM employees WHERE department = 'Sales';
এখানে, department = 'Sales' শর্তের মাধ্যমে শুধু "Sales" বিভাগের কর্মীদের তথ্য বের করা হবে।
৪. SELECT Query with LIMIT Clause
কোনো নির্দিষ্ট সংখ্যক রেকর্ড পেতে LIMIT ক্লজ ব্যবহার করা হয়:
SELECT * FROM employees LIMIT 10;
এটি প্রথম ১০টি রেকর্ড দেখাবে।
Aggregation Functions
Impala তে Aggregation Functions ব্যবহৃত হয় ডেটা সেটের ওপর গাণিতিক বা সারাংশমূলক কাজ করার জন্য। এগুলোর মধ্যে প্রধান কিছু হলো COUNT, SUM, AVG, MIN, এবং MAX। এই ফাংশনগুলো সাধারণত GROUP BY ক্লজের সঙ্গে ব্যবহার করা হয়, কিন্তু এককভাবে ও ব্যবহার করা যেতে পারে।
১. COUNT Function
COUNT ফাংশন ব্যবহার করে আপনি কোনো কলামে মোট রেকর্ডের সংখ্যা বের করতে পারেন।
SELECT COUNT(*) FROM employees;
এটি employees টেবিলের মোট রেকর্ড সংখ্যা দেখাবে।
২. SUM Function
SUM ফাংশন ব্যবহার করে আপনি একটি কলামে সব মানের যোগফল বের করতে পারেন। উদাহরণস্বরূপ:
SELECT SUM(salary) FROM employees;
এটি employees টেবিলের salary কলামের সব মান যোগফল বের করবে।
৩. AVG Function
AVG ফাংশন ব্যবহার করে আপনি একটি কলামের গড় (average) মান বের করতে পারেন।
SELECT AVG(salary) FROM employees;
এটি employees টেবিলের salary কলামের গড় মান দেখাবে।
৪. MIN Function
MIN ফাংশন ব্যবহার করে একটি কলামের সর্বনিম্ন মান বের করা যায়। উদাহরণস্বরূপ:
SELECT MIN(salary) FROM employees;
এটি employees টেবিলের salary কলামের সর্বনিম্ন মান দেখাবে।
৫. MAX Function
MAX ফাংশন ব্যবহার করে একটি কলামের সর্বোচ্চ মান বের করা যায়। উদাহরণ:
SELECT MAX(salary) FROM employees;
এটি employees টেবিলের salary কলামের সর্বোচ্চ মান দেখাবে।
GROUP BY Clause with Aggregation Functions
GROUP BY ক্লজ ব্যবহৃত হয় ডেটাকে কিছু নির্দিষ্ট কলামের ভিত্তিতে গ্রুপিং করার জন্য এবং তারপর অ্যাগ্রিগেশন ফাংশনগুলির সাথে কাজ করতে। উদাহরণস্বরূপ:
১. Grouping by a Column
যদি আপনি একটি কলামের ভিত্তিতে ডেটা গ্রুপ করতে চান এবং তার ওপর অ্যাগ্রিগেশন ফাংশন প্রয়োগ করতে চান, তাহলে এইভাবে কোয়েরি লিখতে হবে:
SELECT department, AVG(salary) FROM employees GROUP BY department;
এটি employees টেবিলের প্রতিটি department অনুযায়ী গড় বেতন দেখাবে।
২. Grouping by Multiple Columns
একাধিক কলামের ভিত্তিতে গ্রুপিং করতে পারবেন:
SELECT department, job_title, AVG(salary) FROM employees GROUP BY department, job_title;
এটি department এবং job_title এর ভিত্তিতে গড় বেতন দেখাবে।
এভাবে, Apache Impala তে Basic SELECT Queries এবং Aggregation Functions ব্যবহার করে আপনি ডেটার ওপর বিস্তারিত বিশ্লেষণ এবং কার্যকরী ফলাফল পেতে পারেন।
Read more