Basic SELECT Queries এবং Aggregation Functions

Impala SQL Queries এর মৌলিক ধারণা - অ্যাপাচি ইমপালা (Apache Impala) - Big Data and Analytics

379

Impala ব্যবহার করে SQL (Structured Query Language) এর মাধ্যমে ডেটা বিশ্লেষণ করা সহজ এবং কার্যকরী। এর মধ্যে SELECT কোয়েরি, যেখানে ডেটার নির্দিষ্ট অংশ বা সম্পূর্ণ ডেটা বের করা হয়, এবং Aggregation Functions, যা ডেটার ওপর বিভিন্ন গণনা বা সারাংশ তৈরি করে, দুটি গুরুত্বপূর্ণ বৈশিষ্ট্য।


Basic SELECT Queries

SELECT কোয়েরি ব্যবহার করে আপনি Impala তে টেবিল থেকে ডেটা এক্সট্র্যাক্ট (extract) করতে পারেন। এটি SQL-এর সবচেয়ে মৌলিক এবং গুরুত্বপূর্ণ কোয়েরি।

১. Simple SELECT Query

একটি সাধারণ SELECT কোয়েরি ব্যবহার করে আপনি একটি টেবিলের সব তথ্য বের করতে পারেন।

SELECT * FROM employees;

এখানে, * নির্দেশ করে যে আপনি সমস্ত কলাম দেখতে চান এবং employees হলো টেবিলের নাম।

২. Specific Columns SELECT Query

যদি আপনি টেবিলের নির্দিষ্ট কলামগুলি দেখতে চান, তাহলে এইভাবে কোয়েরি লিখতে হবে:

SELECT first_name, last_name FROM employees;

এখানে, first_name এবং last_name হলো টেবিলের কলাম নাম এবং আপনি এই কলামগুলির ডেটা বের করতে চাচ্ছেন।

৩. SELECT Query with WHERE Clause

যদি আপনি নির্দিষ্ট শর্তে ডেটা দেখতে চান, তাহলে WHERE ক্লজ ব্যবহার করতে হবে। উদাহরণস্বরূপ:

SELECT * FROM employees WHERE department = 'Sales';

এখানে, department = 'Sales' শর্তের মাধ্যমে শুধু "Sales" বিভাগের কর্মীদের তথ্য বের করা হবে।

৪. SELECT Query with LIMIT Clause

কোনো নির্দিষ্ট সংখ্যক রেকর্ড পেতে LIMIT ক্লজ ব্যবহার করা হয়:

SELECT * FROM employees LIMIT 10;

এটি প্রথম ১০টি রেকর্ড দেখাবে।


Aggregation Functions

Impala তে Aggregation Functions ব্যবহৃত হয় ডেটা সেটের ওপর গাণিতিক বা সারাংশমূলক কাজ করার জন্য। এগুলোর মধ্যে প্রধান কিছু হলো COUNT, SUM, AVG, MIN, এবং MAX। এই ফাংশনগুলো সাধারণত GROUP BY ক্লজের সঙ্গে ব্যবহার করা হয়, কিন্তু এককভাবে ও ব্যবহার করা যেতে পারে।

১. COUNT Function

COUNT ফাংশন ব্যবহার করে আপনি কোনো কলামে মোট রেকর্ডের সংখ্যা বের করতে পারেন।

SELECT COUNT(*) FROM employees;

এটি employees টেবিলের মোট রেকর্ড সংখ্যা দেখাবে।

২. SUM Function

SUM ফাংশন ব্যবহার করে আপনি একটি কলামে সব মানের যোগফল বের করতে পারেন। উদাহরণস্বরূপ:

SELECT SUM(salary) FROM employees;

এটি employees টেবিলের salary কলামের সব মান যোগফল বের করবে।

৩. AVG Function

AVG ফাংশন ব্যবহার করে আপনি একটি কলামের গড় (average) মান বের করতে পারেন।

SELECT AVG(salary) FROM employees;

এটি employees টেবিলের salary কলামের গড় মান দেখাবে।

৪. MIN Function

MIN ফাংশন ব্যবহার করে একটি কলামের সর্বনিম্ন মান বের করা যায়। উদাহরণস্বরূপ:

SELECT MIN(salary) FROM employees;

এটি employees টেবিলের salary কলামের সর্বনিম্ন মান দেখাবে।

৫. MAX Function

MAX ফাংশন ব্যবহার করে একটি কলামের সর্বোচ্চ মান বের করা যায়। উদাহরণ:

SELECT MAX(salary) FROM employees;

এটি employees টেবিলের salary কলামের সর্বোচ্চ মান দেখাবে।


GROUP BY Clause with Aggregation Functions

GROUP BY ক্লজ ব্যবহৃত হয় ডেটাকে কিছু নির্দিষ্ট কলামের ভিত্তিতে গ্রুপিং করার জন্য এবং তারপর অ্যাগ্রিগেশন ফাংশনগুলির সাথে কাজ করতে। উদাহরণস্বরূপ:

১. Grouping by a Column

যদি আপনি একটি কলামের ভিত্তিতে ডেটা গ্রুপ করতে চান এবং তার ওপর অ্যাগ্রিগেশন ফাংশন প্রয়োগ করতে চান, তাহলে এইভাবে কোয়েরি লিখতে হবে:

SELECT department, AVG(salary) FROM employees GROUP BY department;

এটি employees টেবিলের প্রতিটি department অনুযায়ী গড় বেতন দেখাবে।

২. Grouping by Multiple Columns

একাধিক কলামের ভিত্তিতে গ্রুপিং করতে পারবেন:

SELECT department, job_title, AVG(salary) FROM employees GROUP BY department, job_title;

এটি department এবং job_title এর ভিত্তিতে গড় বেতন দেখাবে।


এভাবে, Apache Impala তে Basic SELECT Queries এবং Aggregation Functions ব্যবহার করে আপনি ডেটার ওপর বিস্তারিত বিশ্লেষণ এবং কার্যকরী ফলাফল পেতে পারেন।

Content added By
Promotion

Are you sure to start over?

Loading...