SELECT, WHERE, GROUP BY, এবং HAVING Clauses

Spark SQL Queries - স্পার্ক এসকিউএল (Spark SQL) - Big Data and Analytics

277

Spark SQL ব্যবহারকারীদের SQL কোয়ারি লেখার মাধ্যমে ডেটা প্রসেস করার সুবিধা দেয়। SQL-এ যেসব স্ট্যান্ডার্ড ক্লজ (clauses) রয়েছে, Spark SQL-এ সেগুলি সমর্থিত। এর মধ্যে SELECT, WHERE, GROUP BY, এবং HAVING ক্লজ অন্যতম। চলুন, এই ক্লজগুলো কীভাবে Spark SQL-এ ব্যবহার করা হয় তা দেখি।

SELECT ক্লজ

SELECT ক্লজ হল SQL কোয়ারির প্রধান অংশ, যা ডেটাবেস থেকে ডেটা নির্বাচন করার জন্য ব্যবহৃত হয়। Spark SQL-এ SELECT ক্লজ ব্যবহার করে একটি বা একাধিক কলাম নির্বাচন করা যায়।

SELECT উদাহরণ:

# Spark SQL দিয়ে SELECT কোয়ারি
spark.sql("SELECT column1, column2 FROM table_name").show()

এখানে:

column1, column2: নির্বাচিত কলামগুলো।
table_name: যে টেবিল বা DataFrame থেকে ডেটা নির্বাচন করা হবে।

SELECT সব কলাম নির্বাচন করতে:

spark.sql("SELECT * FROM table_name").show()

এটি টেবিলের সব কলামকে নির্বাচন করবে।

WHERE ক্লজ

WHERE ক্লজ ডেটা ফিল্টার করার জন্য ব্যবহৃত হয়। এটি SQL কোয়ারির মধ্যে শর্ত যুক্ত করতে সাহায্য করে, যার মাধ্যমে শুধু নির্দিষ্ট শর্ত পূর্ণ করা রেকর্ডগুলোই নির্বাচিত হয়।

WHERE উদাহরণ:

# WHERE ক্লজ দিয়ে ফিল্টার করা
spark.sql("SELECT * FROM table_name WHERE column1 > 100").show()

এখানে, column1 > 100 শর্তের অধীনে ডেটা ফিল্টার করা হয়েছে।

GROUP BY ক্লজ

GROUP BY ক্লজ ডেটাকে একটি নির্দিষ্ট কলাম বা একাধিক কলামের ভিত্তিতে গ্রুপ করার জন্য ব্যবহৃত হয়। এটি সাধারণত অ্যাগ্রিগেট ফাংশনের (যেমন COUNT, AVG, SUM) সঙ্গে ব্যবহৃত হয়।

GROUP BY উদাহরণ:

# GROUP BY ব্যবহার করে গ্রুপিং
spark.sql("SELECT column1, COUNT(*) FROM table_name GROUP BY column1").show()

এখানে, column1 এর ভিত্তিতে ডেটা গ্রুপ করা হয়েছে এবং প্রতিটি গ্রুপে কতটি রেকর্ড রয়েছে তা গণনা করা হয়েছে।

GROUP BY-এ একাধিক কলাম:

spark.sql("SELECT column1, column2, SUM(column3) FROM table_name GROUP BY column1, column2").show()

এটি column1 এবং column2 এর ভিত্তিতে ডেটা গ্রুপ করে এবং প্রতিটি গ্রুপের জন্য column3 এর মোট (sum) গণনা করবে।

HAVING ক্লজ

HAVING ক্লজ হল একটি শর্ত যেখানে আপনি GROUP BY এর পরে গ্রুপ করা ডেটার উপর শর্ত প্রয়োগ করতে পারেন। এটি WHERE ক্লজের মতো কাজ করে, তবে এটি গ্রুপ করা ডেটার জন্য ব্যবহৃত হয়।

HAVING উদাহরণ:

# HAVING ক্লজ ব্যবহার করে গ্রুপের উপর শর্ত প্রয়োগ করা
spark.sql("SELECT column1, COUNT(*) FROM table_name GROUP BY column1 HAVING COUNT(*) > 10").show()

এখানে, column1 এর ভিত্তিতে ডেটা গ্রুপ করা হয়েছে এবং তারপর শুধুমাত্র সেগুলিকে নির্বাচন করা হয়েছে যেগুলোর মধ্যে ১০টির বেশি রেকর্ড রয়েছে।

Spark SQL এ SELECT, WHERE, GROUP BY এবং HAVING ক্লজের সংক্ষিপ্ত ব্যাখ্যা:

SELECT: এটি ডেটাবেস থেকে নির্দিষ্ট কলাম বা সব কলাম নির্বাচন করতে ব্যবহৃত হয়।
WHERE: ডেটাকে শর্তের ভিত্তিতে ফিল্টার করতে ব্যবহৃত হয়।
GROUP BY: ডেটাকে নির্দিষ্ট কলামের ভিত্তিতে গ্রুপ করতে ব্যবহৃত হয়, সাধারণত অ্যাগ্রিগেট ফাংশনের সঙ্গে।
HAVING: GROUP BY ক্লজের পরে গ্রুপ করা ডেটার উপর শর্ত প্রয়োগ করতে ব্যবহৃত হয়।

সারাংশ

Spark SQL-এ SELECT, WHERE, GROUP BY, এবং HAVING ক্লজ ব্যবহার করে ডেটাকে নির্বাচন, ফিল্টার, গ্রুপ এবং শর্ত দিয়ে আরও বিশ্লেষণ করা যায়। এই ক্লজগুলো SQL-এর গুরুত্বপূর্ণ অংশ, যা ডেটাবেস থেকে কার্যকরভাবে তথ্য বের করার জন্য ব্যবহৃত হয়। Spark SQL এর মাধ্যমে আপনি বড় ডেটাসেটের উপর সহজেই এই ক্লজগুলো ব্যবহার করে ডেটা বিশ্লেষণ করতে পারেন।

Content added By

Rezwan Siddiki Tamim

Spark SQL এ SQL Queries চালানো Joins (INNER, LEFT, RIGHT, FULL) এর ব্যবহার Subqueries এবং Complex Queries

SELECT, WHERE, GROUP BY, এবং HAVING Clauses

SELECT ক্লজ

SELECT উদাহরণ:

SELECT সব কলাম নির্বাচন করতে:

WHERE ক্লজ

WHERE উদাহরণ:

GROUP BY ক্লজ

GROUP BY উদাহরণ:

GROUP BY-এ একাধিক কলাম:

HAVING ক্লজ

HAVING উদাহরণ:

Spark SQL এ SELECT, WHERE, GROUP BY এবং HAVING ক্লজের সংক্ষিপ্ত ব্যাখ্যা:

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

SELECT, WHERE, GROUP BY, এবং HAVING Clauses

SELECT ক্লজ

SELECT উদাহরণ:

SELECT সব কলাম নির্বাচন করতে:

WHERE ক্লজ

WHERE উদাহরণ:

GROUP BY ক্লজ

GROUP BY উদাহরণ:

GROUP BY-এ একাধিক কলাম:

HAVING ক্লজ

HAVING উদাহরণ:

Spark SQL এ SELECT, WHERE, GROUP BY এবং HAVING ক্লজের সংক্ষিপ্ত ব্যাখ্যা:

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!