Filtering, Sorting, এবং Aggregating Data গাইড ও নোট

Computer Programming - আর প্রোগ্রামিং (R Programming) - Data Manipulation (ডেটা ম্যানিপুলেশন)
198

R এ Filtering, Sorting, এবং Aggregating Data

R প্রোগ্রামিং ভাষায় ডেটা ম্যানিপুলেশন একটি গুরুত্বপূর্ণ দিক, এবং Filtering, Sorting, এবং Aggregating হল তিনটি মৌলিক অপারেশন যা ডেটা বিশ্লেষণে অত্যন্ত সহায়ক। এই অপারেশনগুলো ব্যবহার করে আপনি ডেটাকে প্রয়োজনীয়ভাবে সাজাতে, ফিল্টার করতে এবং বিভিন্ন মেট্রিকস গণনা করতে পারবেন। নিচে প্রতিটি অপারেশন সম্পর্কে বিস্তারিত আলোচনা করা হয়েছে।


১. Filtering Data

Filtering হল একটি পদ্ধতি, যেখানে আপনি একটি ডেটাসেটের মধ্যে থেকে কিছু নির্দিষ্ট শর্ত (conditions) মেনে ডেটা বের করে আনেন। এটি সাধারণত subset() ফাংশন বা লজিক্যাল কন্ডিশন ব্যবহার করে করা হয়।

subset() ফাংশন ব্যবহার:

# একটি ডেটা ফ্রেম তৈরি করা
my_data <- data.frame(
  Name = c("Alice", "Bob", "Charlie", "David"),
  Age = c(25, 30, 35, 40),
  Gender = c("F", "M", "M", "M")
)

# বয়স 30 এর বেশি এমন রেকর্ড ফিল্টার করা
filtered_data <- subset(my_data, Age > 30)
print(filtered_data)

এখানে, Age > 30 শর্ত অনুযায়ী Age কলামের মান ৩০ এর বেশি এমন রেকর্ডগুলো ফিল্টার করা হয়েছে।

লজিক্যাল কন্ডিশন দিয়ে ফিল্টার:

# শুধুমাত্র পুরুষদের ফিল্টার করা
filtered_males <- my_data[my_data$Gender == "M", ]
print(filtered_males)

এখানে, my_data$Gender == "M" শর্ত অনুযায়ী শুধুমাত্র পুরুষদের (M) ফিল্টার করা হয়েছে।


২. Sorting Data

Sorting হল ডেটাকে একটি নির্দিষ্ট ক্রমে সাজানোর প্রক্রিয়া, যেমন ছোট থেকে বড় (ascending) বা বড় থেকে ছোট (descending)। R-এ order() ফাংশন ব্যবহার করে ডেটা সাজানো হয়।

order() ফাংশন ব্যবহার:

# বয়সের উপর ভিত্তি করে সাজানো
sorted_data <- my_data[order(my_data$Age), ]
print(sorted_data)

এখানে, order(my_data$Age) ফাংশন ব্যবহার করে Age কলামের মান অনুযায়ী ডেটা সাজানো হয়েছে (ascending order)।

Descending (বড় থেকে ছোট) সাজানো:

# বয়সের উপর ভিত্তি করে বড় থেকে ছোট সাজানো
sorted_data_desc <- my_data[order(-my_data$Age), ]
print(sorted_data_desc)

এখানে, -my_data$Age ব্যবহার করে Age কলামের মান descending order (বড় থেকে ছোট) অনুযায়ী সাজানো হয়েছে।

একাধিক কলামের উপর ভিত্তি করে সাজানো:

# প্রথমে বয়স অনুযায়ী, তারপর নাম অনুযায়ী সাজানো
sorted_data_multi <- my_data[order(my_data$Age, my_data$Name), ]
print(sorted_data_multi)

এখানে, Age কলাম অনুযায়ী সাজানোর পর, যদি কোনো বয়সের মান সমান থাকে, তাহলে Name কলাম অনুযায়ী সাজানো হবে।


৩. Aggregating Data

Aggregating হল একটি পদ্ধতি, যা ডেটার উপর কোনো নির্দিষ্ট ফাংশন প্রয়োগ করে সংক্ষেপিত ফলাফল তৈরি করে, যেমন গড়, মোট, গুন, ইত্যাদি। R-এ aggregate() ফাংশন এবং dplyr প্যাকেজের summarise() ফাংশন ব্যবহার করে ডেটা অ্যাগ্রিগেট করা হয়।

aggregate() ফাংশন ব্যবহার:

# বয়স অনুযায়ী গড় হিসাব করা
aggregate(Age ~ Gender, data = my_data, FUN = mean)

এখানে, Age ~ Gender ফর্মুলা ব্যবহার করে Gender অনুযায়ী Age কলামের গড় (mean) বের করা হয়েছে।

একাধিক ফাংশন প্রয়োগ:

# বয়সের উপর ভিত্তি করে গড় এবং মোট হিসাব করা
aggregate(Age ~ Gender, data = my_data, FUN = function(x) c(mean = mean(x), sum = sum(x)))

এখানে, mean এবং sum দুটি ফাংশন একসাথে প্রয়োগ করে Gender অনুযায়ী Age কলামের গড় এবং মোট মান বের করা হয়েছে।

dplyr প্যাকেজ ব্যবহার করে Aggregation:

dplyr প্যাকেজের group_by() এবং summarise() ফাংশন ব্যবহার করে আরো উন্নত অ্যাগ্রিগেশন করা যায়।

# dplyr প্যাকেজ লোড করা
library(dplyr)

# Gender অনুযায়ী গড় বয়স বের করা
my_data %>%
  group_by(Gender) %>%
  summarise(mean_age = mean(Age), total_age = sum(Age))

এখানে, group_by(Gender) দিয়ে Gender অনুযায়ী গ্রুপ করা হয়েছে এবং summarise() ব্যবহার করে প্রতিটি গ্রুপের গড় বয়স এবং মোট বয়স বের করা হয়েছে।


সারসংক্ষেপ

  1. Filtering Data: subset() বা লজিক্যাল কন্ডিশন ব্যবহার করে নির্দিষ্ট শর্ত অনুযায়ী ডেটা ফিল্টার করা হয়। উদাহরণস্বরূপ, Age > 30 বা Gender == "M"
  2. Sorting Data: order() ফাংশন ব্যবহার করে ডেটা সাজানো হয়। আপনি এটি ascending বা descending, একক বা একাধিক কলামের উপর ভিত্তি করে করতে পারেন।
  3. Aggregating Data: aggregate() অথবা dplyr প্যাকেজের group_by() এবং summarise() ফাংশন ব্যবহার করে ডেটা অ্যাগ্রিগেট করা হয়, যেমন গড়, মোট ইত্যাদি।

এভাবে, R-এ Filtering, Sorting, এবং Aggregating অপারেশন ব্যবহার করে আপনি আপনার ডেটাকে সহজে ম্যানিপুলেট করতে পারবেন এবং প্রয়োজনীয় তথ্য বের করে আনতে পারবেন।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...