R-এ Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)
Data Frame হল R প্রোগ্রামিং ভাষার একটি অন্যতম গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা টেবিলের মতো ডেটা সংরক্ষণ করে। এটি বিভিন্ন প্রকারের ডেটা যেমন সংখ্যা, স্ট্রিং, লজিক্যাল ভ্যালু ইত্যাদি একত্রে সংরক্ষণ করতে পারে। R-এ Data Frame এর উপরে অনেক ধরনের অপারেশন করা যায়, যেমন Selection, Subsetting এবং Manipulation। এখানে মূলত Selection এবং Subsetting এর অপারেশনগুলোর বিস্তারিত আলোচনা করা হবে।
১. Data Frame তৈরি (Creating a Data Frame)
R-এ data.frame() ফাংশন ব্যবহার করে সহজেই একটি ডেটা ফ্রেম তৈরি করা যায়। এতে বিভিন্ন ধরনের ডেটা টাইপ যেমন চরিত্র (character), সংখ্যা (numeric), এবং লজিক্যাল (logical) যুক্ত করা যেতে পারে।
উদাহরণ:
# Data Frame তৈরি করা
df <- data.frame(
Name = c("John", "Jane", "Tom", "Lucy"),
Age = c(28, 34, 22, 41),
Gender = c("Male", "Female", "Male", "Female"),
Score = c(88, 92, 75, 95)
)
# Data Frame প্রদর্শন
print(df)আউটপুট:
Name Age Gender Score
1 John 28 Male 88
2 Jane 34 Female 92
3 Tom 22 Male 75
4 Lucy 41 Female 95২. Selection (Data Frame থেকে Selection)
Selection দ্বারা মানে হল যে একটি Data Frame থেকে নির্দিষ্ট কলাম বা সারি নির্বাচন করা। বিভিন্ন ফাংশন এবং অপারেটরের মাধ্যমে এটি করা সম্ভব।
কলাম সিলেকশন:
R-এ একটি Data Frame থেকে একটি কলাম নির্বাচন করার জন্য [ বা $ অপারেটর ব্যবহার করা হয়।
উদাহরণ:
# একটি কলাম নির্বাচন (এখানে 'Age' কলাম)
age_column <- df$Age
print(age_column)আউটপুট:
[1] 28 34 22 41একই কাজ [ অপারেটর দিয়েও করা যেতে পারে:
# একটি কলাম নির্বাচন
age_column <- df[ , "Age"]
print(age_column)আউটপুট:
[1] 28 34 22 41সারি সিলেকশন:
Data Frame থেকে একটি নির্দিষ্ট সারি নির্বাচন করার জন্য [ অপারেটর ব্যবহার করা হয়। এখানে আপনাকে প্রথম আর্গুমেন্ট হিসেবে সারির সংখ্যা এবং দ্বিতীয় আর্গুমেন্ট হিসেবে কলামের সংখ্যা দিতে হবে।
# প্রথম সারি নির্বাচন
first_row <- df[1, ]
print(first_row)আউটপুট:
Name Age Gender Score
1 John 28 Male 88৩. Subsetting (Data Frame থেকে Subsetting)
Subsetting দ্বারা মানে হল Data Frame এর একটি নির্দিষ্ট অংশ নির্বাচন করা, যেমন একটি নির্দিষ্ট শর্তের ওপর ভিত্তি করে কলাম বা সারি নির্বাচন করা।
সারি বা কলাম নির্বাচন শর্তের মাধ্যমে:
Data Frame থেকে একটি নির্দিষ্ট শর্ত মেনে ডেটা বের করার জন্য subset() ফাংশন ব্যবহার করা হয়। এছাড়া, সাধারণভাবে [ অপারেটর দিয়ে বিভিন্ন শর্তে সারি নির্বাচন করা যায়।
উদাহরণ ১: বয়স 30 এর কম নির্বাচন করা
# subset ফাংশন ব্যবহার করে বয়স 30 এর কম নির্বাচন করা
subset_df <- subset(df, Age < 30)
print(subset_df)আউটপুট:
Name Age Gender Score
1 John 28 Male 88
3 Tom 22 Male 75উদাহরণ ২: লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা
# subset ফাংশন ব্যবহার করে লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা
subset_df2 <- subset(df, Gender == "Female" & Score > 90)
print(subset_df2)আউটপুট:
Name Age Gender Score
2 Jane 34 Female 92
4 Lucy 41 Female 95কলাম নির্বাচন শর্তের মাধ্যমে:
Data Frame থেকে একটি নির্দিষ্ট কলাম নির্বাচন করতে শর্ত ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, Score কলাম থেকে 80 এর বেশি মানগুলি নির্বাচন করা:
# Score কলাম থেকে 80 এর বেশি নির্বাচন করা
subset_score <- df[df$Score > 80, ]
print(subset_score)আউটপুট:
Name Age Gender Score
1 John 28 Male 88
2 Jane 34 Female 92
4 Lucy 41 Female 95৪. Data Frame Manipulation (Data Frame ম্যানিপুলেশন)
ডেটা ফ্রেমে ডেটা সিলেকশন এবং সাবসেটিং করার পর, আপনি বিভিন্ন রকম ম্যানিপুলেশনও করতে পারেন, যেমন ডেটা ফিল্টার, ডেটা যোগ করা বা মুছে ফেলা, কলাম যোগ করা ইত্যাদি।
কলাম যোগ করা:
নতুন একটি কলাম যোগ করতে পারেন:
# একটি নতুন কলাম যোগ করা
df$Country <- c("USA", "Canada", "USA", "UK")
print(df)আউটপুট:
Name Age Gender Score Country
1 John 28 Male 88 USA
2 Jane 34 Female 92 Canada
3 Tom 22 Male 75 USA
4 Lucy 41 Female 95 UKকলাম মুছে ফেলা:
কোনো কলাম মুছে ফেলতে df$column_name <- NULL ব্যবহার করা হয়।
# 'Country' কলাম মুছে ফেলা
df$Country <- NULL
print(df)আউটপুট:
Name Age Gender Score
1 John 28 Male 88
2 Jane 34 Female 92
3 Tom 22 Male 75
4 Lucy 41 Female 95সারসংক্ষেপ
- Selection: Data Frame থেকে নির্দিষ্ট কলাম বা সারি নির্বাচন করার জন্য
$অপারেটর বা[অপারেটর ব্যবহার করা হয়। - Subsetting: Data Frame এর নির্দিষ্ট অংশ শর্তের ভিত্তিতে নির্বাচন করতে
subset()ফাংশন বা[অপারেটর ব্যবহার করা হয়। - Manipulation: Data Frame এ নতুন কলাম যোগ করা, কলাম মুছে ফেলা ইত্যাদি অপারেশন করা যায়।
এছাড়া R-এ Data Frame এর আরও অনেক অপারেশন যেমন গ্রুপিং, সোর্টিং, রিডিং এবং রাইটিং করা যায় যা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণের জন্য অত্যন্ত গুরুত্বপূর্ণ।
Read more