Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)

Factors এবং Data Frames (ফ্যাক্টরস এবং ডেটা ফ্রেমস) - আর প্রোগ্রামিং (R Programming) - Computer Programming

322

R-এ Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)

Data Frame হল R প্রোগ্রামিং ভাষার একটি অন্যতম গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা টেবিলের মতো ডেটা সংরক্ষণ করে। এটি বিভিন্ন প্রকারের ডেটা যেমন সংখ্যা, স্ট্রিং, লজিক্যাল ভ্যালু ইত্যাদি একত্রে সংরক্ষণ করতে পারে। R-এ Data Frame এর উপরে অনেক ধরনের অপারেশন করা যায়, যেমন Selection, Subsetting এবং Manipulation। এখানে মূলত Selection এবং Subsetting এর অপারেশনগুলোর বিস্তারিত আলোচনা করা হবে।


১. Data Frame তৈরি (Creating a Data Frame)

R-এ data.frame() ফাংশন ব্যবহার করে সহজেই একটি ডেটা ফ্রেম তৈরি করা যায়। এতে বিভিন্ন ধরনের ডেটা টাইপ যেমন চরিত্র (character), সংখ্যা (numeric), এবং লজিক্যাল (logical) যুক্ত করা যেতে পারে।

উদাহরণ:

# Data Frame তৈরি করা
df <- data.frame(
  Name = c("John", "Jane", "Tom", "Lucy"),
  Age = c(28, 34, 22, 41),
  Gender = c("Male", "Female", "Male", "Female"),
  Score = c(88, 92, 75, 95)
)

# Data Frame প্রদর্শন
print(df)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
2 Jane  34 Female    92
3 Tom   22   Male    75
4 Lucy  41 Female    95

২. Selection (Data Frame থেকে Selection)

Selection দ্বারা মানে হল যে একটি Data Frame থেকে নির্দিষ্ট কলাম বা সারি নির্বাচন করা। বিভিন্ন ফাংশন এবং অপারেটরের মাধ্যমে এটি করা সম্ভব।

কলাম সিলেকশন:

R-এ একটি Data Frame থেকে একটি কলাম নির্বাচন করার জন্য [ বা $ অপারেটর ব্যবহার করা হয়।

উদাহরণ:

# একটি কলাম নির্বাচন (এখানে 'Age' কলাম)
age_column <- df$Age
print(age_column)

আউটপুট:

[1] 28 34 22 41

একই কাজ [ অপারেটর দিয়েও করা যেতে পারে:

# একটি কলাম নির্বাচন
age_column <- df[ , "Age"]
print(age_column)

আউটপুট:

[1] 28 34 22 41

সারি সিলেকশন:

Data Frame থেকে একটি নির্দিষ্ট সারি নির্বাচন করার জন্য [ অপারেটর ব্যবহার করা হয়। এখানে আপনাকে প্রথম আর্গুমেন্ট হিসেবে সারির সংখ্যা এবং দ্বিতীয় আর্গুমেন্ট হিসেবে কলামের সংখ্যা দিতে হবে।

# প্রথম সারি নির্বাচন
first_row <- df[1, ]
print(first_row)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88

৩. Subsetting (Data Frame থেকে Subsetting)

Subsetting দ্বারা মানে হল Data Frame এর একটি নির্দিষ্ট অংশ নির্বাচন করা, যেমন একটি নির্দিষ্ট শর্তের ওপর ভিত্তি করে কলাম বা সারি নির্বাচন করা।

সারি বা কলাম নির্বাচন শর্তের মাধ্যমে:

Data Frame থেকে একটি নির্দিষ্ট শর্ত মেনে ডেটা বের করার জন্য subset() ফাংশন ব্যবহার করা হয়। এছাড়া, সাধারণভাবে [ অপারেটর দিয়ে বিভিন্ন শর্তে সারি নির্বাচন করা যায়।

উদাহরণ ১: বয়স 30 এর কম নির্বাচন করা

# subset ফাংশন ব্যবহার করে বয়স 30 এর কম নির্বাচন করা
subset_df <- subset(df, Age < 30)
print(subset_df)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
3 Tom   22   Male    75

উদাহরণ ২: লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা

# subset ফাংশন ব্যবহার করে লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা
subset_df2 <- subset(df, Gender == "Female" & Score > 90)
print(subset_df2)

আউটপুট:

  Name Age Gender Score
2 Jane  34 Female    92
4 Lucy  41 Female    95

কলাম নির্বাচন শর্তের মাধ্যমে:

Data Frame থেকে একটি নির্দিষ্ট কলাম নির্বাচন করতে শর্ত ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, Score কলাম থেকে 80 এর বেশি মানগুলি নির্বাচন করা:

# Score কলাম থেকে 80 এর বেশি নির্বাচন করা
subset_score <- df[df$Score > 80, ]
print(subset_score)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
2 Jane  34 Female    92
4 Lucy  41 Female    95

৪. Data Frame Manipulation (Data Frame ম্যানিপুলেশন)

ডেটা ফ্রেমে ডেটা সিলেকশন এবং সাবসেটিং করার পর, আপনি বিভিন্ন রকম ম্যানিপুলেশনও করতে পারেন, যেমন ডেটা ফিল্টার, ডেটা যোগ করা বা মুছে ফেলা, কলাম যোগ করা ইত্যাদি।

কলাম যোগ করা:

নতুন একটি কলাম যোগ করতে পারেন:

# একটি নতুন কলাম যোগ করা
df$Country <- c("USA", "Canada", "USA", "UK")
print(df)

আউটপুট:

  Name Age Gender Score Country
1 John  28   Male    88     USA
2 Jane  34 Female    92  Canada
3 Tom   22   Male    75     USA
4 Lucy  41 Female    95      UK

কলাম মুছে ফেলা:

কোনো কলাম মুছে ফেলতে df$column_name <- NULL ব্যবহার করা হয়।

# 'Country' কলাম মুছে ফেলা
df$Country <- NULL
print(df)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
2 Jane  34 Female    92
3 Tom   22   Male    75
4 Lucy  41 Female    95

সারসংক্ষেপ

  • Selection: Data Frame থেকে নির্দিষ্ট কলাম বা সারি নির্বাচন করার জন্য $ অপারেটর বা [ অপারেটর ব্যবহার করা হয়।
  • Subsetting: Data Frame এর নির্দিষ্ট অংশ শর্তের ভিত্তিতে নির্বাচন করতে subset() ফাংশন বা [ অপারেটর ব্যবহার করা হয়।
  • Manipulation: Data Frame এ নতুন কলাম যোগ করা, কলাম মুছে ফেলা ইত্যাদি অপারেশন করা যায়।

এছাড়া R-এ Data Frame এর আরও অনেক অপারেশন যেমন গ্রুপিং, সোর্টিং, রিডিং এবং রাইটিং করা যায় যা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By
Promotion

Are you sure to start over?

Loading...