Data Frames এর ধারণা এবং ব্যবহার

Factors এবং Data Frames (ফ্যাক্টরস এবং ডেটা ফ্রেমস) - আর প্রোগ্রামিং (R Programming) - Computer Programming

398

Data Frames এর ধারণা এবং ব্যবহার

Data Frame হল R প্রোগ্রামিং ভাষার একটি গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা মূলত টেবিল আকারে ডেটা সংরক্ষণ করার জন্য ব্যবহৃত হয়। এটি এক ধরনের স্পেশাল ভেক্টর যা একাধিক কলাম (columns) এবং রো (rows) ধারণ করে, এবং প্রতিটি কলাম বিভিন্ন ডেটা টাইপের হতে পারে (যেমন, সংখ্যা, স্ট্রিং, লজিক্যাল মান)। ডেটা ফ্রেম মূলত টেবিলের মতো কাজ করে এবং এটি ডেটা সায়েন্স, পরিসংখ্যান, এবং মেশিন লার্নিংয়ের জন্য ব্যবহৃত হয়।

R এ ডেটা ফ্রেম তৈরি, অ্যাক্সেস এবং ম্যানিপুলেট করার জন্য বিভিন্ন ফাংশন এবং মেথড রয়েছে।


১. Data Frame এর ধারণা

ডেটা ফ্রেম হল এক ধরনের স্পেশাল ভেক্টর যা একাধিক কলাম এবং রো ধারণ করে। এর প্রতিটি কলাম একটি ভেক্টর এবং রো গুলি টেবিলের সারি। ডেটা ফ্রেমের সমস্ত কলাম একে অপরের সাথে সমান দৈর্ঘ্যের হয়, এবং ডেটা ফ্রেমে বিভিন্ন ধরনের ডেটা (যেমন: numeric, character, logical, ইত্যাদি) থাকতে পারে।

ডেটা ফ্রেম তৈরির উদাহরণ:

# একটি ডেটা ফ্রেম তৈরি করা
my_data <- data.frame(
  Name = c("Alice", "Bob", "Charlie"),
  Age = c(25, 30, 35),
  Is_Student = c(FALSE, TRUE, FALSE)
)

# ডেটা ফ্রেম প্রিন্ট করা
print(my_data)

এখানে, my_data একটি ডেটা ফ্রেম যেখানে তিনটি কলাম রয়েছে:

  1. Name (Character টাইপ)
  2. Age (Numeric টাইপ)
  3. Is_Student (Logical টাইপ)

এটি একটি ৩ রো এবং ৩ কলামের টেবিল তৈরি করবে।


২. Data Frame তৈরির পদ্ধতি

ডেটা ফ্রেম তৈরি করতে data.frame() ফাংশন ব্যবহার করা হয়। আপনি বিভিন্ন ডেটা টাইপের ভেক্টর একসাথে দিয়ে একটি ডেটা ফ্রেম তৈরি করতে পারেন।

ডেটা ফ্রেম তৈরির উদাহরণ:

# ডেটা ফ্রেম তৈরি করা
df <- data.frame(
  Student = c("John", "Sara", "Jake"),
  Marks = c(88, 92, 85),
  Passed = c(TRUE, TRUE, FALSE)
)

# ডেটা ফ্রেম দেখানো
print(df)

এখানে, df নামের ডেটা ফ্রেমটি তৈরি হয়েছে যা তিনটি কলাম ধারণ করছে:

  • Student (Character টাইপ)
  • Marks (Numeric টাইপ)
  • Passed (Logical টাইপ)

৩. Data Frame এ ডেটা অ্যাক্সেস করা

ডেটা ফ্রেমে ডেটা অ্যাক্সেস করার জন্য কিছু পদ্ধতি রয়েছে:

  1. এক্সপ্রেস (Accessing columns): ডেটা ফ্রেমের একটি কলাম অ্যাক্সেস করতে $ চিহ্ন ব্যবহার করা হয়।

    df$Student  # "John", "Sara", "Jake"
    df$Marks    # 88, 92, 85
  2. এক্সপ্রেস (Accessing by indexing): আপনি [[ ]] বা [ ] চিহ্ন ব্যবহার করে ডেটা ফ্রেমের কলাম বা সারি অ্যাক্সেস করতে পারেন।
    • কলাম অ্যাক্সেস: df[[1]] বা df[,"Marks"]

      df[[1]]        # প্রথম কলাম: "John", "Sara", "Jake"
      df[,"Marks"]   # "Marks" কলাম: 88, 92, 85
    • সারি অ্যাক্সেস:

      df[1, ]        # প্রথম সারি: "John", 88, TRUE
      df[, 2]        # দ্বিতীয় কলাম: Marks

৪. Data Frame ম্যানিপুলেশন

১. নতুন কলাম যোগ করা

নতুন কলাম যোগ করতে আপনি সরাসরি নতুন নাম দিয়ে অ্যাসাইন করতে পারেন।

df$Grade <- c("A", "A+", "B")  # নতুন কলাম যোগ করা

২. কলাম/সারি মুছে ফেলা

ডেটা ফ্রেম থেকে একটি কলাম বা সারি মুছে ফেলতে আপনি NULL অ্যাসাইন করতে পারেন।

df$Grade <- NULL  # 'Grade' কলাম মুছে ফেলা

৩. ডেটা ফ্রেমের সাইজ চেক করা

ডেটা ফ্রেমের রো এবং কলামের সংখ্যা জানতে dim() এবং nrow(), ncol() ফাংশন ব্যবহার করা হয়।

dim(df)    # 3 rows, 3 columns
nrow(df)   # 3 rows
ncol(df)   # 3 columns

৪. ডেটা ফ্রেমের সারণী সাজানো (Sorting)

ডেটা ফ্রেমের একটি কলামের ভিত্তিতে সাজানোর জন্য order() ফাংশন ব্যবহার করা হয়।

df_sorted <- df[order(df$Marks), ]  # Marks কলাম অনুযায়ী সাজানো

৫. ডেটা ফ্রেমের উপাদান ফিল্টার করা

ডেটা ফ্রেমের কিছু সারি বের করার জন্য শর্ত দিয়ে ফিল্টার করা যেতে পারে।

df_filtered <- df[df$Marks > 90, ]  # Marks এর মান 90 এর বেশি এমন সারি

৫. Data Frame এর ব্যবহার

R এ ডেটা ফ্রেম প্রধানত ব্যবহৃত হয়:

  • ডেটা বিশ্লেষণ: টেবিল আকারে ডেটা উপস্থাপন এবং বিশ্লেষণ করা।
  • ডেটা ক্লিনিং: ডেটা ফ্রেমের মধ্যে ডেটা ফিল্টার, সাজানো বা সংশোধন করা।
  • পরিসংখ্যানিক বিশ্লেষণ: ডেটা ফ্রেম থেকে পরিসংখ্যানিক বিশ্লেষণ যেমন গড়, মধ্যম, বৈচিত্র্য নিরূপণ করা।
  • মডেলিং: ডেটা ফ্রেম ব্যবহার করে বিভিন্ন পরিসংখ্যানিক এবং মেশিন লার্নিং মডেল তৈরি করা।

সারসংক্ষেপ

  • Data Frame হল R এর একটি শক্তিশালী ডেটা স্ট্রাকচার যা টেবিল আকারে ডেটা সংরক্ষণ এবং বিশ্লেষণ করার জন্য ব্যবহৃত হয়।
  • এটি বিভিন্ন ডেটা টাইপ (যেমন: numeric, character, logical) ধারণ করতে পারে।
  • ডেটা ফ্রেমে ডেটা অ্যাক্সেস করার জন্য $, [[ ]], এবং [ ] ব্যবহার করা হয়।
  • ডেটা ফ্রেমে নতুন কলাম যোগ, কলাম মুছে ফেলা, সাইজ চেক করা, সাজানো এবং ফিল্টার করার মতো বিভিন্ন ম্যানিপুলেশন করা যায়।

এভাবে R এ ডেটা ফ্রেম ব্যবহার এবং ম্যানিপুলেশন করতে পারেন, যা ডেটা সায়েন্স এবং পরিসংখ্যান বিশ্লেষণের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By
Promotion

Are you sure to start over?

Loading...