Factors এবং Data Frames (ফ্যাক্টরস এবং ডেটা ফ্রেমস)

আর প্রোগ্রামিং (R Programming) - Computer Programming

403

Factors এর ভূমিকা এবং তৈরি করা

R প্রোগ্রামিং ভাষায় Factors একটি বিশেষ ধরনের ডেটা টাইপ যা ক্যাটাগোরিক্যাল (categorical) ডেটা সংরক্ষণ করতে ব্যবহৃত হয়। Factors মূলত টেক্সট বা স্ট্রিং ডেটা টাইপের মানগুলির একটি শ্রেণীবদ্ধ ভার্সন (classified version)। এটি এমন ডেটা প্রতিনিধিত্ব করতে ব্যবহৃত হয় যেখানে কিছু উপাদান (levels) নির্দিষ্ট গোষ্ঠীতে বিভক্ত থাকে, যেমন একটি পণ্য ক্যাটেগরি, লিঙ্গ (পুরুষ/মহিলা), শিক্ষার স্তর ইত্যাদি।

Factors সাধারণত এমন ক্ষেত্রগুলিতে ব্যবহৃত হয় যেখানে ভ্যালুগুলি সংখ্যা বা টেক্সট নয়, বরং শ্রেণী বা ক্লাস প্রতিনিধিত্ব করে, এবং যেগুলোর মাঝে কোনও নির্দিষ্ট রকমের গঠন রয়েছে।

Factors এর ভূমিকা

১. ক্যাটাগোরিক্যাল ডেটা সংরক্ষণ:

Factors ক্যাটাগোরিক্যাল ডেটা সংরক্ষণের জন্য ব্যবহার করা হয়। এটি এমন ডেটার জন্য উপযোগী যেখানে মানগুলি একাধিক শ্রেণীতে বিভক্ত থাকে। উদাহরণস্বরূপ, লিঙ্গ (পুরুষ/মহিলা), রঙ (লাল/নীল/সবুজ), শিক্ষার স্তর (এলিমেন্টারি/মাধ্যমিক/স্নাতক) ইত্যাদি।

২. মেমরি ব্যবস্থাপনা:

Factors ক্যাটাগোরিক্যাল ডেটাকে সংখ্যা হিসেবে স্টোর করে (যদিও ডেটাটি মূলত স্ট্রিং বা টেক্সট হতে পারে), এর ফলে মেমরি ব্যবস্থাপনা উন্নত হয়। কারণ একই রকম ডেটার জন্য একই মানের রেফারেন্স ব্যবহৃত হয়, যা মেমরি সঞ্চয়ের জন্য সুবিধাজনক।

৩. বিশ্লেষণ এবং মডেলিং:

Factors পরিসংখ্যানিক বিশ্লেষণ এবং মেশিন লার্নিং মডেল তৈরি করার ক্ষেত্রে গুরুত্বপূর্ণ ভূমিকা পালন করে। R-এ ক্যাটাগোরিক্যাল ডেটার ওপর অপারেশন করার জন্য factors ব্যবহার করা হয়, যেমন lm() (লিনিয়ার রিগ্রেশন) বা glm() (জেনারেলাইজড লিনিয়ার মডেল) এর ক্ষেত্রে ফ্যাক্টরভিত্তিক পরিবর্তনশীল (categorical variables) ব্যবহার করা হয়।

৪. ডেটার শ্রেণীবিভাগ (Levels):

Factors একাধিক level ধারণ করতে পারে, যা ডেটার শ্রেণী বা গোষ্ঠী নির্দেশ করে। উদাহরণস্বরূপ, যদি আপনার কাছে "ফল" সম্পর্কিত একটি ফ্যাক্টর থাকে, তাহলে তার বিভিন্ন level হতে পারে "আপেল", "কলা", "কমলা" ইত্যাদি।

Factors তৈরি করা

R-এ factor তৈরি করতে factor() ফাংশন ব্যবহার করা হয়। এটি একটি নির্দিষ্ট ভেরিয়েবলের উপাদানগুলোকে ক্যাটাগোরিক্যাল ভ্যালু (levels) হিসেবে রূপান্তরিত করে।

১. Factor তৈরি করা

factor() ফাংশন ব্যবহার করে একটি ভেরিয়েবলকে factor-এ রূপান্তরিত করা যায়।

উদাহরণ:

# ক্যাটাগোরিক্যাল ডেটা হিসেবে 'gender' তৈরি করা
gender <- c("Male", "Female", "Male", "Female", "Male")
gender_factor <- factor(gender)

# ফলাফল প্রদর্শন
print(gender_factor)

এখানে gender_factor একটি factor হয়ে যাবে এবং এর levels হবে "Male" এবং "Female"।

২. Levels নির্ধারণ করা

আপনি factor() ফাংশনের মধ্যে levels প্যারামিটার ব্যবহার করে factor এর levels পূর্বনির্ধারণ করতে পারেন।

উদাহরণ:

# levels নির্ধারণ করে factor তৈরি করা
education <- c("Bachelor", "Master", "PhD", "Bachelor", "Master")
education_factor <- factor(education, levels = c("Bachelor", "Master", "PhD"))

# ফলাফল প্রদর্শন
print(education_factor)

এখানে education_factor একটি factor হয়ে যাবে যার levels হবে "Bachelor", "Master", এবং "PhD", যদিও ডেটাতে কিছু নির্দিষ্ট মান নেই।

৩. Factor এর levels পরিবর্তন করা

আপনি relevel() ফাংশন ব্যবহার করে একটি factor এর levels পরিবর্তন করতে পারেন, অর্থাৎ একটি নির্দিষ্ট level কে প্রথম level হিসেবে সেট করতে।

উদাহরণ:

# relevel() ফাংশন ব্যবহার করে factor এর levels পরিবর্তন করা
education_factor <- relevel(education_factor, ref = "Master")

# ফলাফল প্রদর্শন
print(education_factor)

এখানে "Master" levelটি প্রথম level হিসেবে সেট করা হয়েছে।

৪. Factor এর Summary

Factors এর একটি সংক্ষিপ্ত সারাংশ পেতে summary() ফাংশন ব্যবহার করা হয়, যা প্রতিটি level এর সংখ্যা (frequency) প্রদর্শন করে।

উদাহরণ:

# factor এর summary দেখানো
summary(education_factor)

এটি education_factor এর প্রতিটি level এর ফ্রিকোয়েন্সি এবং উপাদান সংখ্যা দেখাবে।

Factors এর গাণিতিক ও লজিক্যাল অপারেশন

১. Factors এর গাণিতিক অপারেশন

Factors এর সাথে সাধারণত গাণিতিক অপারেশন করা হয় না, কারণ এটি সাধারণত ক্যাটাগোরিক্যাল ডেটা সংরক্ষণ করে। তবে, আপনি factor এর levels কে সংখ্যায় রূপান্তর করে গাণিতিক অপারেশন করতে পারেন।

উদাহরণ:

# factor এর level গুলি সংখ্যায় রূপান্তর করা
education_numeric <- as.numeric(education_factor)

# ফলাফল প্রদর্শন
print(education_numeric)

এখানে as.numeric() ফাংশন দিয়ে factor এর levels কে সংখ্যা হিসেবে রূপান্তর করা হয়েছে।

২. Factors এর লজিক্যাল অপারেশন

Factors এর সাথে লজিক্যাল অপারেশনও করা যায়, তবে এটি সাধারণত levels ভিত্তিক হয়। আপনি == বা != অপারেটর ব্যবহার করে factor এর মধ্যে তুলনা করতে পারেন।

উদাহরণ:

# factor এর সাথে লজিক্যাল অপারেশন করা
education_factor == "Bachelor"  # এটি TRUE অথবা FALSE রিটার্ন করবে

Factors এর সুবিধা এবং ব্যবহার

ডেটা ম্যানিপুলেশন: Factors ডেটা ম্যানিপুলেশন সহজ করে, বিশেষত ক্যাটাগোরিক্যাল ডেটা বিশ্লেষণের জন্য।
মেমরি সঞ্চয়: এটি একই ধরনের মানগুলির জন্য কম মেমরি ব্যবহার করে, কারণ R ভিতরে levels ব্যবহার করে রেফারেন্স স্টোর করে।
পরিসংখ্যান বিশ্লেষণ: পরিসংখ্যানিক মডেল এবং গ্রাফে factors ব্যবহার করা হয়, যেমন লিনিয়ার মডেল, অ্যানোভা, ইত্যাদি।

সারসংক্ষেপ

R প্রোগ্রামিং ভাষায় Factors হল একটি বিশেষ ডেটা টাইপ যা ক্যাটাগোরিক্যাল ডেটা (যেমন লিঙ্গ, রঙ, শিক্ষা স্তর) সংরক্ষণ করতে ব্যবহৃত হয়। Factors তৈরি করার জন্য factor() ফাংশন ব্যবহার করা হয়, যা বিভিন্ন levels ধারণ করে এবং মেমরি ব্যবস্থাপনায় উন্নতি আনে। Factors এর সাহায্যে ডেটা ম্যানিপুলেশন সহজ হয় এবং বিভিন্ন পরিসংখ্যানিক বিশ্লেষণ ও মডেল তৈরিতে ব্যবহৃত হয়।

Content added By

Azizar Rahman Aziz

Factors এর ভূমিকা এবং তৈরি করা

394

Factors এর ভূমিকা এবং তৈরি করা

Factors এর ভূমিকা

১. ক্যাটাগোরিক্যাল ডেটা সংরক্ষণ:

২. মেমরি ব্যবস্থাপনা:

৩. বিশ্লেষণ এবং মডেলিং:

৪. ডেটার শ্রেণীবিভাগ (Levels):

Factors তৈরি করা

১. Factor তৈরি করা

factor() ফাংশন ব্যবহার করে একটি ভেরিয়েবলকে factor-এ রূপান্তরিত করা যায়।

উদাহরণ:

# ক্যাটাগোরিক্যাল ডেটা হিসেবে 'gender' তৈরি করা
gender <- c("Male", "Female", "Male", "Female", "Male")
gender_factor <- factor(gender)

# ফলাফল প্রদর্শন
print(gender_factor)

এখানে gender_factor একটি factor হয়ে যাবে এবং এর levels হবে "Male" এবং "Female"।

২. Levels নির্ধারণ করা

উদাহরণ:

# levels নির্ধারণ করে factor তৈরি করা
education <- c("Bachelor", "Master", "PhD", "Bachelor", "Master")
education_factor <- factor(education, levels = c("Bachelor", "Master", "PhD"))

# ফলাফল প্রদর্শন
print(education_factor)

৩. Factor এর levels পরিবর্তন করা

উদাহরণ:

# relevel() ফাংশন ব্যবহার করে factor এর levels পরিবর্তন করা
education_factor <- relevel(education_factor, ref = "Master")

# ফলাফল প্রদর্শন
print(education_factor)

এখানে "Master" levelটি প্রথম level হিসেবে সেট করা হয়েছে।

৪. Factor এর Summary

উদাহরণ:

# factor এর summary দেখানো
summary(education_factor)

এটি education_factor এর প্রতিটি level এর ফ্রিকোয়েন্সি এবং উপাদান সংখ্যা দেখাবে।

Factors এর গাণিতিক ও লজিক্যাল অপারেশন

১. Factors এর গাণিতিক অপারেশন

উদাহরণ:

# factor এর level গুলি সংখ্যায় রূপান্তর করা
education_numeric <- as.numeric(education_factor)

# ফলাফল প্রদর্শন
print(education_numeric)

এখানে as.numeric() ফাংশন দিয়ে factor এর levels কে সংখ্যা হিসেবে রূপান্তর করা হয়েছে।

২. Factors এর লজিক্যাল অপারেশন

উদাহরণ:

# factor এর সাথে লজিক্যাল অপারেশন করা
education_factor == "Bachelor"  # এটি TRUE অথবা FALSE রিটার্ন করবে

Factors এর সুবিধা এবং ব্যবহার

ডেটা ম্যানিপুলেশন: Factors ডেটা ম্যানিপুলেশন সহজ করে, বিশেষত ক্যাটাগোরিক্যাল ডেটা বিশ্লেষণের জন্য।
মেমরি সঞ্চয়: এটি একই ধরনের মানগুলির জন্য কম মেমরি ব্যবহার করে, কারণ R ভিতরে levels ব্যবহার করে রেফারেন্স স্টোর করে।
পরিসংখ্যান বিশ্লেষণ: পরিসংখ্যানিক মডেল এবং গ্রাফে factors ব্যবহার করা হয়, যেমন লিনিয়ার মডেল, অ্যানোভা, ইত্যাদি।

সারসংক্ষেপ

Content added By

Azizar Rahman Aziz

Data Frames এর ধারণা এবং ব্যবহার

458

Data Frames এর ধারণা এবং ব্যবহার

Data Frame হল R প্রোগ্রামিং ভাষার একটি গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা মূলত টেবিল আকারে ডেটা সংরক্ষণ করার জন্য ব্যবহৃত হয়। এটি এক ধরনের স্পেশাল ভেক্টর যা একাধিক কলাম (columns) এবং রো (rows) ধারণ করে, এবং প্রতিটি কলাম বিভিন্ন ডেটা টাইপের হতে পারে (যেমন, সংখ্যা, স্ট্রিং, লজিক্যাল মান)। ডেটা ফ্রেম মূলত টেবিলের মতো কাজ করে এবং এটি ডেটা সায়েন্স, পরিসংখ্যান, এবং মেশিন লার্নিংয়ের জন্য ব্যবহৃত হয়।

R এ ডেটা ফ্রেম তৈরি, অ্যাক্সেস এবং ম্যানিপুলেট করার জন্য বিভিন্ন ফাংশন এবং মেথড রয়েছে।

১. Data Frame এর ধারণা

ডেটা ফ্রেম হল এক ধরনের স্পেশাল ভেক্টর যা একাধিক কলাম এবং রো ধারণ করে। এর প্রতিটি কলাম একটি ভেক্টর এবং রো গুলি টেবিলের সারি। ডেটা ফ্রেমের সমস্ত কলাম একে অপরের সাথে সমান দৈর্ঘ্যের হয়, এবং ডেটা ফ্রেমে বিভিন্ন ধরনের ডেটা (যেমন: numeric, character, logical, ইত্যাদি) থাকতে পারে।

ডেটা ফ্রেম তৈরির উদাহরণ:

# একটি ডেটা ফ্রেম তৈরি করা
my_data <- data.frame(
  Name = c("Alice", "Bob", "Charlie"),
  Age = c(25, 30, 35),
  Is_Student = c(FALSE, TRUE, FALSE)
)

# ডেটা ফ্রেম প্রিন্ট করা
print(my_data)

এখানে, my_data একটি ডেটা ফ্রেম যেখানে তিনটি কলাম রয়েছে:

Name (Character টাইপ)
Age (Numeric টাইপ)
Is_Student (Logical টাইপ)

এটি একটি ৩ রো এবং ৩ কলামের টেবিল তৈরি করবে।

২. Data Frame তৈরির পদ্ধতি

ডেটা ফ্রেম তৈরি করতে data.frame() ফাংশন ব্যবহার করা হয়। আপনি বিভিন্ন ডেটা টাইপের ভেক্টর একসাথে দিয়ে একটি ডেটা ফ্রেম তৈরি করতে পারেন।

ডেটা ফ্রেম তৈরির উদাহরণ:

# ডেটা ফ্রেম তৈরি করা
df <- data.frame(
  Student = c("John", "Sara", "Jake"),
  Marks = c(88, 92, 85),
  Passed = c(TRUE, TRUE, FALSE)
)

# ডেটা ফ্রেম দেখানো
print(df)

এখানে, df নামের ডেটা ফ্রেমটি তৈরি হয়েছে যা তিনটি কলাম ধারণ করছে:

Student (Character টাইপ)
Marks (Numeric টাইপ)
Passed (Logical টাইপ)

৩. Data Frame এ ডেটা অ্যাক্সেস করা

ডেটা ফ্রেমে ডেটা অ্যাক্সেস করার জন্য কিছু পদ্ধতি রয়েছে:

এক্সপ্রেস (Accessing columns): ডেটা ফ্রেমের একটি কলাম অ্যাক্সেস করতে $ চিহ্ন ব্যবহার করা হয়।
```
df$Student  # "John", "Sara", "Jake"
df$Marks    # 88, 92, 85
```
এক্সপ্রেস (Accessing by indexing): আপনি [[ ]] বা [ ] চিহ্ন ব্যবহার করে ডেটা ফ্রেমের কলাম বা সারি অ্যাক্সেস করতে পারেন।
- কলাম অ্যাক্সেস: df[[1]] বা df[,"Marks"]
```
df[[1]]        # প্রথম কলাম: "John", "Sara", "Jake"
df[,"Marks"]   # "Marks" কলাম: 88, 92, 85
```
- সারি অ্যাক্সেস:
```
df[1, ]        # প্রথম সারি: "John", 88, TRUE
df[, 2]        # দ্বিতীয় কলাম: Marks
```

৪. Data Frame ম্যানিপুলেশন

১. নতুন কলাম যোগ করা

নতুন কলাম যোগ করতে আপনি সরাসরি নতুন নাম দিয়ে অ্যাসাইন করতে পারেন।

df$Grade <- c("A", "A+", "B")  # নতুন কলাম যোগ করা

২. কলাম/সারি মুছে ফেলা

ডেটা ফ্রেম থেকে একটি কলাম বা সারি মুছে ফেলতে আপনি NULL অ্যাসাইন করতে পারেন।

df$Grade <- NULL  # 'Grade' কলাম মুছে ফেলা

৩. ডেটা ফ্রেমের সাইজ চেক করা

ডেটা ফ্রেমের রো এবং কলামের সংখ্যা জানতে dim() এবং nrow(), ncol() ফাংশন ব্যবহার করা হয়।

dim(df)    # 3 rows, 3 columns
nrow(df)   # 3 rows
ncol(df)   # 3 columns

৪. ডেটা ফ্রেমের সারণী সাজানো (Sorting)

ডেটা ফ্রেমের একটি কলামের ভিত্তিতে সাজানোর জন্য order() ফাংশন ব্যবহার করা হয়।

df_sorted <- df[order(df$Marks), ]  # Marks কলাম অনুযায়ী সাজানো

৫. ডেটা ফ্রেমের উপাদান ফিল্টার করা

ডেটা ফ্রেমের কিছু সারি বের করার জন্য শর্ত দিয়ে ফিল্টার করা যেতে পারে।

df_filtered <- df[df$Marks > 90, ]  # Marks এর মান 90 এর বেশি এমন সারি

৫. Data Frame এর ব্যবহার

R এ ডেটা ফ্রেম প্রধানত ব্যবহৃত হয়:

ডেটা বিশ্লেষণ: টেবিল আকারে ডেটা উপস্থাপন এবং বিশ্লেষণ করা।
ডেটা ক্লিনিং: ডেটা ফ্রেমের মধ্যে ডেটা ফিল্টার, সাজানো বা সংশোধন করা।
পরিসংখ্যানিক বিশ্লেষণ: ডেটা ফ্রেম থেকে পরিসংখ্যানিক বিশ্লেষণ যেমন গড়, মধ্যম, বৈচিত্র্য নিরূপণ করা।
মডেলিং: ডেটা ফ্রেম ব্যবহার করে বিভিন্ন পরিসংখ্যানিক এবং মেশিন লার্নিং মডেল তৈরি করা।

সারসংক্ষেপ

Data Frame হল R এর একটি শক্তিশালী ডেটা স্ট্রাকচার যা টেবিল আকারে ডেটা সংরক্ষণ এবং বিশ্লেষণ করার জন্য ব্যবহৃত হয়।
এটি বিভিন্ন ডেটা টাইপ (যেমন: numeric, character, logical) ধারণ করতে পারে।
ডেটা ফ্রেমে ডেটা অ্যাক্সেস করার জন্য $, [[ ]], এবং [ ] ব্যবহার করা হয়।
ডেটা ফ্রেমে নতুন কলাম যোগ, কলাম মুছে ফেলা, সাইজ চেক করা, সাজানো এবং ফিল্টার করার মতো বিভিন্ন ম্যানিপুলেশন করা যায়।

এভাবে R এ ডেটা ফ্রেম ব্যবহার এবং ম্যানিপুলেশন করতে পারেন, যা ডেটা সায়েন্স এবং পরিসংখ্যান বিশ্লেষণের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By

Azizar Rahman Aziz

Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)

371

R-এ Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)

Data Frame হল R প্রোগ্রামিং ভাষার একটি অন্যতম গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা টেবিলের মতো ডেটা সংরক্ষণ করে। এটি বিভিন্ন প্রকারের ডেটা যেমন সংখ্যা, স্ট্রিং, লজিক্যাল ভ্যালু ইত্যাদি একত্রে সংরক্ষণ করতে পারে। R-এ Data Frame এর উপরে অনেক ধরনের অপারেশন করা যায়, যেমন Selection, Subsetting এবং Manipulation। এখানে মূলত Selection এবং Subsetting এর অপারেশনগুলোর বিস্তারিত আলোচনা করা হবে।

১. Data Frame তৈরি (Creating a Data Frame)

R-এ data.frame() ফাংশন ব্যবহার করে সহজেই একটি ডেটা ফ্রেম তৈরি করা যায়। এতে বিভিন্ন ধরনের ডেটা টাইপ যেমন চরিত্র (character), সংখ্যা (numeric), এবং লজিক্যাল (logical) যুক্ত করা যেতে পারে।

উদাহরণ:

# Data Frame তৈরি করা
df <- data.frame(
  Name = c("John", "Jane", "Tom", "Lucy"),
  Age = c(28, 34, 22, 41),
  Gender = c("Male", "Female", "Male", "Female"),
  Score = c(88, 92, 75, 95)
)

# Data Frame প্রদর্শন
print(df)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
2 Jane  34 Female    92
3 Tom   22   Male    75
4 Lucy  41 Female    95

২. Selection (Data Frame থেকে Selection)

Selection দ্বারা মানে হল যে একটি Data Frame থেকে নির্দিষ্ট কলাম বা সারি নির্বাচন করা। বিভিন্ন ফাংশন এবং অপারেটরের মাধ্যমে এটি করা সম্ভব।

কলাম সিলেকশন:

R-এ একটি Data Frame থেকে একটি কলাম নির্বাচন করার জন্য [ বা $ অপারেটর ব্যবহার করা হয়।

উদাহরণ:

# একটি কলাম নির্বাচন (এখানে 'Age' কলাম)
age_column <- df$Age
print(age_column)

আউটপুট:

[1] 28 34 22 41

একই কাজ [ অপারেটর দিয়েও করা যেতে পারে:

# একটি কলাম নির্বাচন
age_column <- df[ , "Age"]
print(age_column)

আউটপুট:

[1] 28 34 22 41

সারি সিলেকশন:

Data Frame থেকে একটি নির্দিষ্ট সারি নির্বাচন করার জন্য [ অপারেটর ব্যবহার করা হয়। এখানে আপনাকে প্রথম আর্গুমেন্ট হিসেবে সারির সংখ্যা এবং দ্বিতীয় আর্গুমেন্ট হিসেবে কলামের সংখ্যা দিতে হবে।

# প্রথম সারি নির্বাচন
first_row <- df[1, ]
print(first_row)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88

৩. Subsetting (Data Frame থেকে Subsetting)

Subsetting দ্বারা মানে হল Data Frame এর একটি নির্দিষ্ট অংশ নির্বাচন করা, যেমন একটি নির্দিষ্ট শর্তের ওপর ভিত্তি করে কলাম বা সারি নির্বাচন করা।

সারি বা কলাম নির্বাচন শর্তের মাধ্যমে:

Data Frame থেকে একটি নির্দিষ্ট শর্ত মেনে ডেটা বের করার জন্য subset() ফাংশন ব্যবহার করা হয়। এছাড়া, সাধারণভাবে [ অপারেটর দিয়ে বিভিন্ন শর্তে সারি নির্বাচন করা যায়।

উদাহরণ ১: বয়স 30 এর কম নির্বাচন করা

# subset ফাংশন ব্যবহার করে বয়স 30 এর কম নির্বাচন করা
subset_df <- subset(df, Age < 30)
print(subset_df)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
3 Tom   22   Male    75

উদাহরণ ২: লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা

# subset ফাংশন ব্যবহার করে লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা
subset_df2 <- subset(df, Gender == "Female" & Score > 90)
print(subset_df2)

আউটপুট:

  Name Age Gender Score
2 Jane  34 Female    92
4 Lucy  41 Female    95

কলাম নির্বাচন শর্তের মাধ্যমে:

Data Frame থেকে একটি নির্দিষ্ট কলাম নির্বাচন করতে শর্ত ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, Score কলাম থেকে 80 এর বেশি মানগুলি নির্বাচন করা:

# Score কলাম থেকে 80 এর বেশি নির্বাচন করা
subset_score <- df[df$Score > 80, ]
print(subset_score)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
2 Jane  34 Female    92
4 Lucy  41 Female    95

৪. Data Frame Manipulation (Data Frame ম্যানিপুলেশন)

ডেটা ফ্রেমে ডেটা সিলেকশন এবং সাবসেটিং করার পর, আপনি বিভিন্ন রকম ম্যানিপুলেশনও করতে পারেন, যেমন ডেটা ফিল্টার, ডেটা যোগ করা বা মুছে ফেলা, কলাম যোগ করা ইত্যাদি।

কলাম যোগ করা:

নতুন একটি কলাম যোগ করতে পারেন:

# একটি নতুন কলাম যোগ করা
df$Country <- c("USA", "Canada", "USA", "UK")
print(df)

আউটপুট:

  Name Age Gender Score Country
1 John  28   Male    88     USA
2 Jane  34 Female    92  Canada
3 Tom   22   Male    75     USA
4 Lucy  41 Female    95      UK

কলাম মুছে ফেলা:

কোনো কলাম মুছে ফেলতে df$column_name <- NULL ব্যবহার করা হয়।

# 'Country' কলাম মুছে ফেলা
df$Country <- NULL
print(df)

আউটপুট:

  Name Age Gender Score
1 John  28   Male    88
2 Jane  34 Female    92
3 Tom   22   Male    75
4 Lucy  41 Female    95

সারসংক্ষেপ

Selection: Data Frame থেকে নির্দিষ্ট কলাম বা সারি নির্বাচন করার জন্য $ অপারেটর বা [ অপারেটর ব্যবহার করা হয়।
Subsetting: Data Frame এর নির্দিষ্ট অংশ শর্তের ভিত্তিতে নির্বাচন করতে subset() ফাংশন বা [ অপারেটর ব্যবহার করা হয়।
Manipulation: Data Frame এ নতুন কলাম যোগ করা, কলাম মুছে ফেলা ইত্যাদি অপারেশন করা যায়।

এছাড়া R-এ Data Frame এর আরও অনেক অপারেশন যেমন গ্রুপিং, সোর্টিং, রিডিং এবং রাইটিং করা যায় যা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By

Azizar Rahman Aziz

Strings এবং Dates এর সাথে কাজ করা

349

R প্রোগ্রামিং: Strings এবং Dates এর সাথে কাজ করা

R-এ strings (স্ট্রিং) এবং dates (তারিখ) এর সাথে কাজ করা খুবই সাধারণ এবং গুরুত্বপূর্ণ, বিশেষত ডেটা সায়েন্স, পরিসংখ্যান, এবং ডেটা প্রিপ্রসেসিংয়ে। R-এ স্ট্রিং এবং তারিখের সাথে কাজ করতে বিভিন্ন ফাংশন এবং প্যাকেজ রয়েছে।

নিচে strings এবং dates এর সাথে কাজ করার জন্য কিছু গুরুত্বপূর্ণ ফাংশন এবং উদাহরণ দেওয়া হলো।

১. Strings এর সাথে কাজ করা

Strings হলো টেক্সট ডেটা, এবং R-এ আপনি বিভিন্ন স্ট্রিং ফাংশন ব্যবহার করে স্ট্রিং ম্যানিপুলেশন করতে পারবেন।

কিছু স্ট্রিং ফাংশন:

nchar(): স্ট্রিং এর দৈর্ঘ্য বের করা।
```
str <- "Hello, World!"
nchar(str)  # আউটপুট হবে 13
```
toupper(): স্ট্রিং কে বড় অক্ষরে রূপান্তর করা।
```
str <- "hello"
toupper(str)  # আউটপুট হবে "HELLO"
```
tolower(): স্ট্রিং কে ছোট অক্ষরে রূপান্তর করা।
```
str <- "HELLO"
tolower(str)  # আউটপুট হবে "hello"
```

substr(): স্ট্রিং থেকে একটি নির্দিষ্ট অংশ বের করা।

str <- "Hello, World!"
substr(str, 1, 5)  # আউটপুট হবে "Hello" (প্রথম ৫ অক্ষর)

paste(): একাধিক স্ট্রিং যোগ করা।

str1 <- "Hello"
str2 <- "World"
paste(str1, str2)  # আউটপুট হবে "Hello World"

gsub(): স্ট্রিংয়ে একটি নির্দিষ্ট টেক্সট খুঁজে অন্য টেক্সট দ্বারা প্রতিস্থাপন করা।
```
str <- "Hello, World!"
gsub("World", "R", str)  # আউটপুট হবে "Hello, R!"
```

strsplit(): স্ট্রিংকে একটি নির্দিষ্ট সেপারেটর দ্বারা ভাগ করা।

str <- "Hello,World,How,Are,You"
strsplit(str, ",")  # আউটপুট হবে একটি লিস্ট: c("Hello", "World", "How", "Are", "You")

২. Dates (তারিখ) এর সাথে কাজ করা

R-এ তারিখ এবং সময়ের সাথে কাজ করার জন্য বেশ কিছু বিল্ট-ইন ফাংশন রয়েছে। Date এবং POSIXt টাইপ তারিখ এবং সময়ের ডেটা টেমপ্লেট হিসেবে ব্যবহৃত হয়।

কিছু তারিখ ফাংশন:

Sys.Date(): বর্তমান তারিখ নেওয়া।

Sys.Date()  # আউটপুট হবে "2024-11-10" (বর্তমান তারিখ)

as.Date(): স্ট্রিং থেকে তারিখে রূপান্তর করা।
```
date_str <- "2024-11-10"
as.Date(date_str)  # আউটপুট হবে  "2024-11-10"
```
format(): তারিখের ফরম্যাট পরিবর্তন করা।
```
date <- as.Date("2024-11-10")
format(date, "%B %d, %Y")  # আউটপুট হবে "November 10, 2024"
```
এখানে %B, %d, এবং %Y হল তারিখের অংশগুলোর প্রতিনিধিত্বকারী কোড:
- %B = মাসের নাম (পুরো)
- %d = মাসের দিন
- %Y = বছর

strptime(): স্ট্রিং থেকে তারিখ এবং সময়ের রূপান্তর করা।

datetime_str <- "2024-11-10 14:35:00"
strptime(datetime_str, "%Y-%m-%d %H:%M:%S")  # আউটপুট হবে একটি POSIXct তারিখ

difftime(): দুটি তারিখ বা সময়ের মধ্যে পার্থক্য হিসাব করা।
```
date1 <- as.Date("2024-11-01")
date2 <- as.Date("2024-11-10")
difftime(date2, date1)  # আউটপুট হবে "9 days"
```
today() এবং now() (lubridate প্যাকেজ): বর্তমান তারিখ এবং সময় নেওয়া।
```
library(lubridate)
today()  # বর্তমান তারিখ
now()    # বর্তমান তারিখ ও সময়
```

৩. Lubridate প্যাকেজ (তারিখ ও সময়ের জন্য)

lubridate প্যাকেজ R-এ তারিখ এবং সময়ের সাথে আরও সহজভাবে কাজ করার জন্য ডিজাইন করা হয়েছে। এটি তারিখের ফরম্যাটের সাথে কাজ করা এবং ক্যালেন্ডার অনুযায়ী হিসাব করা সহজ করে তোলে।

উদাহরণ:

ymd(): তারিখের স্ট্রিং থেকে তারিখ তৈরি করা।
```
library(lubridate)
ymd("2024-11-10")  # আউটপুট হবে  "2024-11-10"
```

today(): আজকের তারিখ নেওয়া।

today()  # আউটপুট হবে বর্তমান তারিখ

hour(), minute(), second(): সময়ের বিভিন্ন অংশ বের করা।

time <- ymd_hms("2024-11-10 14:35:00")
hour(time)    # আউটপুট হবে 14
minute(time)  # আউটপুট হবে 35
second(time)  # আউটপুট হবে 00

সারসংক্ষেপ

Strings: R-এ স্ট্রিং নিয়ে কাজ করার জন্য nchar(), toupper(), tolower(), substr(), paste(), এবং gsub() ফাংশন ব্যবহৃত হয়। এছাড়া স্ট্রিং বিভক্ত করতে strsplit() এবং ম্যানিপুলেট করতে paste() ব্যবহার করা হয়।
Dates: তারিখের জন্য as.Date(), Sys.Date(), format(), এবং difftime() ফাংশন ব্যবহার করা হয়। এছাড়া, তারিখ এবং সময়ের বিশদ নিয়ন্ত্রণের জন্য lubridate প্যাকেজে ymd(), today(), now() ইত্যাদি ফাংশন ব্যবহৃত হয়।

এই ফাংশনগুলো ডেটা সায়েন্স এবং পরিসংখ্যান বিশ্লেষণের ক্ষেত্রে অত্যন্ত কার্যকরী এবং ব্যবহারিক।

Content added By

Azizar Rahman Aziz

R এর ভূমিকা (Introduction to R) R এর বেসিক সিনট্যাক্স (Basic Syntax of R) Vectors, Lists, এবং Matrices (ভেক্টরস, লিস্টস, এবং ম্যাট্রিক্সেস) Control Flow Statements (নিয়ন্ত্রণ প্রবাহ স্টেটমেন্টস) Functions in R (R এ ফাংশনস)

Factors এবং Data Frames (ফ্যাক্টরস এবং ডেটা ফ্রেমস)

Factors এর ভূমিকা এবং তৈরি করা

Factors এর ভূমিকা

১. ক্যাটাগোরিক্যাল ডেটা সংরক্ষণ:

২. মেমরি ব্যবস্থাপনা:

৩. বিশ্লেষণ এবং মডেলিং:

৪. ডেটার শ্রেণীবিভাগ (Levels):

Factors তৈরি করা

১. Factor তৈরি করা

২. Levels নির্ধারণ করা

৩. Factor এর levels পরিবর্তন করা

৪. Factor এর Summary

Factors এর গাণিতিক ও লজিক্যাল অপারেশন

১. Factors এর গাণিতিক অপারেশন

২. Factors এর লজিক্যাল অপারেশন

Factors এর সুবিধা এবং ব্যবহার

সারসংক্ষেপ

Factors এর ভূমিকা এবং তৈরি করা

Factors এর ভূমিকা এবং তৈরি করা

Factors এর ভূমিকা

১. ক্যাটাগোরিক্যাল ডেটা সংরক্ষণ:

২. মেমরি ব্যবস্থাপনা:

৩. বিশ্লেষণ এবং মডেলিং:

৪. ডেটার শ্রেণীবিভাগ (Levels):

Factors তৈরি করা

১. Factor তৈরি করা

২. Levels নির্ধারণ করা

৩. Factor এর levels পরিবর্তন করা

৪. Factor এর Summary

Factors এর গাণিতিক ও লজিক্যাল অপারেশন

১. Factors এর গাণিতিক অপারেশন

২. Factors এর লজিক্যাল অপারেশন

Factors এর সুবিধা এবং ব্যবহার

সারসংক্ষেপ

Data Frames এর ধারণা এবং ব্যবহার

Data Frames এর ধারণা এবং ব্যবহার

১. Data Frame এর ধারণা

ডেটা ফ্রেম তৈরির উদাহরণ:

২. Data Frame তৈরির পদ্ধতি

ডেটা ফ্রেম তৈরির উদাহরণ:

৩. Data Frame এ ডেটা অ্যাক্সেস করা

৪. Data Frame ম্যানিপুলেশন

১. নতুন কলাম যোগ করা

২. কলাম/সারি মুছে ফেলা

৩. ডেটা ফ্রেমের সাইজ চেক করা

৪. ডেটা ফ্রেমের সারণী সাজানো (Sorting)

৫. ডেটা ফ্রেমের উপাদান ফিল্টার করা

৫. Data Frame এর ব্যবহার

সারসংক্ষেপ

Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)

R-এ Data Frame এর বিভিন্ন অপারেশন (Selection, Subsetting)

১. Data Frame তৈরি (Creating a Data Frame)

উদাহরণ:

২. Selection (Data Frame থেকে Selection)

কলাম সিলেকশন:

উদাহরণ:

সারি সিলেকশন:

৩. Subsetting (Data Frame থেকে Subsetting)

সারি বা কলাম নির্বাচন শর্তের মাধ্যমে:

উদাহরণ ১: বয়স 30 এর কম নির্বাচন করা

উদাহরণ ২: লিঙ্গ 'Female' এবং স্কোর 90 এর বেশি নির্বাচন করা

কলাম নির্বাচন শর্তের মাধ্যমে:

৪. Data Frame Manipulation (Data Frame ম্যানিপুলেশন)

কলাম যোগ করা:

কলাম মুছে ফেলা:

সারসংক্ষেপ

Strings এবং Dates এর সাথে কাজ করা

R প্রোগ্রামিং: Strings এবং Dates এর সাথে কাজ করা

১. Strings এর সাথে কাজ করা

কিছু স্ট্রিং ফাংশন:

২. Dates (তারিখ) এর সাথে কাজ করা

কিছু তারিখ ফাংশন:

৩. Lubridate প্যাকেজ (তারিখ ও সময়ের জন্য)

উদাহরণ:

সারসংক্ষেপ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!