Big Data and Analytics Data Structures in R গাইড ও নোট

498

আর প্রোগ্রামিং (R Programming) এ বিভিন্ন ধরনের ডেটা স্ট্রাকচার (Data Structures) রয়েছে, যা ডেটা সংরক্ষণ এবং প্রক্রিয়া করার জন্য ব্যবহৃত হয়। ডেটা স্ট্রাকচার হলো এমন একটি পদ্ধতি, যার মাধ্যমে ডেটাকে বিভিন্ন ফর্মে সাজানো এবং সংগঠিত করা যায়। আর-এ প্রধানত ৬টি ধরনের ডেটা স্ট্রাকচার ব্যবহৃত হয়: Vector, Matrix, Array, Data Frame, List, এবং Factor। প্রতিটি ডেটা স্ট্রাকচারের ব্যবহার আলাদা এবং নির্দিষ্ট ধরনের ডেটা সঞ্চালন ও বিশ্লেষণের জন্য উপযুক্ত।


R এর প্রধান ডেটা স্ট্রাকচার

১. ভেক্টর (Vector)

ভেক্টর হলো আর-এ সবচেয়ে সাধারণ ডেটা স্ট্রাকচার, যা এক ধরনের একই ধরনের ডেটা (যেমন, সংখ্যা, অক্ষর, ইত্যাদি) সংরক্ষণ করে। এটি একমাত্র ডেটা টাইপ থাকতে পারে, অর্থাৎ ভেক্টরে শুধুমাত্র এক ধরনের ডেটাই থাকতে হবে।

উদাহরণ:

# সংখ্যা দিয়ে ভেক্টর তৈরি
v <- c(1, 2, 3, 4, 5)
print(v)

# অক্ষর দিয়ে ভেক্টর তৈরি
v2 <- c("apple", "banana", "cherry")
print(v2)

২. ম্যাট্রিক্স (Matrix)

ম্যাট্রিক্স হলো দুই-ডাইমেনশনাল (2D) ডেটা স্ট্রাকচার, যেখানে রো (Row) এবং কলাম (Column) থাকে। এটি শুধুমাত্র একই ধরনের ডেটা ধারণ করতে পারে, যেমন ভেক্টর।

উদাহরণ:

# ম্যাট্রিক্স তৈরি
m <- matrix(1:6, nrow=2, ncol=3)
print(m)

৩. অ্যারে (Array)

অ্যারে হলো একাধিক ডাইমেনশনাল (Multi-dimensional) ডেটা স্ট্রাকচার, যেখানে একাধিক মাত্রা (Dimension) থাকতে পারে। এটি বিভিন্ন ধরনের ডেটা ধারণ করতে পারে, তবে অধিকাংশ ক্ষেত্রে অ্যারে শুধুমাত্র এক ধরনের ডেটা ধারণ করে থাকে।

উদাহরণ:

# অ্যারে তৈরি
a <- array(1:12, dim = c(3, 2, 2))
print(a)

৪. ডেটা ফ্রেম (Data Frame)

ডেটা ফ্রেম হলো একটি টেবিল আকারের ডেটা স্ট্রাকচার, যেখানে রো (Row) এবং কলাম (Column) থাকে। এটি বিভিন্ন ধরনের ডেটা টাইপ ধারণ করতে পারে, যেমন সংখ্যামূলক, অক্ষর, তারিখ ইত্যাদি। ডেটা ফ্রেমে প্রতিটি কলাম একটি ভেক্টর হিসেবে বিবেচিত হয়।

উদাহরণ:

# ডেটা ফ্রেম তৈরি
df <- data.frame(
  Name = c("Alice", "Bob", "Charlie"),
  Age = c(25, 30, 35),
  Salary = c(50000, 60000, 70000)
)
print(df)

৫. লিস্ট (List)

লিস্ট হলো একটি বহুমুখী ডেটা স্ট্রাকচার যা একাধিক ডেটা টাইপ ধারণ করতে পারে, যেমন ভেক্টর, ম্যাট্রিক্স, অথবা অন্যান্য লিস্ট। এটি একাধিক ডেটা স্ট্রাকচারকে একটি একক ইউনিটে সঞ্চিত করে।

উদাহরণ:

# লিস্ট তৈরি
lst <- list(Name = "Alice", Age = 25, Marks = c(90, 85, 88))
print(lst)

৬. ফ্যাক্টর (Factor)

ফ্যাক্টর হলো একটি ডেটা স্ট্রাকচার যা কেবলমাত্র ক্যাটেগোরিকাল ডেটা (যেমন, লিঙ্গ, রঙ, শ্রেণী ইত্যাদি) ধারণ করতে ব্যবহৃত হয়। এটি প্রাথমিকভাবে পরিসংখ্যানগত বিশ্লেষণে ব্যবহৃত হয় এবং ডেটাকে লেবেলযুক্ত করে সাজায়।

উদাহরণ:

# ফ্যাক্টর তৈরি
f <- factor(c("Male", "Female", "Female", "Male"))
print(f)

সারাংশ

আর প্রোগ্রামিংয়ে বিভিন্ন ধরনের ডেটা স্ট্রাকচার রয়েছে, যেগুলি ডেটা সংরক্ষণ এবং বিশ্লেষণের জন্য ব্যবহার করা হয়। এই ডেটা স্ট্রাকচারগুলোর মধ্যে ভেক্টর, ম্যাট্রিক্স, অ্যারে, ডেটা ফ্রেম, লিস্ট, এবং ফ্যাক্টর অন্যতম। প্রতিটি ডেটা স্ট্রাকচারের আলাদা ব্যবহার রয়েছে এবং ডেটার ধরন এবং প্রয়োজনে ভিত্তি করে এগুলোর নির্বাচন করা হয়।

Content added By

Vectors, Lists, এবং Matrices

393

আর প্রোগ্রামিং ভাষায় ডেটা স্ট্রাকচার ব্যবহৃত হয় ডেটা সংগঠন ও পরিচালনার জন্য। R-এ কিছু মূল ডেটা স্ট্রাকচার রয়েছে, যেমন Vectors, Lists, এবং Matrices, যা ডেটাকে বিভিন্ন ধরনের উপস্থাপনায় সাজাতে এবং বিশ্লেষণ করতে সাহায্য করে।


Vectors

Vectors আর প্রোগ্রামিং এর সবচেয়ে সাধারণ এবং গুরুত্বপূর্ণ ডেটা স্ট্রাকচার। এটি এক ধরনের একমাত্রিক অ্যারে, যেখানে এক ধরনের ডেটা (যেমন, সংখ্যার সিরিজ) রাখা হয়। R-এ ভেক্টর তৈরির জন্য c() ফাংশন ব্যবহার করা হয়।

Vectors এর বৈশিষ্ট্য:

  • ভেক্টরে শুধুমাত্র এক ধরনের ডেটা (Numeric, Character, Logical) থাকতে পারে।
  • এটি এক মাত্রিক (One-dimensional) ডেটা ধারণ করে।

ভেক্টর তৈরির উদাহরণ:

# Numeric Vector
num_vector <- c(1, 2, 3, 4, 5)

# Character Vector
char_vector <- c("apple", "banana", "cherry")

# Logical Vector
logical_vector <- c(TRUE, FALSE, TRUE)

ভেক্টরের কিছু কাজ:

  • ভেক্টর থেকে নির্দিষ্ট উপাদান অ্যাক্সেস করা:
num_vector[3]  # আউটপুট হবে 3
  • ভেক্টরের আকার জানা:
length(num_vector)  # আউটপুট হবে 5

Lists

Lists হলো একটি উন্নত ডেটা স্ট্রাকচার, যেখানে বিভিন্ন ধরনের ডেটা (যেমন, ভেক্টর, নাম্বার, ক্যারেক্টার, অন্যান্য লিস্ট) একত্রিত করে রাখা যায়। এর মানে হল যে, লিস্টে বিভিন্ন ধরনের ডেটা একসাথে রাখা যেতে পারে।

Lists এর বৈশিষ্ট্য:

  • লিস্টে একাধিক ডেটা টাইপের উপাদান থাকতে পারে (যেমন, ভেক্টর, নাম্বার, স্ট্রিং ইত্যাদি)।
  • লিস্টে যে কোনো ধরনের ডেটা অন্তর্ভুক্ত করা যায়।

লিস্ট তৈরির উদাহরণ:

# List of different data types
my_list <- list(name="John", age=30, scores=c(90, 85, 88), is_student=FALSE)

লিস্টের উপাদান অ্যাক্সেস করা:

my_list$name  # আউটপুট হবে "John"
my_list[[3]]  # আউটপুট হবে 90 85 88

Matrices

Matrices হলো দ্বিমাত্রিক (Two-dimensional) ডেটা স্ট্রাকচার, যেখানে একই ধরনের ডেটা সারি (Rows) এবং কলাম (Columns) আকারে রাখা হয়। এটি একটি সোজাসুজি টেবিলের মত কাজ করে। মেট্রিক্স তৈরি করার জন্য matrix() ফাংশন ব্যবহার করা হয়।

Matrices এর বৈশিষ্ট্য:

  • মেট্রিক্সে শুধুমাত্র এক ধরনের ডেটা থাকতে পারে (যেমন, Numeric)।
  • এটি দুটি মাত্রা (Rows এবং Columns) নিয়ে গঠিত।

মেট্রিক্স তৈরির উদাহরণ:

# Creating a matrix
my_matrix <- matrix(1:9, nrow=3, ncol=3)

মেট্রিক্সের উপাদান অ্যাক্সেস করা:

my_matrix[2, 3]  # আউটপুট হবে 6 (2nd row, 3rd column)

মেট্রিক্সের আকার জানার উদাহরণ:

dim(my_matrix)  # আউটপুট হবে 3 3

সারাংশ

আর প্রোগ্রামিং-এ Vectors, Lists, এবং Matrices হলো মূল ডেটা স্ট্রাকচার যা বিভিন্ন ধরনের ডেটা সংরক্ষণ এবং পরিচালনার জন্য ব্যবহৃত হয়। ভেক্টর একমাত্রিক ডেটা ধারণ করে, লিস্ট বিভিন্ন ধরনের ডেটা ধারণ করতে পারে, এবং মেট্রিক্স দ্বিমাত্রিক ডেটা সংরক্ষণে ব্যবহৃত হয়। এই ডেটা স্ট্রাকচারগুলি R-এ ডেটা ম্যানিপুলেশন ও বিশ্লেষণের জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By

Arrays এবং Data Frames

405

R প্রোগ্রামিং ভাষায় ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য অনেক ধরনের ডেটা স্ট্রাকচার ব্যবহৃত হয়। এর মধ্যে Arrays এবং Data Frames দুইটি গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা বিভিন্ন ধরণের ডেটা একত্রে সংরক্ষণ এবং পরিচালনা করতে ব্যবহৃত হয়।


Arrays

আর প্রোগ্রামিং-এ Array একটি মাল্টি-ডাইমেনশনাল ডেটা স্ট্রাকচার যা সমজাতীয় (Homogeneous) ডেটা ধারণ করতে সক্ষম। এটি সাধারণত সংখ্যাসূচক (Numerical) ডেটা ধারণ করে এবং একাধিক ডাইমেনশন (যেমন, রো (row), কলাম (column)) ধারণ করতে পারে।

Arrays এর বৈশিষ্ট্য

  • মাল্টি-ডাইমেনশনাল: Arrays এক বা একাধিক ডাইমেনশন ধারণ করতে পারে, যেমন ১D, ২D, ৩D ইত্যাদি।
  • একই ধরনের ডেটা: Arrays শুধুমাত্র একই ধরনের (যেমন, সংখ্যাসূচক, ক্যারেক্টার) ডেটা ধারণ করতে পারে।
  • Indexing: Arrays এ প্রতিটি উপাদানকে ইনডেক্স ব্যবহার করে অ্যাক্সেস করা যায়।

Array তৈরি করা

আর-এ একটি অ্যারে তৈরি করার জন্য array() ফাংশন ব্যবহার করা হয়। উদাহরণ:

# 1D array
arr1 <- array(1:6, dim = c(3, 2))  # ৩টি রো এবং ২টি কলাম

# 2D array
arr2 <- array(1:12, dim = c(3, 4)) # ৩টি রো এবং ৪টি কলাম

Array এর ব্যবহার

arr1[1,2]  # ১ম রো এবং ২য় কলামের মান
arr2[2,3]  # ২য় রো এবং ৩য় কলামের মান

Data Frames

Data Frame হলো একটি বিশেষ ধরনের ডেটা স্ট্রাকচার যা R-এ ডেটা বিশ্লেষণ ও ম্যানিপুলেশনের জন্য অত্যন্ত জনপ্রিয়। এটি বিভিন্ন ধরণের ডেটা (যেমন, সংখ্যাসূচক, ক্যারেক্টার, তারিখ ইত্যাদি) একত্রে ধারণ করতে পারে এবং এটি একটি টেবিলের মতো সাজানো থাকে, যেখানে প্রতিটি কলাম আলাদা ধরনের ডেটা ধারণ করতে পারে।

Data Frame এর বৈশিষ্ট্য

  • মিশ্র ধরনের ডেটা: Data Frame এ বিভিন্ন ধরনের ডেটা যেমন সংখ্যা, ক্যারেক্টার, তারিখ ইত্যাদি একত্রে রাখা যায়।
  • রো ও কলাম: Data Frame এ ডেটা টেবিল আকারে থাকে, যেখানে রো (row) গুলি পর্যবেক্ষণ এবং কলাম (column) গুলি ভেরিয়েবল নির্দেশ করে।
  • আরও সহজ ডেটা ম্যানিপুলেশন: Data Frame R-এ ডেটা বিশ্লেষণ এবং ম্যানিপুলেশনের জন্য সহজে ব্যবহারযোগ্য হয়।

Data Frame তৈরি করা

R-এ একটি Data Frame তৈরি করার জন্য data.frame() ফাংশন ব্যবহার করা হয়। উদাহরণ:

# Data frame তৈরি করা
df <- data.frame(
  Name = c("John", "Sara", "Peter"),
  Age = c(23, 25, 22),
  Salary = c(3000, 3500, 4000)
)

Data Frame এর ব্যবহার

# কলাম অ্যাক্সেস করা
df$Name  # Name কলামের ডেটা

# রো অ্যাক্সেস করা
df[1,]   # ১ম রো
df[ ,2]  # ২য় কলাম

Data Frame এ নতুন কলাম যোগ করা

# নতুন কলাম যোগ করা
df$Gender <- c("Male", "Female", "Male")

Arrays এবং Data Frames এর মধ্যে পার্থক্য

বৈশিষ্ট্যArraysData Frames
ডেটার ধরনএকই ধরনের ডেটা (Homogeneous)ভিন্ন ধরনের ডেটা (Heterogeneous)
ডাইমেনশনএক বা একাধিক ডাইমেনশন (Multi-dimensional)এক বা একাধিক কলাম এবং রো
ব্যবহারসংখ্যা, বৈজ্ঞানিক ডেটা ইত্যাদিডেটা বিশ্লেষণ, ভেরিয়েবল ম্যানিপুলেশন
কর্মপ্রবাহসাধারণত গাণিতিক বা পরিসংখ্যানগত কাজটেবিল আকারে ডেটা বিশ্লেষণ এবং ম্যানিপুলেশন

সারাংশ

Arrays এবং Data Frames দুটি গুরুত্বপূর্ণ ডেটা স্ট্রাকচার যা R প্রোগ্রামিং ভাষায় ডেটা সংরক্ষণ এবং ম্যানিপুলেশনের জন্য ব্যবহৃত হয়। Arrays মাল্টি-ডাইমেনশনাল সমজাতীয় ডেটা ধারণ করে, যেখানে Data Frames মিশ্র ধরনের ডেটা ধারণ করে এবং এটি টেবিল আকারে থাকে। Data Frames পরিসংখ্যানগত বিশ্লেষণ এবং ডেটা ম্যানিপুলেশনের জন্য একটি শক্তিশালী টুল, যা Arrays এর তুলনায় অধিক ব্যবহারিক এবং কার্যকর।

Content added By

Factors এবং তাদের ব্যবহার

328

আর প্রোগ্রামিং-এ Factors হল একটি বিশেষ ধরনের ডেটা টাইপ, যা সাধারণত ক্যাটেগরিকাল (Categorical) ডেটার জন্য ব্যবহৃত হয়। ক্যাটেগরিকাল ডেটা হল এমন ডেটা, যা নির্দিষ্ট শ্রেণীতে বা ক্যাটেগরিতে বিভক্ত থাকে, যেমন লিঙ্গ (পুরুষ/মহিলা), রঙ (লাল/নীল/সবুজ), বা গ্রেড (এ/বি/সি)। Factors মূলত ভেরিয়েবলগুলোর মানের মধ্যে সীমিত বা নির্দিষ্ট সংখ্যা (Levels) রাখে, যা এর ব্যবহারে একাধিক সুবিধা প্রদান করে।


Factors এর বৈশিষ্ট্য

১. ক্যাটেগরিকাল ডেটা (Categorical Data)

Factors ক্যাটেগরিকাল ডেটা স্টোর করার জন্য ব্যবহৃত হয়। উদাহরণস্বরূপ, একটি ছাত্রের গ্রেড যদি "এ", "বি", এবং "সি" হয়, তবে এই ধরনের ডেটাকে Factor হিসেবে সংরক্ষণ করা হয়।

২. লেভেলস (Levels)

Factors-এ সাধারণত কিছু নির্দিষ্ট মান বা levels থাকে, যা ডেটার শ্রেণী বা ক্যাটেগরি নির্দেশ করে। উদাহরণস্বরূপ, লিঙ্গের ক্ষেত্রে লেভেল হতে পারে "পুরুষ" এবং "মহিলা", এবং রঙের ক্ষেত্রে লেভেল হতে পারে "লাল", "নীল", "সবুজ"।

৩. সিস্টেম মেমরি দক্ষতা (Memory Efficiency)

Factors গুলি মেমরি দক্ষতার সাথে ডেটা সংরক্ষণ করতে সহায়তা করে, বিশেষ করে যখন আপনি অনেক ক্যাটেগরি এবং ছোট স্ট্রিং মান সংরক্ষণ করেন। Factors-এ প্রতিটি লেভেলকে একটি র‍্যাঙ্ক বা ইনডেক্স হিসেবে সংরক্ষণ করা হয়, যা মেমরি ব্যবহারে বেশি সুবিধা প্রদান করে।


Factors তৈরি করা

R-এ একটি ভেরিয়েবলকে factor এ রূপান্তর করতে আমরা factor() ফাংশন ব্যবহার করি। নিচে একটি উদাহরণ দেওয়া হলো:

# একটি ক্যাটেগরিকাল ভেরিয়েবল তৈরি
grades <- c("A", "B", "A", "C", "B", "A")

# ভেরিয়েবলটিকে factor এ রূপান্তর করা
grade_factor <- factor(grades)

# ফলাফল দেখানো
print(grade_factor)

এই কোডটি একটি ক্যাটেগরিকাল ভেরিয়েবল grades তৈরি করবে এবং পরে তা factor এ রূপান্তরিত করবে। এর মাধ্যমে আমরা প্রতিটি মানের জন্য একটি নির্দিষ্ট লেভেল (এ, বি, সি) দেখতে পাব।


Factors এর ব্যবহার

১. ক্যাটেগরি ডেটা বিশ্লেষণ (Categorical Data Analysis)

Factors ডেটা বিশ্লেষণের জন্য ব্যবহার করা হয় যেখানে ডেটার মান নির্দিষ্ট শ্রেণীতে বিভক্ত থাকে। উদাহরণস্বরূপ, আপনি যদি একজন ছাত্রের পাস/ফেইল তথ্য বিশ্লেষণ করেন, তবে এই ডেটার জন্য factors ব্যবহার করা হবে।

২. মডেলিং এবং পরিসংখ্যান (Modeling and Statistics)

Factors খুবই গুরুত্বপূর্ণ যখন আপনি পরিসংখ্যানগত মডেল বা মেশিন লার্নিং মডেল তৈরি করেন। যেমন লিনিয়ার রিগ্রেশন (Linear Regression) বা লজিস্টিক রিগ্রেশন (Logistic Regression) মডেল তৈরির সময় factors ব্যবহার করা হয়, কারণ ক্যাটেগরিকাল ভেরিয়েবলগুলিকে numerical রূপে রূপান্তর করতে factors সহায়তা করে।

৩. ডেটা ভিজ্যুয়ালাইজেশন (Data Visualization)

Factors ব্যবহার করে আপনি ডেটা ভিজ্যুয়ালাইজেশন করতে পারেন। উদাহরণস্বরূপ, ggplot2 প্যাকেজে factors ব্যবহার করে ক্যাটেগরি ভিত্তিক গ্রাফ তৈরি করা যেতে পারে, যেমন বার চিত্র (Bar Chart) বা পাই চিত্র (Pie Chart)।


Factors এর একটি উদাহরণ

ধরা যাক, আপনি একটি স্কুলে ছাত্রদের পরীক্ষার ফলাফল বিশ্লেষণ করছেন এবং ছাত্রদের গ্রেড অনুযায়ী একটি ডেটাসেট তৈরি করছেন। এই ডেটাসেটে গ্রেডগুলি ক্যাটেগরিকাল ডেটা, তাই factors ব্যবহার করা উপযুক্ত।

# ছাত্রদের গ্রেড
students <- c("Student1", "Student2", "Student3", "Student4")
grades <- c("A", "B", "A", "C")

# factors তৈরি করা
grades_factor <- factor(grades, levels = c("A", "B", "C"))

# গ্রেডের লেভেলস দেখতে
levels(grades_factor)

# ডেটাসেট তৈরি করা
student_data <- data.frame(Student = students, Grade = grades_factor)

# ডেটাসেট দেখা
print(student_data)

এই উদাহরণে, আমরা grades ভেরিয়েবলটিকে factor হিসেবে রূপান্তর করেছি এবং এর লেভেলস সংজ্ঞায়িত করেছি। এরপর আমরা একটি ডেটাসেট তৈরি করেছি, যেখানে ছাত্রদের নাম এবং গ্রেড আছে।


Factors এর সুবিধা

  • মেমরি ব্যবস্থাপনা: Factors ছোট সাইজে ক্যাটেগরিকাল ডেটা সংরক্ষণ করতে সাহায্য করে, যা মেমরি দক্ষতার সাথে ডেটা প্রসেস করতে সুবিধা দেয়।
  • বিশ্লেষণ এবং মডেলিং: Factors পরিসংখ্যানগত বিশ্লেষণ এবং মডেল তৈরির জন্য ক্যাটেগরিকাল ডেটাকে সঠিকভাবে সংজ্ঞায়িত করতে সাহায্য করে।
  • স্বয়ংক্রিয় লেভেল শনাক্তকরণ: Factors স্বয়ংক্রিয়ভাবে ডেটার বিভিন্ন লেভেল শনাক্ত করে, ফলে ডেটার শ্রেণী বা ক্যাটেগরি নিয়ে কাজ করা সহজ হয়ে যায়।

সারাংশ

Factors আর প্রোগ্রামিং-এ ক্যাটেগরিকাল ডেটা ম্যানেজমেন্ট এবং বিশ্লেষণের জন্য অত্যন্ত গুরুত্বপূর্ণ। এটি ডেটার নির্দিষ্ট লেভেলস সংরক্ষণ করতে এবং বিশ্লেষণ করার জন্য সাহায্য করে। Factors ব্যবহারের মাধ্যমে মেমরি দক্ষতা, পরিসংখ্যানগত বিশ্লেষণ এবং মডেল তৈরির প্রক্রিয়া অনেক সহজ হয়ে যায়।

Content added By

Data Structures এর মধ্যে Operations

348

আর প্রোগ্রামিং ভাষায় বিভিন্ন ধরনের ডেটা স্ট্রাকচার (Data Structures) রয়েছে, যেমন ভেক্টর (Vector), লিস্ট (List), ম্যাট্রিক্স (Matrix), ডেটা ফ্রেম (Data Frame), এবং অ্যারে (Array)। প্রতিটি ডেটা স্ট্রাকচারের জন্য নির্দিষ্ট কিছু অপারেশন (Operations) রয়েছে, যেগুলোর মাধ্যমে ডেটা ম্যানিপুলেশন করা যায়। এখানে এই ডেটা স্ট্রাকচারের উপর সাধারণ অপারেশনগুলোর আলোচনা করা হবে।


ভেক্টর (Vector)

ভেক্টর হলো আর-এ একমাত্র ডেটা স্ট্রাকচার, যেখানে এক ধরনের ডেটা (যেমন, সংখ্যার তালিকা) রাখা হয়। ভেক্টরের মধ্যে একাধিক উপাদান থাকতে পারে এবং এটি এক বা একাধিক ডেটার মান ধারণ করতে পারে।

১. ভেক্টর তৈরি করা

# সোজা ভেক্টর তৈরি করা
v <- c(1, 2, 3, 4, 5)

২. ভেক্টরের মান অ্যাক্সেস করা

# প্রথম মান (১) অ্যাক্সেস করা
v[1]

৩. ভেক্টরে নতুন উপাদান যোগ করা

# নতুন উপাদান যোগ করা
v <- c(v, 6)

৪. ভেক্টর থেকে উপাদান মুছে ফেলা

# দ্বিতীয় উপাদান মুছে ফেলা
v <- v[-2]

লিস্ট (List)

লিস্ট একটি বিশেষ ধরনের ডেটা স্ট্রাকচার, যা বিভিন্ন ধরনের ডেটা (যেমন, সংখ্যার পাশাপাশি স্ট্রিং, ভেক্টর বা অন্যান্য লিস্ট) ধারণ করতে পারে।

১. লিস্ট তৈরি করা

# লিস্ট তৈরি করা
my_list <- list(name = "John", age = 25, scores = c(90, 85, 88))

২. লিস্টের উপাদান অ্যাক্সেস করা

# "name" উপাদান অ্যাক্সেস করা
my_list$name

৩. লিস্টে নতুন উপাদান যোগ করা

# নতুন উপাদান যোগ করা
my_list$city <- "Dhaka"

৪. লিস্ট থেকে উপাদান মুছে ফেলা

# "age" উপাদান মুছে ফেলা
my_list$age <- NULL

ম্যাট্রিক্স (Matrix)

ম্যাট্রিক্স হলো এক ধরনের ডেটা স্ট্রাকচার যা একাধিক রো (row) এবং কলাম (column) ধারণ করে, এবং এটি শুধুমাত্র এক ধরনের ডেটা (যেমন, সংখ্যার) ধারণ করতে পারে।

১. ম্যাট্রিক্স তৈরি করা

# ম্যাট্রিক্স তৈরি করা
m <- matrix(1:6, nrow = 2, ncol = 3)

২. ম্যাট্রিক্সের উপাদান অ্যাক্সেস করা

# দ্বিতীয় রো এবং তৃতীয় কলামের মান অ্যাক্সেস করা
m[2, 3]

৩. ম্যাট্রিক্সে রো বা কলাম যোগ করা

# একটি নতুন কলাম যোগ করা
m <- cbind(m, c(7, 8))

৪. ম্যাট্রিক্স থেকে রো বা কলাম মুছে ফেলা

# প্রথম রো মুছে ফেলা
m <- m[-1, ]

ডেটা ফ্রেম (Data Frame)

ডেটা ফ্রেম একটি খুবই গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা টেবিলের মতো তথ্য সংরক্ষণ করে। এটি বিভিন্ন ধরনের ডেটা (যেমন, সংখ্যা, স্ট্রিং) একত্রে ধারণ করতে পারে।

১. ডেটা ফ্রেম তৈরি করা

# ডেটা ফ্রেম তৈরি করা
df <- data.frame(
  Name = c("John", "Jane", "Mike"),
  Age = c(25, 28, 22),
  Score = c(90, 85, 88)
)

২. ডেটা ফ্রেমের কলাম অ্যাক্সেস করা

# "Name" কলাম অ্যাক্সেস করা
df$Name

৩. ডেটা ফ্রেমে নতুন কলাম যোগ করা

# নতুন কলাম যোগ করা
df$City <- c("Dhaka", "Chittagong", "Rajshahi")

৪. ডেটা ফ্রেম থেকে কলাম বা রো মুছে ফেলা

# "Score" কলাম মুছে ফেলা
df$Score <- NULL

অ্যারে (Array)

অ্যারে হলো একটি মাল্টি-ডাইমেনশনাল ডেটা স্ট্রাকচার যা একাধিক ডাইমেনশন ধারণ করতে সক্ষম, এবং এটি একই ধরনের ডেটা ধারণ করে।

১. অ্যারে তৈরি করা

# অ্যারে তৈরি করা
arr <- array(1:12, dim = c(3, 2, 2))

২. অ্যারের উপাদান অ্যাক্সেস করা

# প্রথম ২x২ ম্যাট্রিক্সের প্রথম উপাদান অ্যাক্সেস করা
arr[1, 1, 1]

৩. অ্যারেতে নতুন উপাদান যোগ করা

# নতুন উপাদান যোগ করা
arr <- c(arr, 13)

সারাংশ

আর প্রোগ্রামিং-এ ডেটা স্ট্রাকচারের মধ্যে বিভিন্ন ধরনের অপারেশন করা সম্ভব। ভেক্টর, লিস্ট, ম্যাট্রিক্স, ডেটা ফ্রেম, এবং অ্যারে প্রতিটি ডেটা স্ট্রাকচারের জন্য নির্দিষ্ট কিছু অপারেশন যেমন উপাদান অ্যাক্সেস, নতুন উপাদান যোগ করা, উপাদান মুছে ফেলা ইত্যাদি করা হয়। এই অপারেশনগুলি ডেটা ম্যানিপুলেশন এবং বিশ্লেষণকে আরও সহজ এবং কার্যকরী করে তোলে।

Content added By
Promotion

Are you sure to start over?

Loading...