Big Data and Analytics CSV, Excel এবং Text Files থেকে Data Import করা গাইড ও নোট

309

আর প্রোগ্রামিং ভাষায় ডেটা বিশ্লেষণের প্রথম পদক্ষেপ হল ডেটা ইম্পোর্ট করা। বিভিন্ন ধরনের ফাইল যেমন CSV, Excel, এবং Text Files থেকে ডেটা আর-এ ইম্পোর্ট করার জন্য কয়েকটি সহজ ফাংশন এবং প্যাকেজ রয়েছে। এই টিউটোরিয়ালে আমরা দেখব কীভাবে এই ধরনের ফাইল থেকে ডেটা ইম্পোর্ট করা যায়।


১. CSV ফাইল থেকে Data Import করা

CSV (Comma Separated Values) ফাইল হচ্ছে একটি জনপ্রিয় ফাইল ফরম্যাট, যা সাধারণত ডেটা সঞ্চয়ের জন্য ব্যবহৃত হয়। আর-এ CSV ফাইল থেকে ডেটা ইম্পোর্ট করতে read.csv() ফাংশন ব্যবহার করা হয়।

CSV ফাইল ইম্পোর্ট করার উদাহরণ:

# CSV ফাইল থেকে ডেটা ইম্পোর্ট করা
data_csv <- read.csv("path_to_file.csv")

# ইম্পোর্ট করা ডেটা দেখানো
head(data_csv)

এখানে, "path_to_file.csv" আপনার CSV ফাইলের ফাইল পাথ। head() ফাংশনটি ডেটার প্রথম ৬টি সারি দেখাতে সাহায্য করবে।

অতিরিক্ত অপশন:

  • header = TRUE: যদি CSV ফাইলের প্রথম সারিটি কলামের নাম হয়, তবে এটি ব্যবহার করতে হবে।
  • sep = ",": যদি CSV ফাইলের মধ্যে ভিন্ন সেপারেটর (যেমন, ট্যাব বা সেমিকোলন) ব্যবহার করা হয়, তবে সেপারেটর সুনির্দিষ্ট করতে হবে।

২. Excel ফাইল থেকে Data Import করা

আর-এ Excel ফাইল থেকে ডেটা ইম্পোর্ট করার জন্য readxl বা openxlsx প্যাকেজ ব্যবহৃত হয়। এই প্যাকেজগুলোর মধ্যে read_excel() ফাংশনটি ব্যবহার করে সহজেই Excel ফাইল থেকে ডেটা পড়া যায়।

Excel ফাইল থেকে ডেটা ইম্পোর্ট করার উদাহরণ:

প্রথমে, readxl প্যাকেজটি ইনস্টল এবং লোড করতে হবে:

# readxl প্যাকেজ ইনস্টল করা (যদি আগে ইনস্টল না করা থাকে)
install.packages("readxl")

# readxl প্যাকেজ লোড করা
library(readxl)

# Excel ফাইল থেকে ডেটা ইম্পোর্ট করা
data_excel <- read_excel("path_to_file.xlsx")

# ইম্পোর্ট করা ডেটা দেখানো
head(data_excel)

এখানে, "path_to_file.xlsx" আপনার Excel ফাইলের পাথ। head() ফাংশনটি প্রথম ৬টি সারি দেখাবে।

অতিরিক্ত অপশন:

  • sheet: যদি একাধিক শীট থাকে, তবে নির্দিষ্ট শীটের নাম বা সংখ্যা উল্লেখ করতে হবে। উদাহরণ: read_excel("file.xlsx", sheet = 2)

৩. Text Files থেকে Data Import করা

Text Files সাধারণত সাদা টেক্সট বা ডাটা সঞ্চয়ের জন্য ব্যবহৃত হয়, এবং সাধারণত স্পেস, কমা বা সেমিকোলন দিয়ে মান পৃথক করা হয়। আর-এ Text Files থেকে ডেটা ইম্পোর্ট করতে read.table() বা read.delim() ফাংশন ব্যবহার করা হয়।

Text File থেকে ডেটা ইম্পোর্ট করার উদাহরণ:

# Text ফাইল থেকে ডেটা ইম্পোর্ট করা
data_text <- read.table("path_to_file.txt", header = TRUE, sep = "\t")

# ইম্পোর্ট করা ডেটা দেখানো
head(data_text)

এখানে:

  • "path_to_file.txt" হল আপনার টেক্সট ফাইলের পাথ।
  • header = TRUE নিশ্চিত করে যে, ফাইলের প্রথম সারিটি কলামের নাম।
  • sep = "\t" ট্যাব দ্বারা মান পৃথক করা হলে এটি ব্যবহার করতে হয়। আপনি যদি স্পেস বা কমা দ্বারা মান পৃথক করতে চান, তবে সেগুলির জন্য যথাযথ সেপারেটর উল্লেখ করবেন (sep = "," বা sep = " ").

অতিরিক্ত অপশন:

  • stringsAsFactors = FALSE: যদি টেক্সট ফাইলের কিছু কলামকে স্ট্রিং হিসেবে দেখতে চান, তবে এই অপশন ব্যবহার করা হয়।
  • na.strings = "NA": যদি ফাইলে কোন নিখোঁজ মান বা missing values থাকে, তবে সেগুলিকে সঠিকভাবে চিহ্নিত করতে এই অপশন ব্যবহার করা হয়।

সারাংশ

আর প্রোগ্রামিংয়ে ডেটা ইম্পোর্ট করার জন্য বিভিন্ন ফাইল ফরম্যাট যেমন CSV, Excel, এবং Text Files থেকে ডেটা সহজেই ইম্পোর্ট করা যায়। CSV ফাইলের জন্য read.csv() ফাংশন, Excel ফাইলের জন্য read_excel() ফাংশন, এবং Text ফাইলের জন্য read.table() বা read.delim() ফাংশন ব্যবহার করা হয়। এই ফাংশনগুলোকে বিভিন্ন অপশন দিয়ে কাস্টমাইজ করা যেতে পারে, যেমন শীট নির্বাচন, সেপারেটর চিহ্নিতকরণ, এবং মিসিং ভ্যালু চিহ্নিত করা।

Content added By
Promotion

Are you sure to start over?

Loading...