Strings এবং Dates এর সাথে কাজ করা

Factors এবং Data Frames (ফ্যাক্টরস এবং ডেটা ফ্রেমস) - আর প্রোগ্রামিং (R Programming) - Computer Programming

296

R প্রোগ্রামিং: Strings এবং Dates এর সাথে কাজ করা

R-এ strings (স্ট্রিং) এবং dates (তারিখ) এর সাথে কাজ করা খুবই সাধারণ এবং গুরুত্বপূর্ণ, বিশেষত ডেটা সায়েন্স, পরিসংখ্যান, এবং ডেটা প্রিপ্রসেসিংয়ে। R-এ স্ট্রিং এবং তারিখের সাথে কাজ করতে বিভিন্ন ফাংশন এবং প্যাকেজ রয়েছে।

নিচে strings এবং dates এর সাথে কাজ করার জন্য কিছু গুরুত্বপূর্ণ ফাংশন এবং উদাহরণ দেওয়া হলো।


১. Strings এর সাথে কাজ করা

Strings হলো টেক্সট ডেটা, এবং R-এ আপনি বিভিন্ন স্ট্রিং ফাংশন ব্যবহার করে স্ট্রিং ম্যানিপুলেশন করতে পারবেন।

কিছু স্ট্রিং ফাংশন:

  1. nchar(): স্ট্রিং এর দৈর্ঘ্য বের করা।

    str <- "Hello, World!"
    nchar(str)  # আউটপুট হবে 13
  2. toupper(): স্ট্রিং কে বড় অক্ষরে রূপান্তর করা।

    str <- "hello"
    toupper(str)  # আউটপুট হবে "HELLO"
  3. tolower(): স্ট্রিং কে ছোট অক্ষরে রূপান্তর করা।

    str <- "HELLO"
    tolower(str)  # আউটপুট হবে "hello"
  4. substr(): স্ট্রিং থেকে একটি নির্দিষ্ট অংশ বের করা।

    str <- "Hello, World!"
    substr(str, 1, 5)  # আউটপুট হবে "Hello" (প্রথম ৫ অক্ষর)
  5. paste(): একাধিক স্ট্রিং যোগ করা।

    str1 <- "Hello"
    str2 <- "World"
    paste(str1, str2)  # আউটপুট হবে "Hello World"
  6. gsub(): স্ট্রিংয়ে একটি নির্দিষ্ট টেক্সট খুঁজে অন্য টেক্সট দ্বারা প্রতিস্থাপন করা।

    str <- "Hello, World!"
    gsub("World", "R", str)  # আউটপুট হবে "Hello, R!"
  7. strsplit(): স্ট্রিংকে একটি নির্দিষ্ট সেপারেটর দ্বারা ভাগ করা।

    str <- "Hello,World,How,Are,You"
    strsplit(str, ",")  # আউটপুট হবে একটি লিস্ট: c("Hello", "World", "How", "Are", "You")

২. Dates (তারিখ) এর সাথে কাজ করা

R-এ তারিখ এবং সময়ের সাথে কাজ করার জন্য বেশ কিছু বিল্ট-ইন ফাংশন রয়েছে। Date এবং POSIXt টাইপ তারিখ এবং সময়ের ডেটা টেমপ্লেট হিসেবে ব্যবহৃত হয়।

কিছু তারিখ ফাংশন:

  1. Sys.Date(): বর্তমান তারিখ নেওয়া।

    Sys.Date()  # আউটপুট হবে "2024-11-10" (বর্তমান তারিখ)
  2. as.Date(): স্ট্রিং থেকে তারিখে রূপান্তর করা।

    date_str <- "2024-11-10"
    as.Date(date_str)  # আউটপুট হবে  "2024-11-10"
  3. format(): তারিখের ফরম্যাট পরিবর্তন করা।

    date <- as.Date("2024-11-10")
    format(date, "%B %d, %Y")  # আউটপুট হবে "November 10, 2024"

    এখানে %B, %d, এবং %Y হল তারিখের অংশগুলোর প্রতিনিধিত্বকারী কোড:

    • %B = মাসের নাম (পুরো)
    • %d = মাসের দিন
    • %Y = বছর
  4. strptime(): স্ট্রিং থেকে তারিখ এবং সময়ের রূপান্তর করা।

    datetime_str <- "2024-11-10 14:35:00"
    strptime(datetime_str, "%Y-%m-%d %H:%M:%S")  # আউটপুট হবে একটি POSIXct তারিখ
  5. difftime(): দুটি তারিখ বা সময়ের মধ্যে পার্থক্য হিসাব করা।

    date1 <- as.Date("2024-11-01")
    date2 <- as.Date("2024-11-10")
    difftime(date2, date1)  # আউটপুট হবে "9 days"
  6. today() এবং now() (lubridate প্যাকেজ): বর্তমান তারিখ এবং সময় নেওয়া।

    library(lubridate)
    today()  # বর্তমান তারিখ
    now()    # বর্তমান তারিখ ও সময়

৩. Lubridate প্যাকেজ (তারিখ ও সময়ের জন্য)

lubridate প্যাকেজ R-এ তারিখ এবং সময়ের সাথে আরও সহজভাবে কাজ করার জন্য ডিজাইন করা হয়েছে। এটি তারিখের ফরম্যাটের সাথে কাজ করা এবং ক্যালেন্ডার অনুযায়ী হিসাব করা সহজ করে তোলে।

উদাহরণ:

  1. ymd(): তারিখের স্ট্রিং থেকে তারিখ তৈরি করা।

    library(lubridate)
    ymd("2024-11-10")  # আউটপুট হবে  "2024-11-10"
  2. today(): আজকের তারিখ নেওয়া।

    today()  # আউটপুট হবে বর্তমান তারিখ
  3. hour(), minute(), second(): সময়ের বিভিন্ন অংশ বের করা।

    time <- ymd_hms("2024-11-10 14:35:00")
    hour(time)    # আউটপুট হবে 14
    minute(time)  # আউটপুট হবে 35
    second(time)  # আউটপুট হবে 00

সারসংক্ষেপ

  • Strings: R-এ স্ট্রিং নিয়ে কাজ করার জন্য nchar(), toupper(), tolower(), substr(), paste(), এবং gsub() ফাংশন ব্যবহৃত হয়। এছাড়া স্ট্রিং বিভক্ত করতে strsplit() এবং ম্যানিপুলেট করতে paste() ব্যবহার করা হয়।
  • Dates: তারিখের জন্য as.Date(), Sys.Date(), format(), এবং difftime() ফাংশন ব্যবহার করা হয়। এছাড়া, তারিখ এবং সময়ের বিশদ নিয়ন্ত্রণের জন্য lubridate প্যাকেজে ymd(), today(), now() ইত্যাদি ফাংশন ব্যবহৃত হয়।

এই ফাংশনগুলো ডেটা সায়েন্স এবং পরিসংখ্যান বিশ্লেষণের ক্ষেত্রে অত্যন্ত কার্যকরী এবং ব্যবহারিক।

Content added By
Promotion

Are you sure to start over?

Loading...