SARIMA মডেলের Order নির্বাচন (p, d, q, P, D, Q)

Seasonal ARIMA (SARIMA) মডেল - টাইম সিরিজ (Time Series) - Machine Learning

252

SARIMA (Seasonal AutoRegressive Integrated Moving Average) মডেলটি ARIMA মডেলের একটি বিস্তৃত সংস্করণ যা সিজনাল টাইম সিরিজ ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয়। এটি টাইম সিরিজে সিজনাল প্যাটার্ন বা ঋতু পরিবর্তন (যেমন মাসিক বা ত্রৈমাসিক বিক্রয়) এবং অন্যান্য প্রভাব বিশ্লেষণ করে ভবিষ্যতের পূর্বাভাস তৈরি করতে সাহায্য করে।

SARIMA মডেলটি ARIMA মডেলের মতো কাজ করে, তবে এতে সিজনাল (ঋতু) অংশ যোগ করা হয়েছে। SARIMA মডেলের অর্ডার নির্বাচন করতে ছয়টি প্যারামিটার ব্যবহৃত হয়: p,d,q,P,D,Qp, d, q, P, D, Q। এগুলি মডেলটির অ্যাডমিনিস্ট্রেটিভ (non-seasonal) এবং সিজনাল (seasonal) অংশের জন্য প্যারামিটার নির্দেশ করে।

SARIMA মডেলের Order (p, d, q, P, D, Q)

  1. pp (AR অংশের অর্ডার):
    • বর্ণনা: pp হলো AR (AutoRegressive) অংশের অর্ডার, যা পূর্ববর্তী সময়ের pp পরিসংখ্যান বা মানের উপর ভিত্তি করে বর্তমান মান অনুমান করে।
    • অর্থ: এটি বর্তমান পর্যবেক্ষণের জন্য পূর্ববর্তী pp সময়ের ডেটার সম্পর্ক নির্দেশ করে।
  2. dd (ডিফারেন্সিং অর্ডার):
    • বর্ণনা: dd হলো টাইম সিরিজের স্টেশনারিটি অর্জন করার জন্য ডিফারেন্সিংয়ের (difference) সংখ্যা। এটি মূলত টাইম সিরিজের ট্রেন্ড সরানোর জন্য ব্যবহৃত হয়।
    • অর্থ: যদি টাইম সিরিজে ট্রেন্ড থাকে, তাহলে ডিফারেন্সিংয়ের মাধ্যমে এটি সরানো হয়।
  3. qq (MA অংশের অর্ডার):
    • বর্ণনা: qq হলো MA (Moving Average) অংশের অর্ডার, যা বর্তমান পর্যবেক্ষণের জন্য পূর্ববর্তী ত্রুটির (error terms) উপর ভিত্তি করে বর্তমান মান অনুমান করে।
    • অর্থ: এটি টাইম সিরিজের পূর্ববর্তী ত্রুটির উপর ভিত্তি করে বর্তমান পর্যবেক্ষণের হিসাব করবে।

সিজনাল প্যারামিটার (P, D, Q)

  1. PP (সিজনাল AR অংশের অর্ডার):
    • বর্ণনা: PP হলো সিজনাল AR (Seasonal AutoRegressive) অংশের অর্ডার, যা পূর্ববর্তী ঋতুর PP পর্যবেক্ষণের উপর ভিত্তি করে বর্তমান পর্যবেক্ষণ অনুমান করে।
    • অর্থ: সিজনাল প্যাটার্ন বা ঋতু পরিবর্তনের উপর ভিত্তি করে পূর্ববর্তী ঋতুর ডেটা ব্যবহার করে ভবিষ্যৎ পূর্বাভাস তৈরি করা।
  2. DD (সিজনাল ডিফারেন্সিং অর্ডার):
    • বর্ণনা: DD হলো সিজনাল ডিফারেন্সিংয়ের অর্ডার, যা সিজনাল প্যাটার্ন বা ঋতু পরিবর্তন সরানোর জন্য ব্যবহৃত হয়।
    • অর্থ: এটি সিজনাল প্যাটার্ন দূর করতে সিজনাল ডিফারেন্সিং প্রয়োগ করার সংখ্যা নির্দেশ করে।
  3. QQ (সিজনাল MA অংশের অর্ডার):
    • বর্ণনা: QQ হলো সিজনাল MA (Seasonal Moving Average) অংশের অর্ডার, যা সিজনাল ত্রুটির (seasonal error terms) উপর ভিত্তি করে বর্তমান মান অনুমান করে।
    • অর্থ: সিজনাল ত্রুটির উপর ভিত্তি করে পূর্ববর্তী ঋতুর ত্রুটি বা বিচ্যুতি ব্যবহার করে ভবিষ্যতের মান অনুমান করা।

SARIMA মডেলের পূর্ণ ফর্ম:

SARIMA মডেলের পূর্ণ ফর্ম হলো:

ARIMA(p,d,q)(P,D,Q)sARIMA(p, d, q)(P, D, Q)_s

এখানে:

  • p,d,qp, d, q হলো অ্যাডমিনিস্ট্রেটিভ (non-seasonal) অংশের অর্ডার।
  • P,D,QP, D, Q হলো সিজনাল (seasonal) অংশের অর্ডার।
  • ss হলো সিজনাল পিরিয়ড, যা সময়ের সাথে সিজনাল চক্রের সংখ্যা নির্ধারণ করে (যেমন: 12 মাস, 4 ত্রৈমাসিক)।

SARIMA মডেলের Order নির্বাচন

SARIMA মডেলের উপযুক্ত অর্ডার নির্বাচন করার জন্য বিভিন্ন কৌশল ব্যবহার করা হয়। কিছু সাধারণ পদ্ধতি হলো:

  1. অটোকরিলেশন প্লট (ACF) এবং পার্টিয়াল অটোকরিলেশন প্লট (PACF):
    • ACF (Autocorrelation Function) এবং PACF (Partial Autocorrelation Function) গ্রাফগুলি ব্যবহার করে pp, dd, qq, PP, DD, QQ এর মান নির্বাচন করা যায়। ACF এবং PACF এর মাধ্যমে আপনি AR এবং MA অংশের ল্যাগ পিরিয়ড শনাক্ত করতে পারেন।
    • ACF সাধারণত MA অংশের জন্য সাহায্য করে এবং PACF AR অংশের জন্য সাহায্য করে।
  2. AIC/BIC (Akaike Information Criterion / Bayesian Information Criterion):
    • AIC এবং BIC হল মডেল নির্বাচন পদ্ধতি যা মডেলের ফিট এবং জটিলতা বিবেচনা করে। কম AIC বা BIC মান যেকোনো মডেলের জন্য সবচেয়ে উপযুক্ত বলে গণ্য হয়।
  3. গবেষণার ভিত্তিতে বেছে নেওয়া:
    • যদি সিজনাল প্রভাব স্পষ্ট থাকে, তবে সিজনাল ল্যাগ নির্বাচন করার জন্য গবেষণা বা ডোমেইন জ্ঞান ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, মাসিক ডেটার জন্য s=12s = 12 (12 মাস) এবং ত্রৈমাসিক ডেটার জন্য s=4s = 4 হতে পারে।

উদাহরণ:

ধরা যাক, আপনি একটি মাসিক বিক্রয় ডেটা বিশ্লেষণ করছেন। আপনি যদি 12 মাসের সিজনাল প্যাটার্ন পান, তাহলে আপনি SARIMA মডেলটি নিম্নরূপ লিখতে পারেন:

ARIMA(p,d,q)(P,D,Q)12ARIMA(p, d, q)(P, D, Q)_{12}

এখানে:

  • p,d,qp, d, q হবে আপনার ডেটার জন্য ARIMA অংশের অর্ডার।
  • P,D,QP, D, Q হবে সিজনাল AR, MA, এবং ডিফারেন্সিং অংশের অর্ডার, এবং s=12s = 12 হবে সিজনাল পিরিয়ড (12 মাস)।

সারাংশ

SARIMA মডেল টাইম সিরিজ বিশ্লেষণের জন্য একটি শক্তিশালী পদ্ধতি যা সিজনাল প্যাটার্ন বা ঋতু পরিবর্তন বিশ্লেষণ করতে ব্যবহৃত হয়। এটি non-seasonal এবং seasonal অংশের জন্য আলাদা অর্ডার নির্বাচন করতে সাহায্য করে: p,d,qp, d, q (non-seasonal) এবং P,D,QP, D, Q (seasonal)। মডেলের অর্ডার নির্বাচন করার জন্য ACF/PACF, AIC/BIC, এবং ডোমেইন জ্ঞান ব্যবহার করা হয়।

Content added By
Promotion

Are you sure to start over?

Loading...