Autoregressive Order (AR(p)) নির্বাচন করা

Autoregressive (AR) মডেল - টাইম সিরিজ (Time Series) - Machine Learning

326

অটো-রিগ্রেসিভ মডেল (AR) হল টাইম সিরিজ মডেলিংয়ের একটি গুরুত্বপূর্ণ অংশ, যা পূর্ববর্তী সময় পয়েন্টগুলির উপর ভিত্তি করে বর্তমান মানের পূর্বাভাস তৈরি করে। এটি একটি স্ট্যাটিস্টিক্যাল মডেল, যেখানে "p" হল অর্ডার, অর্থাৎ কতটি পূর্ববর্তী সময় পয়েন্টের উপর ভিত্তি করে বর্তমান মান পূর্বানুমান করা হবে।

একটি AR(p) মডেলে, বর্তমান মান yty_t পেছনের pটি মানের সমন্বয়ে গণনা করা হয়, এবং এটি নিচের রূপে লেখা হয়:

yt=ϕ1yt1+ϕ2yt2+...+ϕpytp+ϵty_t = \phi_1 y_{t-1} + \phi_2 y_{t-2} + ... + \phi_p y_{t-p} + \epsilon_t

এখানে:

  • yty_t: বর্তমান সময় পয়েন্টের মান
  • ϕ1,ϕ2,...,ϕp\phi_1, \phi_2, ..., \phi_p: প্যারামিটার বা কোইফিসিয়েন্ট
  • ϵt\epsilon_t: ত্রুটি (error term)

অর্থাৎ, pp হল সময় পয়েন্টগুলির সংখ্যা, যার উপর ভিত্তি করে বর্তমান মানের পূর্বাভাস করা হয়।

AR(p) অর্ডার নির্বাচন

AR(p) মডেলটি একটি টাইম সিরিজ ডেটার উপর মানানসই করার জন্য সঠিক অর্ডার নির্বাচন করা গুরুত্বপূর্ণ। সঠিক অর্ডার নির্বাচন না হলে মডেলটি ভালভাবে কাজ নাও করতে পারে, এবং অতিরিক্ত বা কম অর্ডার মডেল কার্যকর হতে পারে না।

নিম্নলিখিত পদ্ধতিগুলি AR(p) অর্ডার নির্বাচন করতে সহায়ক হতে পারে:


১. আটচি-কোশিন ইনফরমেশন ক্রাইটেরিয়া (AIC)

বর্ণনা: AIC একটি জনপ্রিয় ক্রাইটেরিয়া, যা একটি মডেলের সঠিকতা এবং কমপ্লেক্সিটির মধ্যে একটি ব্যালান্স খুঁজে পেতে সাহায্য করে। এটি মডেলটির ফিটিং গুণমান এবং প্যারামিটার সংখ্যা উভয়কে বিচার করে। ছোট AIC মান ভাল মডেল নির্দেশ করে।

AIC এর সূত্র:

AIC=ln(σ2)+2k/nAIC = \ln(\sigma^2) + 2k / n

এখানে:

  • σ2\sigma^2 হল ত্রুটির বৈচিত্র্য,
  • kk হল প্যারামিটার সংখ্যা,
  • nn হল ডেটা পয়েন্টের সংখ্যা।

যেভাবে ব্যবহার করবেন:

  • AIC এর মান কম হলে সেটি সর্বোত্তম মডেল নির্দেশ করে। একাধিক অর্ডার (p) এর জন্য AIC তুলনা করুন এবং কম AIC সহ মডেলটি নির্বাচন করুন।

২. বিক্রিয়া বা বিগ-ও (PACF) প্লট

বর্ণনা: PACF (Partial Autocorrelation Function) প্লটটি AR(p) মডেল তৈরির জন্য একটি কার্যকর উপায়। PACF প্লটটি প্রতিটি ল্যাগের জন্য অটো-কোর্লেশন দেখায় এবং নির্ধারণ করতে সহায়ক যে কোন পয়েন্টে অটো-কোর্লেশন হ্রাস পাচ্ছে।

PACF প্লট ব্যবহার:

  • PACF প্লটের মধ্যে যেখানে প্রথম অটো-কোর্সশন হ্রাস পায়, সেই ল্যাগটি সাধারণত AR(p) মডেলের জন্য নির্বাচিত অর্ডার (p) নির্দেশ করে।

৩. বিক্রিয়া (ACF) প্লট

বর্ণনা: ACF (Autocorrelation Function) প্লটটি টাইম সিরিজ ডেটার অটো-কোর্সশনের মাত্রা দেখায়। AR মডেলের জন্য ACF এবং PACF প্লট ব্যবহার করে অর্ডার নির্বাচন করা যায়।

ACF প্লট ব্যবহার:

  • যদি ACF প্লটের প্রথম কয়েকটি ল্যাগে উল্লেখযোগ্য অটো-কোর্সশন থাকে এবং এরপর সেগুলি দ্রুত শূন্যে চলে আসে, তবে তা AR মডেলকে নির্দেশ করতে পারে।

৪. ক্রস-ভ্যালিডেশন (Cross-Validation)

বর্ণনা: ক্রস-ভ্যালিডেশন হল একটি মডেল নির্বাচন পদ্ধতি যেখানে ডেটা সেটটিকে একাধিক ছোট অংশে বিভক্ত করা হয় এবং মডেলটি প্রতিটি অংশের জন্য পরীক্ষা করা হয়। এভাবে মডেলের পারফরম্যান্সের নির্ভরযোগ্য অনুমান করা যায়।

ক্রস-ভ্যালিডেশন ব্যবহার:

  • মডেলটি নির্বাচন করতে বিভিন্ন অর্ডার (p) এর জন্য ক্রস-ভ্যালিডেশন ব্যবহার করুন এবং যে অর্ডারটি সবচেয়ে ভাল পারফর্ম করবে সেটি নির্বাচন করুন।

৫. লগ-লাইক্লিহুড (Log-Likelihood)

বর্ণনা: লগ-লাইক্লিহুড হল একটি মেট্রিক যা মডেলের পারফরম্যান্স মূল্যায়ন করতে ব্যবহৃত হয়। এটি প্রতিটি প্যারামিটার সেটের জন্য কতটা সম্ভাব্য ডেটা ফিট হবে তা দেখায়। এটি AIC এর মতো আরও একটি মেট্রিক হিসেবে ব্যবহৃত হতে পারে।


সারাংশ

AR(p) অর্ডার নির্বাচন করা টাইম সিরিজ মডেলিংয়ের একটি গুরুত্বপূর্ণ অংশ। AIC, PACF প্লট, ACF প্লট, ক্রস-ভ্যালিডেশন এবং লগ-লাইক্লিহুডের মতো পদ্ধতিগুলি ব্যবহার করে সঠিক AR(p) অর্ডার নির্বাচন করা যায়। সঠিক অর্ডার নির্বাচন করলে মডেলটি টাইম সিরিজের পরিবর্তনগুলিকে আরও ভালভাবে পূর্বাভাস দিতে সক্ষম হয়।

Content added By
Promotion

Are you sure to start over?

Loading...