Machine Learning Stationarity এর ধারণা গাইড ও নোট

321

স্টেশনারিটি হল টাইম সিরিজ ডেটার একটি গুরুত্বপূর্ণ বৈশিষ্ট্য, যা নির্ধারণ করে ডেটার গড় (mean), ভ্যারিয়েন্স (variance) এবং কোভেরিয়েন্স (covariance) সময়ের সাথে অপরিবর্তিত থাকে। যদি টাইম সিরিজ ডেটা স্টেশনারি হয়, তবে তার গড়, পরিবর্তনশীলতা এবং সম্পর্কের ধরণ সময়ের সাথে একই রকম থাকবে। স্টেশনারিটি থাকা টাইম সিরিজ মডেলিং এবং পূর্বাভাস তৈরি করার জন্য সহজ এবং নির্ভরযোগ্য।


স্টেশনারিটির ধরন

স্টেশনারিটি সাধারণত দুই প্রকারের হয়:

১. স্টেশনারিটি ইন ম্যানিং (Weak Stationarity)

  • বর্ণনা: এই ধরনের স্টেশনারিটি হল, যেখানে ডেটার গড় (mean), ভ্যারিয়েন্স (variance), এবং কোভেরিয়েন্স (covariance) নির্দিষ্ট সময়ের পরে অপরিবর্তিত থাকে, তবে অবশ্যই ডেটার সম্ভাব্যতা বন্টন (probability distribution) সময়ের সাথে অপরিবর্তিত থাকতে হবে।
  • বিশেষত্ব:
    • গড় (mean) সময়ের সাথে অপরিবর্তিত থাকে।
    • ভ্যারিয়েন্স (variance) সময়ের সাথে অপরিবর্তিত থাকে।
    • কোভেরিয়েন্স (covariance) দুটি পর্যবেক্ষণের মধ্যে সময়ের সাথে অপরিবর্তিত থাকে।
  • উদাহরণ: একটি টাইম সিরিজ যেখানে প্রতি মাসে বা বছরে গড় অর্থনৈতিক উৎপাদন থাকে, তবে তার মধ্যকার ওঠানামা বা ভ্যারিয়েন্স অপরিবর্তিত থাকে, সেটা একটি স্টেশনারি টাইম সিরিজ হতে পারে।

২. স্টেশনারিটি ইন ডিস্ট্রিবিউশন (Strong Stationarity)

  • বর্ণনা: স্টেশনারিটি ইন ডিস্ট্রিবিউশন হলে ডেটার সকল পরিসংখ্যান (statistical properties), যেমন গড়, ভ্যারিয়েন্স এবং উচ্চতর মুহূর্তগুলি, সময়ের সাথে অপরিবর্তিত থাকে। এর মানে হল যে টাইম সিরিজের সমস্ত বন্টন (distributions) সময়ের সাথে অপরিবর্তিত থাকে, যা স্ট্রং স্টেশনারিটির জন্য আরও কঠোর শর্ত।
  • বিশেষত্ব:
    • সমস্ত পরিসংখ্যান (statistical moments) সময়ের সাথে অপরিবর্তিত থাকে।
    • ডেটার বন্টন বা distribution সময়ের সাথে অপরিবর্তিত থাকে।

স্টেশনারিটি কেন গুরুত্বপূর্ণ?

  • মডেলিং ও পূর্বাভাস: স্টেশনারি টাইম সিরিজ মডেলিং জন্য উপযুক্ত, কারণ এই ধরনের ডেটা পূর্বাভাস করা সহজ। বিভিন্ন স্ট্যাটিস্টিক্যাল মডেল (যেমন ARIMA) স্টেশনারি ডেটার উপর কাজ করে সবচেয়ে ভাল ফলাফল দেয়।
  • পরিবর্তনশীলতা (Predictability): স্টেশনারিটি টাইম সিরিজের ভবিষ্যৎ মানের পূর্বাভাসে সহায়ক, কারণ তার গড় এবং ভ্যারিয়েন্স সময়ের সাথে অপরিবর্তিত থাকে।

স্টেশনারিটি পরীক্ষা

টাইম সিরিজ ডেটা স্টেশনারি কিনা তা পরীক্ষা করার জন্য কিছু সাধারণ পদ্ধতি রয়েছে:

  1. এডফ (Augmented Dickey-Fuller) টেস্ট: এই টেস্টটি স্টেশনারিটি পরীক্ষা করতে ব্যবহৃত হয়। এটি ডেটাতে ট্রেন্ডের উপস্থিতি চেক করে এবং হাইপোথিসিস টেস্টের মাধ্যমে নির্ধারণ করে যে টাইম সিরিজ স্টেশনারি কিনা।
  2. ক্যুইক্রা-ওয়াটসন টেস্ট: এটি একটি সাধারণ টেস্ট যা টাইম সিরিজের অটো-কোর্লেশন চেক করতে ব্যবহৃত হয়।

স্টেশনারিটি না থাকলে কী করতে হবে?

যদি টাইম সিরিজ ডেটা স্টেশনারি না হয়, তবে সেটিকে স্টেশনারি করতে কিছু পরিবর্তন করা হয়, যেমন:

  1. ডিফারেন্সিং (Differencing): ডেটার মানের মধ্যে পার্থক্য বের করা, যেমন প্রথম পার্থক্য (first differencing) বা দ্বিতীয় পার্থক্য (second differencing)।
  2. ট্রান্সফর্মেশন (Transformation): লগ, রুট বা অন্যান্য ম্যাথমেটিক্যাল ট্রান্সফর্মেশন প্রয়োগ করা।
  3. ট্রেন্ড এবং সিজনাল অংশ সরানো: ট্রেন্ড বা সিজনাল প্যাটার্ন যদি ডেটাতে থাকে, তাহলে সেগুলি সরানোর মাধ্যমে স্টেশনারি করা যায়।

স্টেশনারিটি হল টাইম সিরিজ বিশ্লেষণের একটি মূল ধারণা, যা ডেটার গড়, ভ্যারিয়েন্স এবং কোভেরিয়েন্সের পরিবর্তন না হওয়ার ধারণাকে বোঝায়। স্টেশনারি ডেটা সহজে পূর্বাভাস করা যায় এবং এটি মডেলিংয়ের জন্য উপযুক্ত।

Content added By
Promotion

Are you sure to start over?

Loading...