Time Series এবং Forecasting

পাইটর্চ (Pytorch) - Machine Learning

326

Time Series এবং Forecasting দুটি গুরুত্বপূর্ণ কনসেপ্ট যা ডেটা সায়েন্স এবং মেশিন লার্নিংয়ে ব্যাপকভাবে ব্যবহৃত হয়। Time Series ডেটা হলো এমন ডেটা, যা সময়ের উপর নির্ভর করে সংগ্রহ করা হয়, এবং Forecasting হলো ভবিষ্যতের ডেটা পূর্বাভাস করার প্রক্রিয়া।

এই দুটি কনসেপ্ট বিশেষত অর্থনীতি, বিজ্ঞান, বাণিজ্য, এবং মেডিক্যাল ডেটা বিশ্লেষণে ব্যাপকভাবে ব্যবহৃত হয়।

১. Time Series Data (টাইম সিরিজ ডেটা)

Time Series Data হল এমন ডেটা যেখানে তথ্যগুলো সময়ের উপর ভিত্তি করে সংগৃহীত হয়। সাধারণত একে একটি ধারাবাহিক পর্যায়ে (পর্যায়ক্রমে) প্রদর্শন করা হয়।

Time Series ডেটার বৈশিষ্ট্যসমূহ:

ট্রেন্ড (Trend): সময়ের সাথে ডেটার একটি সাধারণ ধারাবাহিক বৃদ্ধি বা হ্রাস। উদাহরণস্বরূপ, বছরের সাথে আয় বৃদ্ধি।
সিজনালিটি (Seasonality): কোনো নির্দিষ্ট সময়ের মধ্যে পুনরাবৃত্তি হওয়া প্যাটার্ন বা পরিবর্তন। উদাহরণস্বরূপ, গ্রীষ্মকালে আইসক্রিম বিক্রি বাড়ে।
অথেল (Noise): র্যান্ডম বা এলোমেলো ফ্লাকচুয়েশন, যা সময়ের সাথে কিছু অস্বাভাবিক পরিবর্তন সৃষ্টি করে।
কাইক (Cyclic): কিছু সময় পর পর যে ফ্লাকচুয়েশন ঘটে, যা সিজনাল প্যাটার্ন থেকে আলাদা।

Time Series Data Example:

Stock Price: দৈনিক স্টক মূল্য।
Temperature: দৈনিক তাপমাত্রা।
Sales Data: মাসিক বা সাপ্তাহিক বিক্রির পরিমাণ।

২. Time Series Forecasting (টাইম সিরিজ পূর্বাভাস)

Forecasting হল ভবিষ্যতে কী ঘটবে তা পূর্বানুমান করা, যা time series ডেটার ক্ষেত্রে একধরনের ভবিষ্যদ্বাণী। টাইম সিরিজ ফরকাস্টিং মডেল ডেটার প্যাটার্ন থেকে ভবিষ্যতের ঘটনা পূর্বাভাস করার চেষ্টা করে।

Time Series Forecasting এর মূল লক্ষ্য:

ফিউচার ভ্যালু প্রেডিকশন: অতীতের ডেটা ব্যবহার করে ভবিষ্যতের ডেটা পূর্বাভাস করা।
ট্রেন্ড এবং সিজনাল প্যাটার্ন: পূর্বানুমান করতে যে ট্রেন্ড এবং সিজনাল প্যাটার্নগুলি আবশ্যক, তা বিশ্লেষণ করা।

Time Series Forecasting Techniques:

Autoregressive Integrated Moving Average (ARIMA):
- ARIMA মডেল তিনটি উপাদান নিয়ে গঠিত:
  - AR (Autoregression): পেছনের সময়ের ডেটার উপর ভিত্তি করে ভবিষ্যত ভবিষ্যদ্বাণী করা।
  - I (Integrated): ডেটাকে স্টেশনারি করার জন্য পার্থক্য গ্রহণ করা।
  - MA (Moving Average): পেছনের ত্রুটি বা রেসিডিউয়াল নির্ধারণ।
ARIMA মডেল ফিট করা:
```
from statsmodels.tsa.arima.model import ARIMA
model = ARIMA(time_series_data, order=(1, 1, 1))  # ARIMA(p, d, q)
model_fit = model.fit()
forecast = model_fit.forecast(steps=10)  # 10 দিনের পূর্বাভাস
```
Exponential Smoothing (ETS):
- ETS মডেল বর্তমান পর্যায়ের অগ্রগতি এবং অতীত পর্যায়ের ত্রুটির উপর ভিত্তি করে ভবিষ্যতের পূর্বাভাস তৈরি করে। এটি লেভেল (level), ট্রেন্ড (trend), এবং সিজনাল (seasonal) উপাদানগুলির জন্য তিনটি আলাদা কম্পোনেন্ট থাকে।
Long Short-Term Memory (LSTM):
- LSTM, যা Recurrent Neural Network (RNN) এর একটি উন্নত সংস্করণ, টাইম সিরিজ ডেটার জন্য একটি শক্তিশালী ডিপ লার্নিং মডেল। এটি পেছনের ইনপুট থেকে দীর্ঘমেয়াদী নির্ভরশীলতা শেখার জন্য উপযুক্ত।
LSTM মডেল তৈরি:
```
from keras.models import Sequential
from keras.layers import LSTM, Dense

model = Sequential()
model.add(LSTM(50, return_sequences=True, input_shape=(X_train.shape[1], 1)))
model.add(LSTM(50))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mean_squared_error')

model.fit(X_train, y_train, epochs=10, batch_size=32)
predictions = model.predict(X_test)
```
Prophet:
- Prophet হল একটি ওপেন সোর্স ফোরকাস্টিং লাইব্রেরি যা Facebook দ্বারা তৈরি করা হয়েছে এবং বিশেষ করে সময়ের সাথে সংশ্লিষ্ট বড় প্যাটার্ন সনাক্ত করতে কার্যকরী। এটি সাধারণত ব্যবসায়িক ডেটার জন্য ব্যবহৃত হয়, যেখানে সিজনালিটি এবং ট্রেন্ড স্পষ্ট হয়।
```
from fbprophet import Prophet
model = Prophet()
model.fit(df)  # df: DataFrame with columns ['ds', 'y']
forecast = model.predict(future)
```

৩. Time Series Forecasting Challenges

Non-Stationarity: টাইম সিরিজ ডেটা যদি non-stationary হয়, অর্থাৎ, এর ট্রেন্ড বা ভ্যারিয়েন্স সময়ের সাথে পরিবর্তিত হয়, তাহলে মডেলটি সঠিকভাবে কাজ করবে না। এর জন্য ডেটাকে stationary করার প্রয়োজন হতে পারে (যেমন পার্থক্য নেয়ার মাধ্যমে)।
Missing Data: টাইম সিরিজ ডেটাতে missing values সমস্যা হতে পারে, যেগুলি সমাধান করতে হয় (যেমন, ফিলিং বা interpolation মাধ্যমে)।
Overfitting: মডেল ট্রেনিং এর সময় অতিরিক্ত overfitting হতে পারে, বিশেষ করে যখন মডেল খুবই জটিল হয়। এজন্য regularization বা cross-validation ব্যবহার করা হয়।
External Factors: অনেক টাইম সিরিজ ডেটাতে external factors (যেমন অর্থনৈতিক পরিবর্তন বা জলবায়ু পরিস্থিতি) প্রভাব ফেলতে পারে, যা প্রেডিকশনকে আরও জটিল করে তোলে।

৪. Evaluation Metrics for Forecasting

Forecasting Model এর সঠিকতা যাচাই করার জন্য বিভিন্ন evaluation metrics ব্যবহৃত হয়:

Mean Absolute Error (MAE):
$MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$
এখানে y_i হলো আসল মান এবং \hat{y}_i হলো পূর্বাভাসিত মান।
Mean Squared Error (MSE):
$MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
Root Mean Squared Error (RMSE):
$RMSE = \sqrt{MSE}$
Mean Absolute Percentage Error (MAPE):
$MAPE = \frac{100}{n} \sum_{i=1}^{n} \left| \frac{y_i - \hat{y}_i}{y_i} \right|$

সারাংশ

Time Series ডেটা হল এমন ডেটা যা সময়ের সাথে পরিবর্তিত হয় এবং পূর্বের ডেটার উপর ভিত্তি করে ভবিষ্যতের ডেটা প্রেডিক্ট করতে ব্যবহৃত হয়।
Forecasting হল সময় সিরিজ ডেটা ব্যবহার করে ভবিষ্যতের ডেটা পূর্বাভাস করা।
বিভিন্ন time series forecasting techniques যেমন ARIMA, LSTM, Prophet, এবং Exponential Smoothing ব্যবহার করে ভবিষ্যতের ডেটা প্রেডিক্ট করা যায়।
Challenges যেমন non-stationarity, missing data, এবং external factors forecasting কে কঠিন করতে পারে।

Content added By

Azizar Rahman Aziz

Time Series Data এর কাজের পদ্ধতি

414

Time Series Data হল সেই ধরনের ডেটা, যেখানে ডেটাপয়েন্টগুলি একটি নির্দিষ্ট সময়ের উপর ভিত্তি করে সংগৃহীত হয়। প্রতিটি ডেটাপয়েন্টের সাথে একটি সময় স্ট্যাম্প (timestamp) যুক্ত থাকে, যেমন: দৈনিক স্টক মূল্য, মাসিক বৃষ্টিপাত, বা সাপ্তাহিক বিক্রির পরিমাণ।

Time Series Data ব্যবহারের প্রধান উদ্দেশ্য হল ভবিষ্যতের পূর্বাভাস (forecasting) করা, যেমন, আগামীকাল বা পরবর্তী সপ্তাহের ডেটা কী হতে পারে, এর ভিত্তিতে সিদ্ধান্ত নেওয়া।

Time Series Data এর কাজের পদ্ধতি সাধারণত নিম্নলিখিত ধাপগুলো অনুসরণ করে:

১. ডেটা সংগ্রহ (Data Collection)

Time Series Data সংগ্রহের প্রথম ধাপ হল ডেটার সময় এবং উৎস চিহ্নিত করা। এটি প্রাকৃতিক বা সামাজিক ঘটনাবলীর ওপর ভিত্তি করে হতে পারে, যেমন:

দৈনিক তাপমাত্রার তথ্য
স্টক মার্কেটের দাম
স্বাস্থ্যসেবায় রোগীর সংখ্যা

এছাড়া, ডেটা সংরক্ষণ করার সময়, তার সময় স্ট্যাম্প (timestamp) এবং অন্যান্য প্রাসঙ্গিক তথ্যও সঠিকভাবে সংগ্রহ করা উচিত।

২. ডেটা প্রাক-প্রসেসিং (Data Preprocessing)

Time Series Data প্রক্রিয়া করার আগে কিছু প্রাক-প্রসেসিং প্রয়োজন, যেমন:

Missing Values: যদি ডেটাতে কোনো অনুপস্থিত মান থাকে, তবে সেগুলি পূর্ণ করতে হবে। সাধারণত, গড় (mean), মধ্যম (median), বা পূর্ববর্তী মান দিয়ে পূর্ণ করা হয়।
```
import pandas as pd
df = pd.read_csv("data.csv")
df['value'].fillna(df['value'].mean(), inplace=True)
```
Outlier Detection: Time Series Data তে অনেক সময় আউটলায়ার থাকে, যা সঠিক মডেলিংয়ে ব্যাঘাত ঘটাতে পারে। আউটলায়ার চিহ্নিত করে সেগুলি হ্যান্ডল করা উচিত।
Resampling: ডেটা একক সময় স্ট্যাম্পে বা সময়ের নির্দিষ্ট ফ্রিকোয়েন্সিতে রিস্যাম্পল করা যেতে পারে। যেমন, আপনি ডেইলি ডেটা থেকে মাসিক ডেটা তৈরি করতে পারেন।
```
df.resample('M').mean()  # মাসিক গড়
```

৩. ট্রেন্ড (Trend) এবং সিজনালিটি (Seasonality) চিহ্নিত করা

ট্রেন্ড এবং সিজনালিটি Time Series Data এর গুরুত্বপূর্ণ উপাদান:

ট্রেন্ড: এটি সময়ের সাথে সাথে ডেটার উর্ধ্বমুখী বা নিম্নমুখী পরিবর্তন। যেমন, ব্যবসার বৃদ্ধি বা মন্দা।
সিজনালিটি: এটি এমন প্যাটার্ন যা নিয়মিত সময়ে ঘটতে থাকে, যেমন প্রতি বছর শীতকাল বা গ্রীষ্মকাল আসা। সিজনালিটি সাধারণত প্রাকৃতিক বা সামাজিক চক্র অনুযায়ী হয়।

Time Series ডেটাতে ট্রেন্ড এবং সিজনালিটি চিহ্নিত করতে ভিজ্যুয়ালাইজেশন এবং ডিকম্পোজিশন কৌশল ব্যবহার করা হয়।

import matplotlib.pyplot as plt

# Time Series Data visualization
df['value'].plot(figsize=(10, 6))
plt.title("Time Series Plot")
plt.show()

৪. মডেল নির্বাচন এবং প্রশিক্ষণ (Model Selection and Training)

Time Series Data প্রক্রিয়া করার জন্য বিভিন্ন মডেল রয়েছে। মডেল নির্বাচনের জন্য ডেটার বৈশিষ্ট্য (যেমন, সিজনালিটি, ট্রেন্ড) বিবেচনা করতে হয়।

1. ARIMA (AutoRegressive Integrated Moving Average):

ARIMA মডেলটি Time Series Data এর ভবিষ্যত পূর্বাভাসের জন্য একটি জনপ্রিয় মডেল, যা ট্রেন্ড এবং মৌলিক সিজনালিটি যুক্ত ডেটার জন্য উপযুক্ত।

AR (AutoRegressive): পূর্ববর্তী মানের উপর নির্ভরশীলতা।
I (Integrated): ডেটা স্টেশনরি (stationary) করতে পার্থক্য গ্রহণ।
MA (Moving Average): পূর্ববর্তী ত্রুটির উপর নির্ভরশীলতা।

from statsmodels.tsa.arima.model import ARIMA
model = ARIMA(df['value'], order=(5, 1, 0))  # ARIMA(p,d,q)
model_fit = model.fit()
forecast = model_fit.forecast(steps=10)

2. SARIMA (Seasonal ARIMA):

এটি ARIMA এর সম্প্রসারণ, যা সিজনাল প্যাটার্ন সম্বলিত ডেটার জন্য উপযুক্ত।

3. Exponential Smoothing (Holt-Winters):

এটি সিজনাল এবং ট্রেন্ডযুক্ত Time Series Data এর জন্য একটি জনপ্রিয় কৌশল।

from statsmodels.tsa.holtwinters import ExponentialSmoothing
model = ExponentialSmoothing(df['value'], trend='add', seasonal='add', seasonal_periods=12)
model_fit = model.fit()
forecast = model_fit.forecast(steps=10)

4. Facebook Prophet:

Facebook Prophet হল একটি ওপেন সোর্স মডেল যা সিজনালিটি এবং ট্রেন্ডসহ দীর্ঘমেয়াদী Time Series Forecasting এর জন্য ডিজাইন করা হয়েছে।

from fbprophet import Prophet

df_prophet = df[['ds', 'value']]  # 'ds' must be datetime and 'y' is the value
model = Prophet()
model.fit(df_prophet)
future = model.make_future_dataframe(df_prophet, periods=10)
forecast = model.predict(future)

৫. ফোরকাস্টিং (Forecasting)

একবার মডেল প্রশিক্ষিত হলে, আপনি এটি ব্যবহার করে ভবিষ্যৎ পূর্বাভাস করতে পারবেন। Time Series মডেলগুলি ভবিষ্যতের জন্য ডেটা পূর্বাভাস করার জন্য ব্যবহৃত হয়।

# Forecasting for next 10 time steps
forecast = model_fit.forecast(steps=10)

এছাড়া, Cross-validation ব্যবহার করে মডেলের কার্যকারিতা পরীক্ষা করতে হবে, বিশেষত যখন ডেটা সিজনাল এবং ট্রেন্ডযুক্ত।

৬. মূল্যায়ন (Evaluation)

Time Series মডেলের কার্যকারিতা মূল্যায়ন করতে হলে, Mean Absolute Error (MAE), Mean Squared Error (MSE) বা Root Mean Squared Error (RMSE) এর মতো মেট্রিক ব্যবহার করা হয়। এর মাধ্যমে পূর্বাভাসের সঠিকতা নির্ধারণ করা যায়।

from sklearn.metrics import mean_squared_error
mse = mean_squared_error(actual, forecast)
rmse = mse ** 0.5

৭. ভবিষ্যতের অনুকরণ (Simulating Future Trends)

যেহেতু Time Series Data মূলত ভবিষ্যত পূর্বাভাসের জন্য ব্যবহৃত হয়, মডেল ব্যবহার করে ভবিষ্যতের ট্রেন্ড এবং প্যাটার্ন অনুকরণ করা যায়। এর মাধ্যমে ব্যবসা বা অর্থনৈতিক উন্নয়ন সংক্রান্ত সিদ্ধান্ত নেওয়া সহজ হয়।

সারাংশ

Time Series Data এর কাজের প্রক্রিয়া অনেকটা ডেটার প্রাক-প্রসেসিং, ট্রেন্ড এবং সিজনালিটি চিহ্নিতকরণ, উপযুক্ত মডেল নির্বাচন এবং ভবিষ্যতের পূর্বাভাস করা নিয়ে গঠিত। ARIMA, SARIMA, Holt-Winters, এবং Facebook Prophet হল জনপ্রিয় Time Series ফোরকাস্টিং মডেল, যা ডেটা থেকে প্যাটার্ন শেখে এবং ভবিষ্যতের পূর্বাভাস তৈরি করতে সক্ষম। Time Series মডেলের কাজের প্রক্রিয়া থেকে সঠিক ফল পেতে হলে উপযুক্ত মডেল নির্বাচন, ডেটার সঠিক প্রাক-প্রসেসিং এবং পারফরম্যান্স মূল্যায়ন গুরুত্বপূর্ণ।

Content added By

Azizar Rahman Aziz

PyTorch দিয়ে Time Series মডেল তৈরি

349

Time Series ডেটা হল এমন ডেটা যা সময়ের সাথে পরিবর্তিত হয়। মডেল তৈরি করার জন্য Time Series ডেটা সাধারণত পূর্ববর্তী মানের উপর ভিত্তি করে ভবিষ্যতের মানের পূর্বাভাস দেয়। PyTorch ব্যবহার করে Time Series মডেল তৈরি করতে আপনি সাধারণত Recurrent Neural Networks (RNNs), Long Short-Term Memory (LSTM), বা Gated Recurrent Units (GRU) ব্যবহার করতে পারেন। এই নেটওয়ার্কগুলি সময়ের সিকোয়েন্স ডেটা বুঝতে এবং ভবিষ্যদ্বাণী করতে সক্ষম।

এখানে আমরা একটি সহজ LSTM মডেল তৈরি করার উদাহরণ দেখবো, যা Time Series ডেটার জন্য ব্যবহৃত হয়।

১. ডেটা প্রস্তুতি

প্রথমে, Time Series ডেটা লোড করা এবং প্রস্তুত করা প্রয়োজন। এটি PyTorch টেনসর ফরম্যাটে রূপান্তরিত হবে, যাতে মডেলটি ডেটা নিয়ে কাজ করতে পারে। এখানে একটি সাধারণ sinusoidal ফাংশন থেকে ডেটা তৈরি করা হয়েছে:

import torch
import numpy as np
import matplotlib.pyplot as plt
from torch.utils.data import DataLoader, Dataset

# Time Series Data তৈরি
def generate_data(seq_length=100):
    x = np.linspace(0, 2*np.pi, seq_length)
    y = np.sin(x)  # Sinusoidal data
    return x, y

# Generate data
x, y = generate_data(seq_length=200)

# Visualize the data
plt.plot(x, y)
plt.title('Sinusoidal Time Series Data')
plt.show()

# PyTorch Dataset তৈরি
class TimeSeriesDataset(Dataset):
    def __init__(self, x, y, seq_length=10):
        self.x = x
        self.y = y
        self.seq_length = seq_length

    def __len__(self):
        return len(self.x) - self.seq_length

    def __getitem__(self, idx):
        seq_x = self.x[idx:idx+self.seq_length]
        seq_y = self.y[idx+self.seq_length]  # Next value as target
        return torch.tensor(seq_x, dtype=torch.float32), torch.tensor(seq_y, dtype=torch.float32)

# DataLoader তৈরি
seq_length = 10
dataset = TimeSeriesDataset(x, y, seq_length)
dataloader = DataLoader(dataset, batch_size=16, shuffle=False)

generate_data ফাংশনটি sinusoidal ফাংশন ব্যবহার করে Time Series ডেটা তৈরি করে।
TimeSeriesDataset ক্লাসে ডেটা প্রস্তুতি এবং টেনসর রূপান্তরের কাজ করা হয়।

২. LSTM মডেল তৈরি করা

এখন LSTM মডেল তৈরি করা হবে, যা Time Series ডেটার উপর ভিত্তি করে ভবিষ্যদ্বাণী করবে।

import torch.nn as nn

# LSTM মডেল তৈরি
class LSTMModel(nn.Module):
    def __init__(self, input_size=1, hidden_size=64, num_layers=1, output_size=1):
        super(LSTMModel, self).__init__()
        
        # LSTM লেয়ার
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        
        # Fully connected layer
        self.fc = nn.Linear(hidden_size, output_size)
    
    def forward(self, x):
        # LSTM লেয়ারে ইনপুট পাস করা
        out, _ = self.lstm(x)
        
        # LSTM এর আউটপুট থেকে শেষ সময়ের আউটপুট নেয়া
        out = out[:, -1, :]
        
        # Fully connected layer এর মাধ্যমে আউটপুট তৈরি
        out = self.fc(out)
        return out

# মডেল তৈরি
model = LSTMModel(input_size=1, hidden_size=64, num_layers=1, output_size=1)
print(model)

এখানে:

LSTMModel ক্লাসটি একটি LSTM মডেল তৈরি করে, যেখানে ইনপুট ডেটা একটি সিকোয়েন্স হিসেবে গ্রহণ করা হয় এবং মডেলটি সেই সিকোয়েন্সের শেষ অংশে ভবিষ্যতের মান অনুমান করে।
LSTM লেয়ারটি batch_first=True সহ ইনিশিয়ালাইজ করা হয়েছে যাতে ইনপুট আউটপুট [batch_size, sequence_length, input_size] আকারে থাকে।
Fully Connected Layer (FC) আউটপুট তৈরি করার জন্য ব্যবহার করা হয়।

৩. মডেল প্রশিক্ষণ (Training the Model)

এখন আমরা মডেলটি প্রশিক্ষণ দিতে পারি, যেখানে লস ফাংশন এবং অপটিমাইজার সেট করা হবে। এখানে MSELoss (Mean Squared Error Loss) ব্যবহার করা হয়েছে, যা Time Series প্রেডিকশনের জন্য সাধারণত ব্যবহৃত হয়।

import torch.optim as optim

# মডেল, লস ফাংশন এবং অপটিমাইজার
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# মডেল প্রশিক্ষণ
num_epochs = 100
for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    
    for inputs, targets in dataloader:
        inputs = inputs.unsqueeze(-1)  # (batch_size, seq_length, 1) আকারে রূপান্তরিত
        targets = targets.unsqueeze(-1)
        
        # আউটপুট বের করা
        outputs = model(inputs)
        
        # লস হিসাব করা
        loss = criterion(outputs, targets)
        
        # গ্র্যাডিয়েন্ট শূন্য করা
        optimizer.zero_grad()
        
        # ব্যাকপ্রোপাগেশন
        loss.backward()
        
        # ওজন আপডেট করা
        optimizer.step()
        
        running_loss += loss.item()

    print(f'Epoch {epoch+1}/{num_epochs}, Loss: {running_loss/len(dataloader)}')

# প্রশিক্ষণের পর মডেল সংরক্ষণ
torch.save(model.state_dict(), 'lstm_model.pth')

MSELoss: মডেলের আউটপুট এবং টার্গেটের মধ্যে ত্রুটি পরিমাপ করে।
Adam Optimizer: মডেলের প্যারামিটার আপডেট করার জন্য Adam অপটিমাইজার ব্যবহার করা হয়েছে।
মডেল প্রশিক্ষণ পর, তার পারফরম্যান্স মূল্যায়ন করা হয়।

৪. মডেল ভবিষ্যদ্বাণী (Prediction)

প্রশিক্ষণের পর মডেলটি ব্যবহার করে ভবিষ্যদ্বাণী করা যেতে পারে।

# মডেল ভবিষ্যদ্বাণী
model.eval()
with torch.no_grad():
    test_input = torch.tensor(x[-seq_length:], dtype=torch.float32).unsqueeze(0).unsqueeze(-1)  # শেষ 10টি পয়েন্ট
    prediction = model(test_input)
    print(f'Predicted Value: {prediction.item()}')

এখানে:

model.eval(): মডেলটিকে পরীক্ষার মোডে সেট করে।
torch.no_grad(): এটি গ্র্যাডিয়েন্ট ক্যালকুলেশন বন্ধ করে দেয়, যাতে ভবিষ্যদ্বাণী করার সময় অতিরিক্ত ক্যালকুলেশন না হয়।

সারাংশ

PyTorch দিয়ে Time Series মডেল তৈরি করতে LSTM (Long Short-Term Memory) একটি শক্তিশালী পদ্ধতি। মডেলটি ডেটার পূর্ববর্তী মানের উপর ভিত্তি করে ভবিষ্যতের মান পূর্বাভাস দেয়। এই উদাহরণে:

Time Series ডেটা প্রস্তুতি এবং ডেটা লোডিং।
LSTM মডেল তৈরি এবং প্রশিক্ষণ।
ভবিষ্যদ্বাণী (prediction) করার জন্য মডেল ব্যবহার করা হয়েছে।

Time Series ডেটা প্রসেসিংয়ের জন্য LSTM একটি উপযুক্ত মডেল, কারণ এটি সময়ের উপর ভিত্তি করে প্যাটার্ন শিখতে সক্ষম।

Content added By

Azizar Rahman Aziz

LSTM এবং RNN দিয়ে Forecasting

338

Long Short-Term Memory (LSTM) এবং Recurrent Neural Networks (RNNs) হল এমন দুটি ধরনের নিউরাল নেটওয়ার্ক আর্কিটেকচার যা টাইম সিরিজ ডেটা বা সিকোয়েন্সিয়াল ডেটার উপর কাজ করতে সক্ষম। Forecasting, বিশেষত টাইম সিরিজ ফরকাস্টিং, হল ভবিষ্যতের কোন একটি ইভেন্টের বা মানের পূর্বাভাস প্রদান করা, যেমন ভবিষ্যতে শেয়ারের দাম, আবহাওয়া, বা বিক্রয় পরিসংখ্যান।

RNN এবং LSTM টাইম সিরিজ ডেটাতে তথ্যের টাইম ডিপেনডেন্সি (time dependency) ধরে রাখতে সক্ষম, যা তাদের জন্য ফরকাস্টিং এর মতো অ্যাপ্লিকেশনের জন্য অত্যন্ত কার্যকরী করে তোলে। চলুন, RNN এবং LSTM দিয়ে ফরকাস্টিং কীভাবে করা হয় তা আলোচনা করি।

১. Recurrent Neural Networks (RNNs)

RNNs হল এমন একটি নিউরাল নেটওয়ার্ক আর্কিটেকচার যা সিকোয়েন্সিয়াল ডেটার উপর কাজ করতে সক্ষম। RNN গুলি তাদের নিজস্ব আউটপুটকে ইনপুট হিসেবে পরবর্তী সময়ে ব্যবহার করে, যা টাইম সিরিজ ডেটার মধ্যে সময়ের উপর ভিত্তি করে সম্পর্ক বা প্যাটার্ন শিখতে সহায়ক।

RNN এর বৈশিষ্ট্য:

টাইম ডিপেনডেন্সি: RNN টাইম সিরিজ ডেটার পূর্ববর্তী তথ্য থেকে ভবিষ্যতের তথ্য পূর্বাভাস দিতে সক্ষম।
গণনা ক্ষমতা: এটি ইনপুট সিকোয়েন্সের সাথে তাদের সম্পর্ক ধারণ করতে পারলেও, দীর্ঘ সময়ের পরিসরের ডেটা প্রক্রিয়া করতে পারছে না (যেটি LSTM এর সুবিধা)।

RNN দিয়ে Forecasting:

RNN সাধারণত একটি সিকোয়েন্সের প্রতিটি সময় পয়েন্টের জন্য পূর্ববর্তী সময় পয়েন্টের আউটপুট ব্যবহার করে, কিন্তু দীর্ঘ সময়কালের ডিপেনডেন্সি ভালোভাবে শিখতে পারে না, যার কারণে দীর্ঘ সময়ের ফরকাস্টিংয়ে এটি সমস্যার সৃষ্টি করতে পারে।

RNN Model Example for Time Series Forecasting:

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt

# RNN Class
class RNN_Model(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers):
        super(RNN_Model, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, 1)
        
    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
        out, _ = self.rnn(x, h0)
        out = self.fc(out[:, -1, :])  # Get last time step
        return out

# Example usage
input_size = 1
hidden_size = 64
num_layers = 2
model = RNN_Model(input_size, hidden_size, num_layers)

# Sample time series data
data = np.sin(np.linspace(0, 100, 1000))  # Sin wave as a sample time series

# Preparing data
x_train = torch.tensor(data[:-1]).view(-1, 1, 1).float()
y_train = torch.tensor(data[1:]).view(-1, 1).float()

# Train model (simplified)
output = model(x_train)

২. Long Short-Term Memory (LSTM)

LSTM হল RNN এর একটি উন্নত সংস্করণ যা দীর্ঘ সময়কালের ডিপেনডেন্সি বা সম্পর্ক শিখতে সক্ষম। LSTM এর মধ্যে মেমরি সেল থাকে যা দীর্ঘ সময়কালের জন্য তথ্য ধারণ করে, এবং গেট রয়েছে যা তার প্রবাহ নিয়ন্ত্রণ করে।

LSTM এর বৈশিষ্ট্য:

Long-term Dependency: LSTM মডেল দীর্ঘ সময়কালের তথ্য স্মরণ করতে সক্ষম এবং তার মাধ্যমে টানলগ ডিপেনডেন্সি সমস্যার সমাধান করে।
Gates Mechanism: LSTM গেটে Input Gate, Forget Gate, এবং Output Gate থাকে যা মডেলকে প্রাসঙ্গিক তথ্য মনে রাখতে এবং অপ্রয়োজনীয় তথ্য বাদ দিতে সাহায্য করে।

LSTM দিয়ে Forecasting:

LSTM টাইম সিরিজ ডেটার মধ্যে দীর্ঘমেয়াদি সম্পর্ক শিখতে সক্ষম, যা পূর্ববর্তী সময় পয়েন্টগুলির থেকে ভবিষ্যতের পূর্বাভাস তৈরি করতে সহায়ক।

LSTM Model Example for Time Series Forecasting:

class LSTM_Model(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers):
        super(LSTM_Model, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, 1)
        
    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
        out, _ = self.lstm(x, (h0, c0))
        out = self.fc(out[:, -1, :])  # Get last time step
        return out

# Example usage
input_size = 1
hidden_size = 64
num_layers = 2
model = LSTM_Model(input_size, hidden_size, num_layers)

# Sample time series data
data = np.sin(np.linspace(0, 100, 1000))  # Sin wave as a sample time series

# Preparing data
x_train = torch.tensor(data[:-1]).view(-1, 1, 1).float()
y_train = torch.tensor(data[1:]).view(-1, 1).float()

# Train model (simplified)
output = model(x_train)

৩. LSTM এবং RNN এর মধ্যে পার্থক্য

বৈশিষ্ট্য	RNN	LSTM
দীর্ঘমেয়াদী সম্পর্ক	কঠিন, দীর্ঘ সময়ের ডিপেনডেন্সি শিখতে অসুবিধা	ভালো, দীর্ঘ সময়ের সম্পর্ক শিখতে সক্ষম
মেমরি	সীমিত মেমরি, দীর্ঘ সময়ের পর তথ্য হারিয়ে যায়	মেমরি সেল থাকে যা দীর্ঘ সময় ধরে তথ্য ধারণ করে
গেট মেকানিজম	নেই	আছে (Forget, Input, Output)
প্রয়োগ	সিকোয়েন্সিয়াল ডেটা (কিন্তু দীর্ঘ সময়কালে সমস্যাযুক্ত)	টাইম সিরিজ, ভাষা মডেলিং, প্রাকৃতিক ভাষা প্রক্রিয়াকরণ
কার্যক্ষমতা	দ্রুত প্রশিক্ষণ, তবে পারফরম্যান্স কম	ধীরে প্রশিক্ষণ, তবে অধিক কার্যকরী

৪. Time Series Forecasting এর জন্য LSTM এবং RNN এর ব্যবহার

RNNs সাধারনত ছোট সিকোয়েন্সের জন্য ভালো কাজ করে, যেখানে তথ্যের মধ্যে দীর্ঘ সময়ের ডিপেনডেন্সি থাকে না।
LSTMs টাইম সিরিজ ডেটাতে যেখানে দীর্ঘ সময়কালের সম্পর্ক গুরুত্বপূর্ণ, যেমন স্টক মার্কেট প্রেডিকশন বা আবহাওয়া পূর্বাভাস, সেখানে বেশি কার্যকরী।

সারাংশ

RNN এবং LSTM দুইটি টাইম সিরিজ এবং সিকোয়েন্সিয়াল ডেটার জন্য জনপ্রিয় মডেল আর্কিটেকচার। RNN সহজ এবং দ্রুত ট্রেনিং করতে সক্ষম হলেও, এটি দীর্ঘ সময়কালের ডিপেনডেন্সি সমস্যা সমাধান করতে সক্ষম নয়। অন্যদিকে, LSTM দীর্ঘমেয়াদী সম্পর্ক শিখতে পারে এবং তাই টাইম সিরিজ ফরকাস্টিং এর জন্য আরো কার্যকরী।

Content added By

Azizar Rahman Aziz

Time Series Data নিয়ে কাজ করার উদাহরণ

384

Time Series Data হল এমন ডেটা যা নির্দিষ্ট সময়ের মধ্যে সংগ্রহ করা হয়, যেখানে প্রতিটি ডেটা পয়েন্ট একটি সময় সিলেবেল দ্বারা চিহ্নিত থাকে। এটি সাধারণত আর্থিক ডেটা, আবহাওয়া, ইকোনমিক ডেটা, সেলস ডেটা ইত্যাদির জন্য ব্যবহৃত হয়।

Time Series Data নিয়ে কাজ করার জন্য, সাধারণত Data Preprocessing, Model Building, এবং Forecasting প্রক্রিয়াগুলি প্রয়োজন হয়। নিচে PyTorch দিয়ে একটি Time Series Data নিয়ে কাজ করার উদাহরণ দেওয়া হলো, যেখানে ARIMA, LSTM বা অন্য কোনো মডেল ব্যবহার করতে পারি।

এখানে, আমরা PyTorch দিয়ে একটি Time Series Forecasting মডেল তৈরি করার একটি উদাহরণ দেখাবো যেখানে আমরা LSTM (Long Short-Term Memory) ব্যবহার করব, যা Time Series Prediction এর জন্য একটি শক্তিশালী টুল।

১. ডেটা লোডিং এবং প্রিপ্রসেসিং

এখানে আমরা Pandas এবং Matplotlib ব্যবহার করব Time Series ডেটা লোড, প্রিপ্রসেস এবং ভিজ্যুয়ালাইজ করার জন্য।

pip install pandas matplotlib numpy torch scikit-learn

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.preprocessing import MinMaxScaler

# ডেটা লোড করা (উদাহরণস্বরূপ, এক্সেল বা CSV ফাইল)
url = 'https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv'
df = pd.read_csv(url, header=0, index_col=0, parse_dates=True, squeeze=True)

# ডেটা প্লট করা
df.plot()
plt.title('Monthly Airline Passengers')
plt.xlabel('Date')
plt.ylabel('Passengers')
plt.show()

এই কোডের মাধ্যমে Airline Passengers Dataset ডেটা লোড এবং একটি Time Series চিত্র তৈরি করা হবে।

২. ডেটা স্কেলিং

Time Series মডেল তৈরি করার আগে, ডেটা স্কেলিং অত্যন্ত গুরুত্বপূর্ণ, বিশেষত LSTM এর জন্য। এখানে আমরা MinMaxScaler ব্যবহার করব।

# MinMaxScaler ব্যবহার করে ডেটা স্কেলিং
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(df.values.reshape(-1, 1))

# ডেটা ট্রেনিং এবং টেস্টিং সেটে ভাগ করা
train_size = int(len(scaled_data) * 0.8)
train_data, test_data = scaled_data[:train_size], scaled_data[train_size:]

# ডেটা পুনর্গঠন করা যাতে তা LSTM এর জন্য উপযুক্ত হয়
def create_dataset(data, time_step=1):
    X, Y = [], []
    for i in range(len(data) - time_step - 1):
        X.append(data[i:(i + time_step), 0])
        Y.append(data[i + time_step, 0])
    return np.array(X), np.array(Y)

time_step = 12  # একটি বছর ধরে (12 মাস)
X_train, Y_train = create_dataset(train_data, time_step)
X_test, Y_test = create_dataset(test_data, time_step)

# LSTM মডেলের ইনপুট ফরম্যাটে ডেটা রি শেপ করা
X_train = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)
X_test = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)

এখানে, create_dataset ফাংশনটি Time Series ডেটা কে (X, Y) সেটে পরিণত করবে যেখানে X হবে পেছনের কিছু পয়েন্ট এবং Y হবে পরবর্তী পয়েন্টের মান।

৩. LSTM মডেল তৈরি করা

এখন, PyTorch দিয়ে একটি LSTM মডেল তৈরি করা হবে। LSTM সাধারণত Time Series Data-এর পূর্বাভাস (forecasting) করতে ব্যবহৃত হয়।

import torch
import torch.nn as nn

# LSTM মডেল তৈরি
class LSTMModel(nn.Module):
    def __init__(self, input_size=1, hidden_layer_size=50, num_layers=1):
        super(LSTMModel, self).__init__()
        
        self.lstm = nn.LSTM(input_size, hidden_layer_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_layer_size, 1)
    
    def forward(self, x):
        out, _ = self.lstm(x)
        out = self.fc(out[:, -1, :])  # আমরা শেষ লেয়ারের আউটপুট নেবো
        return out

# মডেল ইনস্ট্যান্স তৈরি
model = LSTMModel()

এখানে LSTMModel ক্লাস তৈরি করা হয়েছে, যা LSTM এবং Fully Connected (FC) Layer ব্যবহার করে।

৪. মডেল ট্রেনিং এবং টেস্টিং

এখন আমরা LSTM মডেলটি ট্রেনিং এবং টেস্টিং করতে পারি। প্রথমে Mean Squared Error (MSE) লস ফাংশন এবং Adam অপটিমাইজার ব্যবহার করা হবে।

# হার্ডওয়্যার নির্বাচন
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

# লস ফাংশন এবং অপটিমাইজার
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# ট্রেনিং
epochs = 100
for epoch in range(epochs):
    model.train()
    inputs = torch.tensor(X_train, dtype=torch.float32).to(device)
    labels = torch.tensor(Y_train, dtype=torch.float32).to(device)
    
    # ফরওয়ার্ড পাস
    outputs = model(inputs)
    
    # লস ক্যালকুলেশন
    loss = criterion(outputs, labels)
    
    # ব্যাকপ্রোপাগেশন
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    if epoch % 10 == 0:
        print(f'Epoch [{epoch}/{epochs}], Loss: {loss.item():.4f}')

# টেস্টিং
model.eval()
inputs = torch.tensor(X_test, dtype=torch.float32).to(device)
labels = torch.tensor(Y_test, dtype=torch.float32).to(device)

# আউটপুট প্রেডিকশন
with torch.no_grad():
    predictions = model(inputs)
    
# আউটপুটকে স্কেল করে আসল মানে ফিরিয়ে আনা
predicted = scaler.inverse_transform(predictions.cpu().numpy())
real = scaler.inverse_transform(labels.cpu().numpy().reshape(-1, 1))

# প্লট করা
plt.plot(real, label='Real Data')
plt.plot(predicted, label='Predicted Data')
plt.legend()
plt.show()

এখানে, আমরা LSTM মডেলটি ট্রেনিং এবং টেস্টিং করেছি এবং MSE লস ব্যবহার করেছি। মডেলটি টেস্ট ডেটার উপর প্রেডিকশন করেছে এবং তার পরিমাণের সঙ্গে তুলনা করা হয়েছে।

৫. ফলাফল এবং ভিজ্যুয়ালাইজেশন

আমরা real এবং predicted ডেটা প্লট করে দেখতে পারি কিভাবে মডেলটি আসল ডেটা ভবিষ্যদ্বাণী করেছে।

# প্রেডিকশন এবং আসল ডেটার তুলনা
plt.plot(real, label='Real Data')
plt.plot(predicted, label='Predicted Data')
plt.legend()
plt.title("Real vs Predicted Time Series Data")
plt.show()

এটি Real Data এবং Predicted Data এর মধ্যে তুলনা করবে, যাতে আমরা বুঝতে পারি মডেলটি কতটা সঠিকভাবে ভবিষ্যদ্বাণী করতে সক্ষম।

সারাংশ

এটি ছিল একটি Time Series Forecasting এর উদাহরণ, যেখানে আমরা PyTorch দিয়ে একটি LSTM মডেল তৈরি করেছি, এবং MNIST ডেটাসেটের উপর প্রেডিকশন করা হয়েছে। Data preprocessing, LSTM Model building, Training এবং Testing এর প্রক্রিয়া ছিল:

ডেটা স্কেলিং
LSTM আর্কিটেকচার তৈরি
মডেল ট্রেনিং এবং টেস্টিং
প্রেডিকশন এবং ফলাফল ভিজ্যুয়ালাইজেশন

এভাবে LSTM ব্যবহার করে Time Series Data-এর ভবিষ্যদ্বাণী করা যেতে পারে।

Content added By

Azizar Rahman Aziz

পাইটর্চ পরিচিতি PyTorch ইনস্টলেশন এবং সেটআপ PyTorch এর মৌলিক ধারণা PyTorch টেনসর ম্যানিপুলেশন PyTorch দিয়ে মডেল তৈরি করা

Time Series এবং Forecasting

১. Time Series Data (টাইম সিরিজ ডেটা)

Time Series ডেটার বৈশিষ্ট্যসমূহ:

Time Series Data Example:

২. Time Series Forecasting (টাইম সিরিজ পূর্বাভাস)

Time Series Forecasting এর মূল লক্ষ্য:

Time Series Forecasting Techniques:

৩. Time Series Forecasting Challenges

৪. Evaluation Metrics for Forecasting

সারাংশ

Time Series Data এর কাজের পদ্ধতি

১. ডেটা সংগ্রহ (Data Collection)

২. ডেটা প্রাক-প্রসেসিং (Data Preprocessing)

৩. ট্রেন্ড (Trend) এবং সিজনালিটি (Seasonality) চিহ্নিত করা

৪. মডেল নির্বাচন এবং প্রশিক্ষণ (Model Selection and Training)

1. ARIMA (AutoRegressive Integrated Moving Average):

2. SARIMA (Seasonal ARIMA):

3. Exponential Smoothing (Holt-Winters):

4. Facebook Prophet:

৫. ফোরকাস্টিং (Forecasting)

৬. মূল্যায়ন (Evaluation)

৭. ভবিষ্যতের অনুকরণ (Simulating Future Trends)

সারাংশ

PyTorch দিয়ে Time Series মডেল তৈরি

১. ডেটা প্রস্তুতি

২. LSTM মডেল তৈরি করা

৩. মডেল প্রশিক্ষণ (Training the Model)

৪. মডেল ভবিষ্যদ্বাণী (Prediction)

সারাংশ

LSTM এবং RNN দিয়ে Forecasting

১. Recurrent Neural Networks (RNNs)

RNN এর বৈশিষ্ট্য:

RNN দিয়ে Forecasting:

RNN Model Example for Time Series Forecasting:

২. Long Short-Term Memory (LSTM)

LSTM এর বৈশিষ্ট্য:

LSTM দিয়ে Forecasting:

LSTM Model Example for Time Series Forecasting:

৩. LSTM এবং RNN এর মধ্যে পার্থক্য

৪. Time Series Forecasting এর জন্য LSTM এবং RNN এর ব্যবহার

সারাংশ

Time Series Data নিয়ে কাজ করার উদাহরণ

১. ডেটা লোডিং এবং প্রিপ্রসেসিং

২. ডেটা স্কেলিং

৩. LSTM মডেল তৈরি করা

৪. মডেল ট্রেনিং এবং টেস্টিং

৫. ফলাফল এবং ভিজ্যুয়ালাইজেশন

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!