Keras তে Time Series এবং Forecasting মডেল

কেরাস ডিপ লার্নিং (Deep Learning with Keras) - Machine Learning

439

Time Series Forecasting হল একটি প্রক্রিয়া যেখানে পূর্ববর্তী সময়ের ডেটা ব্যবহার করে ভবিষ্যতের মান পূর্বাভাস করা হয়। এটি বিভিন্ন ক্ষেত্র যেমন অর্থনীতি, আবহাওয়া পূর্বাভাস, স্টক মার্কেট বিশ্লেষণ, বিক্রয় পূর্বাভাস, ইত্যাদিতে ব্যবহৃত হয়। Keras ব্যবহার করে আপনি Recurrent Neural Networks (RNNs) এবং Long Short-Term Memory (LSTM) এর মতো মডেল তৈরি করে টাইম সিরিজ ডেটার জন্য পূর্বাভাস তৈরি করতে পারেন।

Time Series Forecasting মডেল তৈরি করা

১. RNN (Recurrent Neural Network) মডেল

RNNs হল টাইম সিরিজ ডেটা বা সিকোয়েন্স ডেটা প্রক্রিয়াকরণের জন্য ডিজাইন করা নিউরাল নেটওয়ার্ক, যা পূর্ববর্তী আউটপুটকে পরবর্তী প্রক্রিয়ায় ইনপুট হিসেবে গ্রহণ করে এবং সিকোয়েন্সের মধ্যে সম্পর্ক শিখতে সহায়ক। তবে RNN এর সীমাবদ্ধতা রয়েছে, যেমন লং টার্ম ডিপেনডেন্সি সমস্যা, যা LSTM মডেল দ্বারা সমাধান করা হয়।

১.১. RNN মডেল উদাহরণ

import numpy as np
import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense

# Dummy time series data
x_train = np.random.rand(100, 10, 1)  # 100 samples, 10 time steps, 1 feature
y_train = np.random.rand(100, 1)

# Build RNN model
model = Sequential()
model.add(SimpleRNN(50, activation='relu', input_shape=(10, 1)))
model.add(Dense(1))

# Compile model
model.compile(optimizer='adam', loss='mse')

# Train model
model.fit(x_train, y_train, epochs=10)

এই কোডে, একটি SimpleRNN লেয়ার ব্যবহার করা হয়েছে, যেখানে ৫০টি ইউনিট ব্যবহার করা হয়েছে এবং Dense লেয়ার দিয়ে আউটপুট তৈরি করা হয়েছে।

১.২. RNN মডেল বিশ্লেষণ

Activation Function: relu ব্যবহৃত হয়েছে RNN লেয়ারে। তবে আপনি tanh বা অন্যান্য এক্টিভেশন ফাংশনও ব্যবহার করতে পারেন।
Output: এখানে শুধুমাত্র একটি আউটপুট (1 value) প্রতিটি টাইম স্টেপের জন্য অনুমান করা হচ্ছে।

২. LSTM (Long Short-Term Memory) মডেল

LSTM হল একটি বিশেষ ধরনের RNN যা long-term dependencies শিখতে সক্ষম। এটি vanishing gradient সমস্যার সমাধান করে এবং টাইম সিরিজ ডেটা থেকে আরো দীর্ঘ সময়ের সম্পর্ক শিখতে সাহায্য করে। টাইম সিরিজ ফরকাস্টিং এর জন্য LSTM মডেল অত্যন্ত জনপ্রিয়।

২.১. LSTM মডেল উদাহরণ

from tensorflow.keras.layers import LSTM

# Dummy time series data
x_train = np.random.rand(100, 10, 1)  # 100 samples, 10 time steps, 1 feature
y_train = np.random.rand(100, 1)

# Build LSTM model
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(10, 1)))
model.add(Dense(1))

# Compile model
model.compile(optimizer='adam', loss='mse')

# Train model
model.fit(x_train, y_train, epochs=10)

এখানে LSTM মডেল ব্যবহৃত হয়েছে, যা টাইম সিরিজ ডেটা থেকে দীর্ঘ সময়ের সম্পর্ক শিখতে পারে।

২.২. LSTM মডেল বিশ্লেষণ

LSTM ইউনিট: এখানে ৫০টি LSTM ইউনিট ব্যবহার করা হয়েছে, যা ১০টি টাইম স্টেপ ইনপুট নিয়ে একটি একক আউটপুট তৈরি করবে।
Activation Function: relu ফাংশন ব্যবহার করা হয়েছে। তবে LSTM-এ সাধারণত tanh ও sigmoid ব্যবহার হয়।

৩. Time Series Forecasting মডেল (Advanced)

Time Series Forecasting মডেল তৈরি করার জন্য কিছু উন্নত কৌশল রয়েছে, যেমন Bidirectional LSTM, GRU (Gated Recurrent Unit), এবং Stacked LSTM। এই মডেলগুলি কিভাবে কাজ করে এবং কিভাবে এগুলো আপনার টাইম সিরিজ ডেটা নিয়ে কাজ করতে পারে তা নিয়ে বিস্তারিত আলোচনা করা হলো।

৩.১. Bidirectional LSTM

Bidirectional LSTM মডেলটি সময়ের তথ্য দুটি দিক থেকে শিখতে সক্ষম। অর্থাৎ, এটি forward এবং backward দুই দিক থেকে ডেটা প্রক্রিয়া করতে পারে, যা মডেলটির পারফরম্যান্স উন্নত করতে সহায়ক।

from tensorflow.keras.layers import Bidirectional

# Build Bidirectional LSTM model
model = Sequential()
model.add(Bidirectional(LSTM(50, activation='relu'), input_shape=(10, 1)))
model.add(Dense(1))

# Compile model
model.compile(optimizer='adam', loss='mse')

# Train model
model.fit(x_train, y_train, epochs=10)

৩.২. GRU (Gated Recurrent Unit)

GRU হল LSTM এর একটি সহজ সংস্করণ, যা একই কাজ করতে পারে কিন্তু এটি কম পরিমাণ প্যারামিটার ব্যবহার করে। এটি LSTM এর তুলনায় দ্রুত এবং কম প্রশিক্ষণ ডেটার প্রয়োজন হতে পারে।

from tensorflow.keras.layers import GRU

# Build GRU model
model = Sequential()
model.add(GRU(50, activation='relu', input_shape=(10, 1)))
model.add(Dense(1))

# Compile model
model.compile(optimizer='adam', loss='mse')

# Train model
model.fit(x_train, y_train, epochs=10)

৪. Time Series Forecasting এর জন্য Data Preprocessing

মডেল তৈরির আগে টাইম সিরিজ ডেটার প্রিপ্রসেসিং করা অত্যন্ত গুরুত্বপূর্ণ। সাধারণত, scaling, reshaping, এবং windowing techniques ব্যবহার করা হয় টাইম সিরিজ ডেটা প্রিপ্রসেস করতে।

৪.১. Data Normalization

ডেটাকে 0 এবং 1 এর মধ্যে নরমালাইজ করা গুরুত্বপূর্ণ, কারণ নিউরাল নেটওয়ার্কের জন্য এটি প্রশিক্ষণ প্রক্রিয়া দ্রুত করে।

from sklearn.preprocessing import MinMaxScaler

# Normalize the data
scaler = MinMaxScaler(feature_range=(0, 1))
x_train_scaled = scaler.fit_transform(x_train)

৪.২. Time Series Data Shaping

LSTM বা RNN মডেলগুলি 3D ইনপুট ফর্ম্যাট আশা করে, যেখানে (samples, time_steps, features) আকারে ডেটা পাঠানো হয়।

# Reshaping data for LSTM
x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1))

৪.৩. Creating Sliding Window

টাইম সিরিজ ডেটায় "sliding window" technique ব্যবহার করা হয়, যেখানে একটি নির্দিষ্ট সময়ের উইন্ডো নিয়ে পরবর্তী সময়ের পূর্বাভাস তৈরি করা হয়।

# Example: Creating sliding windows from time series data
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data) - time_step - 1):
        X.append(data[i:(i + time_step), 0])
        y.append(data[i + time_step, 0])
    return np.array(X), np.array(y)

X, y = create_dataset(x_train_scaled, time_step=10)

সারাংশ

Time Series Forecasting মডেল তৈরির জন্য RNN, LSTM, Bidirectional LSTM, এবং GRU মডেলগুলি অত্যন্ত কার্যকরী। Keras এর মাধ্যমে আপনি খুব সহজেই এই মডেলগুলি তৈরি এবং প্রশিক্ষণ করতে পারেন। মডেল প্রিপ্রসেসিং যেমন data normalization, reshaping, এবং sliding window গুরুত্বপূর্ণ এবং এগুলি মডেলটির পারফরম্যান্স উন্নত করতে সহায়তা করে।

Content added By

Azizar Rahman Aziz

Time Series ডেটা Preprocessing

392

Time Series ডেটা এমন একটি ডেটাসেট, যেখানে ডেটা টাইম স্ট্যাম্পের (যেমন: ঘণ্টা, দিন, মাস) সাথে সম্পর্কিত থাকে এবং সময়ের সাথে এর মান পরিবর্তন হয়। Time series ডেটা প্রক্রিয়া (Preprocessing) করার সময়, লক্ষ্য থাকে ডেটাকে সেইভাবে প্রস্তুত করা যাতে মডেল বা অ্যালগোরিদমে এর পরবর্তী আউটপুট সঠিক হয়। Time series ডেটা প্রক্রিয়াকরণে কিছু গুরুত্বপূর্ণ পদক্ষেপ রয়েছে:

১. Time Series ডেটা লোড এবং ইন্সপেকশন

প্রথমে ডেটাটি লোড করতে হবে এবং প্রাথমিকভাবে এর গঠন বিশ্লেষণ করতে হবে।

import pandas as pd

# ডেটা লোড করা
data = pd.read_csv('path_to_your_time_series_data.csv', parse_dates=['date_column'], index_col='date_column')

# প্রথম ৫টি রেকর্ড দেখা
print(data.head())

# ডেটার তথ্য দেখা
print(data.info())

এখানে, parse_dates ব্যবহার করা হয়েছে যাতে তারিখের কলামটি ডেটাটাইপ হিসেবে সঠিকভাবে পরিণত হয় এবং index_col দিয়ে সেট করা হয়েছে যে এটি ডেটার ইনডেক্স হিসেবে কাজ করবে।

২. Missing Values (অনুপস্থিত মান) হ্যান্ডেল করা

Time series ডেটাতে মাঝে মাঝে কিছু মান অনুপস্থিত থাকে, যা ট্রেনিং এবং পূর্বাভাসের জন্য সমস্যা সৃষ্টি করতে পারে। Missing values পূরণ করার জন্য সাধারণত ফরওয়ার্ড ফিলিং, ব্যাকওয়ার্ড ফিলিং অথবা ইন্টারপোলেশন পদ্ধতি ব্যবহার করা হয়।

# Missing values চেক করা
print(data.isnull().sum())

# ফরওয়ার্ড ফিলিং (ফিলিং previous value)
data.fillna(method='ffill', inplace=True)

# ব্যাকওয়ার্ড ফিলিং (ফিলিং next value)
# data.fillna(method='bfill', inplace=True)

# ইন্টারপোলেশন (বিভিন্ন পদ্ধতির ইন্টারপোলেশন)
# data.interpolate(method='linear', inplace=True)

৩. Data Resampling এবং Frequency Adjustment

Time series ডেটার ফ্রিকোয়েন্সি পরিবর্তন করা বা resampling করা হয় যখন আপনি সঠিক সময়ের ভিত্তিতে ডেটা পরিবর্তন করতে চান, যেমন: দৈনিক ডেটা থেকে মাসিক ডেটায় পরিবর্তন করা।

# ডেটার ফ্রিকোয়েন্সি পরিবর্তন করা (উদাহরণ: দৈনিক থেকে মাসিক)
data_resampled = data.resample('M').mean()  # 'M' মানে মাসিক রিস্যাম্পলিং

৪. Seasonality এবং Trend Decomposition

Time series ডেটাতে প্রায়ই seasonality (বিশেষ সময়ের মধ্যে পুনরাবৃত্তি) এবং trend (সময় অনুসারে ধীরে ধীরে পরিবর্তন) থাকে। এগুলি আলাদা করা গুরুত্বপূর্ণ, কারণ এই উপাদানগুলির সাথে কাজ করার জন্য মডেলটি সঠিকভাবে প্রস্তুত করা হয়।

from statsmodels.tsa.seasonal import seasonal_decompose

# Seasonality এবং trend decomposition
decomposition = seasonal_decompose(data, model='additive', period=365)

# Decomposed components দেখতে
decomposition.plot()
plt.show()

Model='additive': যখন সময়ের সাথে প্রবণতা (trend) এবং মৌসুমী প্যাটার্ন (seasonality) এর প্রভাব সরাসরি যোগ হয়।
Model='multiplicative': যখন মৌসুমী প্যাটার্ন এবং প্রবণতার প্রভাব একে অপরের সাথে গুণফলে প্রভাব ফেলে।

৫. Scaling বা Normalization

Time series ডেটার বিভিন্ন বৈশিষ্ট্যের মধ্যে বড় পার্থক্য থাকতে পারে, যা মডেলের পারফরম্যান্সকে প্রভাবিত করতে পারে। সাধারণত, MinMax Scaling বা Standardization ব্যবহার করা হয়।

from sklearn.preprocessing import MinMaxScaler, StandardScaler

# MinMax Scaling
scaler = MinMaxScaler(feature_range=(0, 1))
data_scaled = scaler.fit_transform(data)

# Standardization
scaler = StandardScaler()
data_scaled = scaler.fit_transform(data)

৬. Lag Features তৈরি করা

Lag features বা shifted features Time series ডেটাতে ব্যবহৃত হয়, যেখানে পূর্ববর্তী সময়ের মানগুলিকে বর্তমান সময়ের সাথে সম্পর্কিত করা হয়।

# 1 ল্যাগ ফিচার তৈরি করা
data['lag_1'] = data['value_column'].shift(1)

# Multiple lag features (e.g., 3 lag features)
data['lag_2'] = data['value_column'].shift(2)
data['lag_3'] = data['value_column'].shift(3)

এখানে shift(1) একটি কলামের মানকে এক সাপ্তাহিক বা একদিন পিছনে নিয়ে আসে, এবং এতে পূর্ববর্তী সময়ের প্রভাব নতুন পয়েন্টের সাথে যুক্ত হয়।

৭. Time-Based Splitting (Train-Test Split)

Time series ডেটার সাথে কাজ করার সময় সাধারণ random splitting ব্যবহার করা উচিত নয়, কারণ এতে সময়ের ধারাবাহিকতা নষ্ট হয়ে যায়। Time series ডেটাতে train-test split করতে সাধারণত time-based split ব্যবহার করা হয়।

# Time-based train-test split
train_size = int(len(data) * 0.8)
train, test = data[:train_size], data[train_size:]

print(f"Training data: {train.shape}")
print(f"Testing data: {test.shape}")

৮. Feature Engineering

Time series ডেটাতে আরও কিছু গুরুত্বপূর্ণ ফিচার তৈরি করা যেতে পারে, যেমন:

Rolling Mean: এটি পূর্ববর্তী কিছু সময়ের মধ্যে গড় বের করে এবং অস্থিরতা কমাতে সহায়ক।

# Rolling mean (Moving Average)
data['rolling_mean'] = data['value_column'].rolling(window=7).mean()

Seasonal Features: এক বছরের মধ্যে সময় অনুযায়ী মৌসুমী বৈশিষ্ট্য তৈরি করা।

# Extracting month and day of week as features
data['month'] = data.index.month
data['day_of_week'] = data.index.dayofweek

সারাংশ

Time series ডেটার preprocessing অনেক গুরুত্বপূর্ণ ধাপের সমন্বয়ে গঠিত। এই প্রক্রিয়া ডেটাকে পরিষ্কার, সঠিকভাবে স্কেলড, এবং উপযোগী ফিচার তৈরি করা হয় যাতে ভবিষ্যৎ পূর্বাভাসের জন্য মডেলটি উন্নতভাবে কাজ করতে পারে। গুরুত্বপূর্ণ ধাপগুলো হল:

Missing values পূরণ করা
Data resampling এবং frequency adjustment
Seasonality এবং Trend decomposition
Scaling বা Normalization
Lag features তৈরি করা
Time-based train-test split
Feature engineering (যেমন rolling mean, seasonal features)

এই সব ধাপ সঠিকভাবে অনুসরণ করলে আপনি একটি শক্তিশালী এবং কার্যকর মডেল তৈরি করতে সক্ষম হবেন।

Content added By

Azizar Rahman Aziz

LSTM ব্যবহার করে Time Series Prediction

434

LSTM (Long Short-Term Memory) হল একটি বিশেষ ধরনের Recurrent Neural Network (RNN), যা টাইম সিরিজ ডেটা এবং সিকোয়েন্স ডেটা প্রক্রিয়া করতে খুবই কার্যকরী। LSTM মডেল দীর্ঘকালীন নির্ভরতা (long-term dependencies) শিখতে সক্ষম, যা সাধারণ RNN মডেলগুলির জন্য একটি চ্যালেঞ্জ হতে পারে। তাই time series prediction (টাইম সিরিজ পূর্বাভাস) এর ক্ষেত্রে LSTM একটি শক্তিশালী টুল।

Time Series Prediction এর ধাপ

টেমপ্লেট হিসেবে আমরা একটি সিম্পল টাইম সিরিজ প্রেডিকশন তৈরি করব। ধরা যাক, আমাদের কাছে কিছু সংখ্যার টাইম সিরিজ ডেটা আছে, এবং আমরা LSTM ব্যবহার করে ভবিষ্যত মানগুলি পূর্বাভাস করতে চাই।

১. প্রয়োজনীয় লাইব্রেরি ইনস্টলেশন

pip install numpy pandas matplotlib tensorflow scikit-learn

২. ডেটা লোড এবং প্রিপ্রসেসিং

টাইম সিরিজ ডেটা প্রিপ্রসেস করার জন্য প্রথমে ডেটা লোড করতে হবে এবং সঠিক ফরম্যাটে রূপান্তর করতে হবে। এখানে, আমরা কৃত্রিম ডেটার মাধ্যমে কাজ করব।

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

# কৃত্রিম টাইম সিরিজ ডেটা তৈরি করা
data = np.sin(np.linspace(0, 100, 1000))  # Sinusoidal টাইম সিরিজ

# ডেটাকে DataFrame তে রূপান্তর করা
df = pd.DataFrame(data, columns=['value'])
df.plot(figsize=(10,6))
plt.title('Generated Time Series Data')
plt.show()

৩. ডেটা স্কেলিং

LSTM মডেলগুলির জন্য ডেটা স্কেলিং অত্যন্ত গুরুত্বপূর্ণ। সাধারণত, MinMaxScaler ব্যবহার করা হয় যাতে সমস্ত মান 0 থেকে 1 এর মধ্যে নেমে আসে।

# MinMaxScaler ব্যবহার করে ডেটা স্কেলিং করা
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(df.values.reshape(-1, 1))

# স্কেল করা ডেটা প্লট করা
plt.figure(figsize=(10,6))
plt.plot(scaled_data)
plt.title('Scaled Time Series Data')
plt.show()

৪. ডেটা টু সিকোয়েন্স (Time Steps তৈরি করা)

LSTM মডেলটি টাইম স্টেপস (time steps) ব্যবহার করে ডেটা প্রক্রিয়া করে, যেখানে আমরা পূর্ববর্তী সময়ের ডেটা ব্যবহার করে ভবিষ্যতের ডেটা পূর্বাভাস করতে পারি।

# ডেটাকে train এবং test সেটে ভাগ করা
def create_dataset(data, time_step=1):
    X, Y = [], []
    for i in range(len(data) - time_step - 1):
        X.append(data[i:(i + time_step), 0])
        Y.append(data[i + time_step, 0])
    return np.array(X), np.array(Y)

time_step = 50  # পূর্ববর্তী 50 টি সময়ের ডেটা ব্যবহার করা হবে
X, Y = create_dataset(scaled_data, time_step)

# ডেটা শেপ পরিবর্তন করা (LSTM এর জন্য)
X = X.reshape(X.shape[0], X.shape[1], 1)

৫. LSTM মডেল তৈরি

এখন LSTM মডেল তৈরি করা হবে। আমরা একটি সাধারণ LSTM আর্কিটেকচার ব্যবহার করব।

# LSTM মডেল তৈরি করা
model = Sequential()

# LSTM লেয়ার যোগ করা
model.add(LSTM(units=50, return_sequences=False, input_shape=(X.shape[1], 1)))

# Dense লেয়ার যোগ করা
model.add(Dense(units=1))  # একক আউটপুট (future prediction)

# মডেল কম্পাইল করা
model.compile(optimizer='adam', loss='mean_squared_error')

# মডেল সারাংশ দেখানো
model.summary()

৬. মডেল ট্রেনিং

এখন আমরা LSTM মডেলটি ট্রেন করব।

# মডেল ট্রেনিং করা
model.fit(X, Y, epochs=20, batch_size=32, verbose=1)

৭. ভবিষ্যত পূর্বাভাস

মডেল ট্রেনিং শেষে, আমরা ভবিষ্যতের মান (future values) পূর্বাভাস করতে পারি। এখানে আমরা শেষের কয়েকটি সময় পয়েন্ট নিয়ে ভবিষ্যতের পূর্বাভাস করতে চাই।

# ভবিষ্যত পূর্বাভাসের জন্য ডেটা প্রস্তুত করা
test_input = scaled_data[-time_step:]  # শেষ time_step ডেটা ব্যবহার করা
test_input = test_input.reshape(1, -1, 1)

# ভবিষ্যত মান পূর্বাভাস করা
predicted_value = model.predict(test_input)
predicted_value = scaler.inverse_transform(predicted_value)  # স্কেল থেকে বের করা

print(f"Predicted future value: {predicted_value[0][0]}")

৮. পূর্বাভাস প্লট করা

পূর্বাভাসের ফলাফলটি প্লট করতে:

# পূর্বাভাসের সঙ্গে আসল ডেটা প্লট করা
plt.plot(np.arange(len(scaled_data)), scaled_data, label='True Data')
plt.plot(np.arange(len(scaled_data), len(scaled_data) + 1), predicted_value, marker='o', color='r', label='Predicted Data')
plt.legend()
plt.show()

সারাংশ

ডেটা প্রিপ্রসেসিং: টাইম সিরিজ ডেটা স্কেল করা এবং সিকোয়েন্স তৈরি করা LSTM মডেলকে কার্যকরীভাবে ট্রেন করার জন্য অত্যন্ত গুরুত্বপূর্ণ।
LSTM মডেল: LSTM মডেলটি টাইম সিরিজ ডেটার জন্য একাধিক সময়ের ডিপেন্ডেন্সি শিখে এবং ভবিষ্যত পূর্বাভাস করতে সহায়ক।
মডেল ট্রেনিং: LSTM মডেলটি সাধারণ Mean Squared Error (MSE) লস ফাংশন দিয়ে ট্রেন করা হয় এবং এটি ভবিষ্যত মান পূর্বাভাস করতে সক্ষম।

এভাবে LSTM ব্যবহার করে আপনি টাইম সিরিজ পূর্বাভাস করতে পারেন।

Content added By

Azizar Rahman Aziz

Sequence-to-Sequence মডেল Training

350

Sequence-to-Sequence (Seq2Seq) মডেল হল একটি ডীপ লার্নিং আর্কিটেকচার যা সাধারণত এনকোডার-ডিকোডার কাঠামো ব্যবহার করে। এটি বিশেষভাবে টেক্সট ট্রান্সলেশন, সেন্টেন্স পার্সিং, সিস্টেম ডায়ালগ, এবং অন্যান্য টেক্সট জেনারেশন সমস্যায় ব্যবহৃত হয়।

Seq2Seq মডেল দুটি অংশে বিভক্ত: এনকোডার (Encoder) এবং ডিকোডার (Decoder)।

Encoder: ইনপুট সিকোয়েন্সকে (যেমন একটি বাক্য) ভেক্টরে রূপান্তরিত করে। এটি ইনপুট সিকোয়েন্সের উপর ভিত্তি করে context vector তৈরি করে, যা পুরো সিকোয়েন্সের সারাংশ ধারণ করে।
Decoder: Context vector ব্যবহার করে আউটপুট সিকোয়েন্স তৈরি করে (যেমন, অনুবাদ করা বাক্য)।

Seq2Seq মডেলগুলো সাধারণত Recurrent Neural Networks (RNNs), LSTM, অথবা GRU লেয়ার ব্যবহার করে তৈরি করা হয়।

Sequence-to-Sequence মডেল Training Example

এখানে আমরা Keras এবং TensorFlow ব্যবহার করে একটি Seq2Seq মডেল তৈরি করব। এই মডেলটি একটি LSTM এনকোডার-ডিকোডার আর্কিটেকচার হবে এবং আমরা এটিকে ইংরেজি থেকে স্প্যানিশ অনুবাদ করতে ট্রেন করব।

১. প্রয়োজনীয় লাইব্রেরি ইনস্টলেশন

প্রথমে কিছু প্রয়োজনীয় লাইব্রেরি ইনস্টল করতে হবে:

pip install tensorflow
pip install numpy
pip install scikit-learn

২. ডেটাসেট লোড এবং প্রিপ্রসেসিং

এই উদাহরণে আমরা English-Spanish Translation ডেটাসেট ব্যবহার করব। এই ডেটাসেটটি ডাউনলোড করা যেতে পারে অথবা আপনি নিজেই একটি তৈরি করতে পারেন। এখানে একটি সাধারণ ডেটাসেট তৈরি করা হলো:

import numpy as np
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from sklearn.model_selection import train_test_split

# উদাহরণস্বরূপ ডেটাসেট
input_texts = ['hello', 'how are you?', 'what is your name?', 'good morning']
output_texts = ['hola', 'cómo estás?', 'cuál es tu nombre?', 'buenos días']

# টোকেনাইজার তৈরি
input_tokenizer = Tokenizer()
output_tokenizer = Tokenizer()

# টোকেনাইজ করা ইনপুট এবং আউটপুট টেক্সট
input_tokenizer.fit_on_texts(input_texts)
output_tokenizer.fit_on_texts(output_texts)

# সিকোয়েন্সে রূপান্তর করা
input_sequences = input_tokenizer.texts_to_sequences(input_texts)
output_sequences = output_tokenizer.texts_to_sequences(output_texts)

# প্যাডিং দেওয়া
max_input_length = max([len(seq) for seq in input_sequences])
max_output_length = max([len(seq) for seq in output_sequences])

input_sequences = pad_sequences(input_sequences, maxlen=max_input_length, padding='post')
output_sequences = pad_sequences(output_sequences, maxlen=max_output_length, padding='post')

# ডেটা ভাগ করা (train, test)
X_train, X_test, y_train, y_test = train_test_split(input_sequences, output_sequences, test_size=0.2, random_state=42)

# ইনপুট এবং আউটপুট আকার
vocab_size_input = len(input_tokenizer.word_index) + 1
vocab_size_output = len(output_tokenizer.word_index) + 1

৩. Encoder-Decoder আর্কিটেকচার

এখন আমরা একটি LSTM Encoder-Decoder মডেল তৈরি করব।

from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, LSTM, Dense, Embedding

def build_seq2seq_model(vocab_size_input, vocab_size_output, input_length, output_length, latent_dim):
    # এনকোডার
    encoder_inputs = Input(shape=(input_length,))
    encoder_embedding = Embedding(input_dim=vocab_size_input, output_dim=latent_dim)(encoder_inputs)
    encoder_lstm = LSTM(latent_dim, return_state=True)
    encoder_outputs, state_h, state_c = encoder_lstm(encoder_embedding)
    encoder_states = [state_h, state_c]

    # ডিকোডার
    decoder_inputs = Input(shape=(output_length,))
    decoder_embedding = Embedding(input_dim=vocab_size_output, output_dim=latent_dim)(decoder_inputs)
    decoder_lstm = LSTM(latent_dim, return_sequences=True, return_state=True)
    decoder_lstm_outputs, _, _ = decoder_lstm(decoder_embedding, initial_state=encoder_states)
    decoder_dense = Dense(vocab_size_output, activation='softmax')
    decoder_outputs = decoder_dense(decoder_lstm_outputs)

    # মডেল তৈরি
    model = Model([encoder_inputs, decoder_inputs], decoder_outputs)
    model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

    model.summary()
    return model

latent_dim = 256  # LSTM এর ল্যাটেন্ট ডাইমেনশন

# মডেল তৈরি
seq2seq_model = build_seq2seq_model(vocab_size_input, vocab_size_output, max_input_length, max_output_length, latent_dim)

Encoder: ইনপুট সিকোয়েন্সটি LSTM এর মাধ্যমে আউটপুটের জন্য কনটেক্সট ভেক্টর তৈরি করবে।
Decoder: LSTM ব্যবহার করে কনটেক্সট ভেক্টর থেকে আউটপুট সিকোয়েন্স তৈরি করবে।
Dense Layer: আউটপুট সিকোয়েন্সের জন্য softmax অ্যাকটিভেশন ফাংশন ব্যবহার করে শব্দের পূর্বাভাস করবে।

৪. মডেল ট্রেনিং

এখন, আমরা seq2seq_model মডেলটি ট্রেন করব:

# Decoder Inputs এর জন্য শিফট করা আউটপুট সিকোয়েন্স
y_train_decoder_input = np.zeros_like(y_train)
y_train_decoder_input[:, 1:] = y_train[:, :-1]
y_train_decoder_input[:, 0] = output_tokenizer.word_index['<start>']  # "<start>" শব্দ ইনিশিয়ালাইজড করা

# ট্রেনিং
seq2seq_model.fit([X_train, y_train_decoder_input], np.expand_dims(y_train, -1), epochs=100, batch_size=16, validation_data=([X_test, y_test_decoder_input], np.expand_dims(y_test, -1)))

৫. মডেল পূর্বাভাস করা

মডেলটি ট্রেন করার পর, আমরা Encoder-Decoder মডেলটি ব্যবহার করে নতুন ইনপুট সিকোয়েন্সের পূর্বাভাস করতে পারি।

# ইনপুট থেকে এনকোডার স্টেট বের করা
encoder_model = Model(encoder_inputs, encoder_states)

# ডিকোডার মডেল তৈরি
decoder_state_input_h = Input(shape=(latent_dim,))
decoder_state_input_c = Input(shape=(latent_dim,))
decoder_states_inputs = [decoder_state_input_h, decoder_state_input_c]
decoder_lstm_outputs, state_h, state_c = decoder_lstm(decoder_embedding, initial_state=decoder_states_inputs)
decoder_states = [state_h, state_c]
decoder_outputs = decoder_dense(decoder_lstm_outputs)
decoder_model = Model([decoder_inputs] + decoder_states_inputs, [decoder_outputs] + decoder_states)

# মডেল দিয়ে প্রেডিকশন করা
def decode_sequence(input_seq):
    # এনকোডার থেকে স্টেট আনা
    states_value = encoder_model.predict(input_seq)

    # ডিকোডার ইনপুটে "<start>" শব্দ ব্যবহার করা
    target_seq = np.zeros((1, 1))
    target_seq[0, 0] = output_tokenizer.word_index['<start>']

    stop_condition = False
    decoded_sentence = ''
    while not stop_condition:
        # ডিকোডার থেকে আউটপুট প্রাপ্তি
        output_tokens, h, c = decoder_model.predict([target_seq] + states_value)

        # পূর্বাভাসকৃত শব্দ নির্বাচন করা
        sampled_token_index = np.argmax(output_tokens[0, -1, :])
        sampled_word = output_tokenizer.index_word[sampled_token_index]
        decoded_sentence += ' ' + sampled_word

        # স্টপ কন্ডিশন চেক করা
        if sampled_word == '<end>' or len(decoded_sentence) > max_output_length:
            stop_condition = True

        # পরবর্তী ইনপুট
        target_seq[0, 0] = sampled_token_index
        states_value = [h, c]

    return decoded_sentence

# এক উদাহরণ দিয়ে প্রেডিকশন করা
input_seq = X_test[0:1]  # একটি ইনপুট সিকোয়েন্স
decoded_sentence = decode_sequence(input_seq)
print(f"Decoded Sentence: {decoded_sentence}")

সারাংশ

Sequence-to-Sequence (Seq2Seq) মডেল দুটি মডেল নিয়ে গঠিত: **Encoder

** এবং Decoder। এটি বিশেষভাবে ব্যবহৃত হয় টেক্সট ট্রান্সলেশন, প্রশ্ন-উত্তর সিস্টেম, এবং অন্যান্য সিকোয়েন্স জেনারেশন সমস্যায়। আমরা LSTM অথবা GRU লেয়ার ব্যবহার করে এই মডেলগুলো তৈরি করতে পারি।

Encoder ইনপুট সিকোয়েন্সের জন্য কনটেক্সট ভেক্টর তৈরি করে।
Decoder ঐ কনটেক্সট ভেক্টর ব্যবহার করে আউটপুট সিকোয়েন্স তৈরি করে।

এই মডেলটি একটি Encoder-Decoder কাঠামো ব্যবহার করে যেটি LSTM এর মতো শক্তিশালী মেমরি ধারণ করতে সক্ষম।

Content added By

Azizar Rahman Aziz

Advanced Techniques for Time Series Forecasting

434

টাইম সিরিজ ফোরকাস্টিং হল এমন একটি প্রক্রিয়া, যার মাধ্যমে পূর্ববর্তী পর্যবেক্ষণের ভিত্তিতে ভবিষ্যৎ মান পূর্বাভাস করা হয়। এই ক্ষেত্রে, উন্নত প্রযুক্তি গুলি ট্রেন্ড, সিজনালিটি এবং অ্যালগোরিদমের মধ্যে থাকা জটিল সম্পর্কগুলো ধরতে অত্যন্ত কার্যকরী। নিচে টাইম সিরিজ ফোরকাস্টিংয়ের জন্য কিছু উন্নত প্রযুক্তি দেওয়া হলো:

১. ARIMA এবং SARIMA (Seasonal ARIMA)

ARIMA (AutoRegressive Integrated Moving Average) একটি জনপ্রিয় টাইম সিরিজ মডেল, যা তিনটি উপাদান নিয়ে গঠিত:

AR (AutoRegressive): এটি পূর্ববর্তী পর্যবেক্ষণ এবং বর্তমান পর্যবেক্ষণের মধ্যে সম্পর্কের উপর কাজ করে।
I (Integrated): এটি সিরিজকে স্টেশনারি করতে ব্যবহৃত হয়, যেমন ডিফারেন্সিং।
MA (Moving Average): এটি পূর্ববর্তী পূর্বাভাসের ত্রুটির উপর ভিত্তি করে পরবর্তী মান হিসাব করে।

SARIMA হল ARIMA মডেলের সিজনাল এক্সটেনশন, যা বিশেষত সিজনাল টাইম সিরিজ ডেটার জন্য ব্যবহৃত হয়।

প্রক্রিয়া:

স্টেশনারিটি পরীক্ষা করা: ARIMA প্রয়োগ করার আগে সিরিজের স্টেশনারি হওয়ার বিষয়টি পরীক্ষা করা উচিত।
মডেল শনাক্তকরণ: AR, I, MA এর আদর্শ আদেশ নির্ধারণের জন্য ACF এবং PACF প্লট ব্যবহার করা।
মডেল ফিটিং: statsmodels লাইব্রেরি দিয়ে ARIMA বা SARIMA মডেল ফিট করা।

import pandas as pd
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.stattools import adfuller

# ডেটা লোড করা
data = pd.read_csv('your_time_series_data.csv')

# ADF টেস্টের মাধ্যমে স্টেশনারিটি পরীক্ষা করা
result = adfuller(data['value'])
print('ADF Statistic:', result[0])
print('p-value:', result[1])

# ARIMA মডেল তৈরি করা
model = ARIMA(data['value'], order=(5,1,0))  # AR(5), I(1), MA(0)
model_fit = model.fit()

# মডেল ফিটিংয়ের সারাংশ
print(model_fit.summary())

# পূর্বাভাস করা
forecast = model_fit.forecast(steps=10)
plt.plot(data['value'])
plt.plot(np.arange(len(data), len(data)+10), forecast, color='red')
plt.show()

২. Exponential Smoothing (ETS)

Exponential Smoothing একটি জনপ্রিয় টেকনিক যা সিজনালিটি এবং ট্রেন্ড থাকার ক্ষেত্রে কার্যকরী। এতে পুরানো ডেটা অপেক্ষা নতুন ডেটাকে বেশি গুরুত্ব দেওয়া হয়।

Simple Exponential Smoothing (SES): যখন ডেটাতে কোন ট্রেন্ড বা সিজনালিটি থাকে না।
Holt’s Linear Trend Model: যখন ডেটাতে ট্রেন্ড থাকে কিন্তু সিজনালিটি না থাকে।
Holt-Winters Exponential Smoothing: যখন ডেটাতে ট্রেন্ড এবং সিজনালিটি দুইটাই থাকে।

from statsmodels.tsa.holtwinters import ExponentialSmoothing

# Holt-Winters মডেল তৈরি করা
model = ExponentialSmoothing(data['value'], trend='add', seasonal='add', seasonal_periods=12)
model_fit = model.fit()

# পূর্বাভাস করা
forecast = model_fit.forecast(steps=10)
plt.plot(data['value'])
plt.plot(np.arange(len(data), len(data)+10), forecast, color='red')
plt.show()

৩. Long Short-Term Memory (LSTM)

LSTM হল একটি টাইপের Recurrent Neural Network (RNN) যা দীর্ঘকালীন নির্ভরতা (long-term dependencies) শিখতে সক্ষম। এটি বিশেষভাবে টেক্সট এবং সিকোয়েন্সাল ডেটা প্রক্রিয়া করার জন্য ব্যবহৃত হয়।

LSTM এমন একটি মডেল যা খুব ভালোভাবে দীর্ঘকালীন সম্পর্ক শিখতে সক্ষম এবং এতে non-linear patterns ধরে রাখতে সাহায্য করে।

from keras.models import Sequential
from keras.layers import LSTM, Dense
import numpy as np

# ডেটা প্রস্তুতি (LSTM জন্য সঠিক আকারে রূপান্তর করা)
X_train, y_train = prepare_data(time_series_data)  # এখানে সময় সিরিজ ডেটা প্রস্তুত করার জন্য একটি ফাংশন ধরেছি

# LSTM মডেল তৈরি করা
model = Sequential()
model.add(LSTM(units=50, return_sequences=False, input_shape=(X_train.shape[1], 1)))
model.add(Dense(units=1))

# মডেল কম্পাইল এবং ট্রেনিং
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(X_train, y_train, epochs=50, batch_size=32)

# পূর্বাভাস করা
forecast = model.predict(X_test)

৪. Facebook Prophet

Prophet হল একটি ওপেন-সোর্স ফোরকাস্টিং টুল যা বিশেষত সিজনাল ডেটা এবং হলিডে প্রভাব বুঝতে সহায়তা করে। এটি ইররর ডেটা এবং অনিয়মিত ডেটা পরিচালনা করতে সক্ষম।

from fbprophet import Prophet

# Prophet ফরম্যাটে ডেটা প্রস্তুত করা
data = pd.DataFrame({'ds': data['date'], 'y': data['value']})

# মডেল তৈরি এবং ফিট করা
model = Prophet()
model.fit(data)

# ভবিষ্যতের জন্য পূর্বাভাস করা
future = model.make_future_dataframe(data, periods=10)
forecast = model.predict(future)

# পূর্বাভাস প্লট করা
model.plot(forecast)
plt.show()

৫. XGBoost for Time Series Forecasting

XGBoost হল একটি শক্তিশালী গ্রেডিয়েন্ট বুস্টিং মডেল যা টাইম সিরিজ ফোরকাস্টিংয়ে ব্যবহৃত হতে পারে। XGBoost মূলত lag features তৈরি করে এবং টার্গেট মান পূর্বাভাস করার জন্য একটি সুপারভাইজড লার্নিং মডেল হিসেবে কাজ করে।

import xgboost as xgb

# ল্যাগ ফিচার তৈরি করা
X_train, y_train = create_lag_features(time_series_data)

# XGBoost মডেল ট্রেনিং
model = xgb.XGBRegressor(objective='reg:squarederror')
model.fit(X_train, y_train)

# পূর্বাভাস করা
forecast = model.predict(X_test)

৬. ARIMAX (ARIMA with Exogenous Variables)

ARIMAX হল ARIMA এর এক্সটেনশন যা এক্সোজেনাস ভেরিয়েবল (অর্থাৎ বাইরের ডেটা যেমন আবহাওয়া, ইভেন্ট, বা অন্যান্য অর্থনৈতিক তথ্য) অন্তর্ভুক্ত করতে পারে। এটি ডেটার বাইরের প্রভাবকে অন্তর্ভুক্ত করে আরও ভাল পূর্বাভাস দেয়।

from statsmodels.tsa.statespace.sarimax import SARIMAX

# এক্সোজেনাস ভেরিয়েবল
exog_variables = external_data  # এক্সোজেনাস ডেটা

# ARIMAX মডেল তৈরি করা
model = SARIMAX(y_train, exog=exog_variables, order=(1,1,1), seasonal_order=(1,1,1,12))
model_fit = model.fit()

# পূর্বাভাস করা
forecast = model_fit.forecast(steps=10, exog=exog_test)

সারাংশ

টাইম সিরিজ ফোরকাস্টিংয়ের জন্য বিভিন্ন উন্নত প্রযুক্তি রয়েছে যা ডেটার মধ্যে থাকা ট্রেন্ড, সিজনালিটি এবং শক/বিপর্যয় ভালোভাবে ধরতে সক্ষম। কিছু জনপ্রিয় এবং উন্নত প্রযুক্তি হল:

ARIMA/SARIMA: ট্রেন্ড এবং সিজনালিটি মডেল করতে ব্যবহৃত হয়।
Exponential Smoothing (ETS): সিজনাল এবং ট্রেন্ড ভ্যালু সহ ডেটা মডেল করতে ব্যবহৃত হয়।
LSTM/GRU: দীর্ঘকালীন সম্পর্ক শিখতে ব্যবহৃত ডিপ লার্নিং মডেল।
Facebook Prophet: বিশেষত হলিডে প্রভাব এবং অপ্রত্যাশিত ডেটা সঙ্গে কাজ করে।
XGBoost: ল্যাগ ফিচার তৈরি করে টাইম সিরিজ ডেটা প্রক্রিয়া করার জন্য।
ARIMAX: বাইরের ডেটা এবং এক্সোজেনাস ভেরিয়েবল অন্তর্ভুক্ত করে।

উপযুক্ত মডেল নির্বাচন করা ডেটার বৈশিষ্ট্যের উপর নির্ভর করে এবং একে অপ্টিমাইজ করতে বিভিন্ন কৌশল প্রয়োগ করা যায়।

Content added By

Azizar Rahman Aziz

Deep Learning এবং Keras এর পরিচিতি Keras ইনস্টলেশন এবং সেটআপ Keras এর মৌলিক ধারণা Keras তে বেসিক Neural Network তৈরি Data Preprocessing এবং Augmentation

Keras তে Time Series এবং Forecasting মডেল

Time Series Forecasting মডেল তৈরি করা

১. RNN (Recurrent Neural Network) মডেল

১.১. RNN মডেল উদাহরণ

১.২. RNN মডেল বিশ্লেষণ

২. LSTM (Long Short-Term Memory) মডেল

২.১. LSTM মডেল উদাহরণ

২.২. LSTM মডেল বিশ্লেষণ

৩. Time Series Forecasting মডেল (Advanced)

৩.১. Bidirectional LSTM

৩.২. GRU (Gated Recurrent Unit)

৪. Time Series Forecasting এর জন্য Data Preprocessing

৪.১. Data Normalization

৪.২. Time Series Data Shaping

৪.৩. Creating Sliding Window

সারাংশ

Time Series ডেটা Preprocessing

১. Time Series ডেটা লোড এবং ইন্সপেকশন

২. Missing Values (অনুপস্থিত মান) হ্যান্ডেল করা

৩. Data Resampling এবং Frequency Adjustment

৪. Seasonality এবং Trend Decomposition

৫. Scaling বা Normalization

৬. Lag Features তৈরি করা

৭. Time-Based Splitting (Train-Test Split)

৮. Feature Engineering

সারাংশ

LSTM ব্যবহার করে Time Series Prediction

Time Series Prediction এর ধাপ

১. প্রয়োজনীয় লাইব্রেরি ইনস্টলেশন

২. ডেটা লোড এবং প্রিপ্রসেসিং

৩. ডেটা স্কেলিং

৪. ডেটা টু সিকোয়েন্স (Time Steps তৈরি করা)

৫. LSTM মডেল তৈরি

৬. মডেল ট্রেনিং

৭. ভবিষ্যত পূর্বাভাস

৮. পূর্বাভাস প্লট করা

সারাংশ

Sequence-to-Sequence মডেল Training

Sequence-to-Sequence মডেল Training Example

১. প্রয়োজনীয় লাইব্রেরি ইনস্টলেশন

২. ডেটাসেট লোড এবং প্রিপ্রসেসিং

৩. Encoder-Decoder আর্কিটেকচার

৪. মডেল ট্রেনিং

৫. মডেল পূর্বাভাস করা

সারাংশ

Advanced Techniques for Time Series Forecasting

১. ARIMA এবং SARIMA (Seasonal ARIMA)

২. Exponential Smoothing (ETS)

৩. Long Short-Term Memory (LSTM)

৪. Facebook Prophet

৫. XGBoost for Time Series Forecasting

৬. ARIMAX (ARIMA with Exogenous Variables)

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!