Hyperparameter Tuning এবং Optimization

কেরাস ডিপ লার্নিং (Deep Learning with Keras) - Machine Learning

439

Hyperparameter Tuning (হাইপারপারামিটার টিউনিং)

Hyperparameters হল সেই প্যারামিটার যা মডেল প্রশিক্ষণের পূর্বে সেট করতে হয় এবং যা মডেলের পারফরম্যান্সকে প্রভাবিত করে। Hyperparameter Tuning হল সেই প্রক্রিয়া যেখানে আপনি মডেলের পারফরম্যান্স উন্নত করার জন্য সর্বোত্তম হাইপারপারামিটারগুলির মান খুঁজে বের করেন।

প্রথাগত মেশিন লার্নিং এবং ডীপ লার্নিং মডেলগুলির জন্য কিছু সাধারণ হাইপারপারামিটার হল:

Learning Rate: প্রশিক্ষণ প্রক্রিয়ার সময় মডেল কতটা দ্রুত শিখবে তা নিয়ন্ত্রণ করে।
Batch Size: প্রতি ইটারেশনে কতটি স্যাম্পল ব্যবহার হবে তা নির্ধারণ করে।
Epochs: কতবার মডেল ডেটাসেটের ওপর ট্রেন হবে।
Number of Hidden Layers: মডেলে কতটি হিডেন লেয়ার থাকবে।
Number of Units per Layer: প্রতিটি হিডেন লেয়ারে কতটি ইউনিট থাকবে।
Activation Functions: প্রতিটি লেয়ারে অ্যাক্টিভেশন ফাংশন কী হবে (যেমন ReLU, Sigmoid, Tanh)।

Hyperparameter Tuning এর উদ্দেশ্য

মডেলের পারফরম্যান্স সর্বোচ্চ করা।
মডেলটি সঠিকভাবে প্রশিক্ষিত এবং সাধারণীকৃত (generalized) হতে নিশ্চিত করা, যাতে এটি নতুন ডেটার ওপর ভাল কাজ করে।
মডেলটিকে দ্রুত প্রশিক্ষণ দেওয়ার জন্য হাইপারপারামিটারগুলির সাথে সঠিক ভারসাম্য বজায় রাখা।

Hyperparameter Tuning Methods (হাইপারপারামিটার টিউনিং পদ্ধতি)

Grid Search:

Grid search একটি ব্রুট-ফোর্স পদ্ধতি যেখানে আপনি একটি নির্দিষ্ট হাইপারপারামিটারগুলির সীমা (range) দিয়ে সব সম্ভাব্য সংমিশ্রণ পরীক্ষা করেন।
উদাহরণস্বরূপ, যদি আপনি ৩টি learning rate এবং ২টি batch size এর মান পরীক্ষা করতে চান, তবে grid search এগুলোর সব সংমিশ্রণ পরীক্ষা করবে।
এটি সহজ এবং কার্যকরী, তবে অনেক সময়সাপেক্ষ হতে পারে, বিশেষ করে যখন হাইপারপারামিটার স্পেস বড় হয়।

Keras এ Grid Search উদাহরণ:

from sklearn.model_selection import GridSearchCV
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.wrappers.scikit_learn import KerasClassifier

# মডেল তৈরি করার জন্য একটি ফাংশন
def create_model(optimizer='adam'):
    model = Sequential()
    model.add(Dense(64, input_dim=8, activation='relu'))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(loss='binary_crossentropy', optimizer=optimizer, metrics=['accuracy'])
    return model

model = KerasClassifier(build_fn=create_model, verbose=0)

# হাইপারপারামিটার গ্রিড
param_grid = {'batch_size': [16, 32], 'epochs': [10, 50], 'optimizer': ['adam', 'rmsprop']}

# GridSearchCV ব্যবহার করা
grid = GridSearchCV(estimator=model, param_grid=param_grid, n_jobs=-1, cv=3)
grid_result = grid.fit(X_train, y_train)

# সেরা প্যারামিটার
print(f"Best: {grid_result.best_score_} using {grid_result.best_params_}")

Random Search:
- Grid searchের তুলনায় Random Search দ্রুত হতে পারে। এখানে হাইপারপারামিটার স্পেসের মধ্যে এলোমেলোভাবে কিছু প্যারামিটার নির্বাচন করা হয় এবং মডেলের ওপর তা পরীক্ষা করা হয়।
- এটি উচ্চতর হাইপারপারামিটার স্পেসের জন্য কার্যকর হতে পারে, যেখানে grid searchটি খুবই সময়সাপেক্ষ হতে পারে।
Bayesian Optimization:
- Bayesian Optimization একটি আরও উন্নত পদ্ধতি যেখানে পূর্ববর্তী পরীক্ষার ফলাফল ব্যবহার করে, সম্ভাব্য সর্বোত্তম হাইপারপারামিটারগুলি অনুমান করা হয়।
- এটি কার্যকরী এবং দ্রুত, কারণ এটি আরও সুনির্দিষ্টভাবে হাইপারপারামিটার স্পেস খোঁজে।
Genetic Algorithms (GA):
- Genetic Algorithm বা জেনেটিক অ্যালগরিদম হাইপারপারামিটার টিউনিংয়ের জন্য একটি ইভলিউশনাল কৌশল। এটি প্রাকৃতিক নির্বাচন বা প্রজনন প্রক্রিয়া অনুসরণ করে, যেখানে বিভিন্ন হাইপারপারামিটারগুলোকে মিউটেশন বা ক্রসওভার করে চূড়ান্ত সমাধানে পৌঁছানো হয়।
Automated Machine Learning (AutoML):
- AutoML এমন একটি প্রক্রিয়া যা মেশিন লার্নিং প্রক্রিয়াকে স্বয়ংক্রিয়ভাবে সম্পন্ন করে। এটি হাইপারপারামিটার টিউনিংয়ের জন্য একাধিক টেকনিক ব্যবহার করে এবং হাইপারপারামিটারগুলির অপটিমাইজেশনের জন্য সঠিক পদ্ধতি খুঁজে বের করে।

Hyperparameter Tuning এবং Optimization এ গুরুত্বপূর্ণ পদ্ধতি

RandomizedSearchCV: এটি Random Search এর একটি উন্নত সংস্করণ যা একাধিক প্যারামিটার এবং ডিস্ট্রিবিউশন থেকে এলোমেলোভাবে মান নির্বাচন করে।
Keras Tuner: Keras এ একটি powerful লাইব্রেরি যা আপনাকে সহজে হাইপারপারামিটার টিউনিং করতে সহায়ক। এটি Grid Search এবং Random Search এর চেয়ে আরো কার্যকরী হতে পারে।

Keras Tuner উদাহরণ

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from kerastuner import HyperModel, RandomSearch

# মডেল তৈরি করা
def build_model(hp):
    model = Sequential()
    model.add(Dense(units=hp.Int('units', min_value=32, max_value=512, step=32),
                    activation='relu',
                    input_shape=(X_train.shape[1],)))
    model.add(Dense(1, activation='sigmoid'))
    
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

# Hyperparameter search এর জন্য Keras Tuner ব্যবহার করা
tuner = RandomSearch(build_model,
                     objective='val_accuracy',
                     max_trials=5,
                     executions_per_trial=3,
                     directory='my_dir',
                     project_name='hyperparameter_tuning')

# মডেল প্রশিক্ষণ
tuner.search(X_train, y_train, epochs=10, validation_data=(X_val, y_val))

# সেরা হাইপারপারামিটার পেতে
best_model = tuner.get_best_models(num_models=1)[0]
best_hyperparameters = tuner.get_best_hyperparameters(num_trials=1)[0]

Optimization Techniques (অপটিমাইজেশন টেকনিক)

Gradient Descent:
- Gradient Descent হল একটি অপটিমাইজেশন পদ্ধতি যা মডেলটির লস ফাংশন কমানোর জন্য ব্যবহৃত হয়। এটি গ্র্যাডিয়েন্টের বিপরীত দিকে মুভ করে লস ফাংশনকে মিনিমাইজ করতে চেষ্টা করে।
- Stochastic Gradient Descent (SGD): এক একটি স্যাম্পলের জন্য গ্র্যাডিয়েন্ট ক্যালকুলেট করা হয়।
- Mini-Batch Gradient Descent: পুরো ডেটাসেটের পরিবর্তে কিছু ব্যাচের জন্য গ্র্যাডিয়েন্ট ক্যালকুলেট করা হয়, যাতে মডেল দ্রুত প্রশিক্ষিত হয়।
Adam Optimizer:
- Adam হল একটি জনপ্রিয় অপটিমাইজার যা ব্যাকগ্রাউন্ডে লার্নিং রেটের অটো অ্যাডজাস্টমেন্ট করে এবং প্রশিক্ষণের সময় অনেক দ্রুত কনভার্জেন্স অর্জন করতে সাহায্য করে। এটি ব্যাচের জন্য গ্র্যাডিয়েন্ট এবং তার দ্বিতীয় মন্টের মধ্যে সম্পর্ক ব্যবহার করে।
Learning Rate Schedulers:
- একটি Learning Rate Scheduler ব্যবহৃত হয় যাতে প্রশিক্ষণের সময় লার্নিং রেট পরিবর্তিত হয়। এটি মডেলের প্রশিক্ষণের গতি নিয়ন্ত্রণ করতে সহায়ক।
Regularization:
- L1/L2 Regularization মডেলকে overfitting থেকে রক্ষা করতে ব্যবহৃত হয়। Regularization মডেলটির প্যারামিটার গুলির ওপর শাস্তি আরোপ করে, যাতে মডেলটি খুব বেশি জটিল না হয়ে যায়।

সারাংশ

Hyperparameter Tuning এবং Optimization হল মডেল তৈরির গুরুত্বপূর্ণ প্রক্রিয়া যা মডেলের পারফরম্যান্স বৃদ্ধি করতে সহায়ক। বিভিন্ন পদ্ধতি যেমন Grid Search, Random Search, Bayesian Optimization, এবং Keras Tuner ব্যবহৃত হয় হাইপারপারামিটার টিউনিং করার জন্য। অপটিমাইজেশন কৌশল যেমন Gradient Descent, Adam, এবং Learning Rate Scheduling মডেলের প্রশিক্ষণের সময় তার কার্যকারিতা এবং গতি বাড়াতে সহায়ক।

Content added By

Azizar Rahman Aziz

Hyperparameter কী এবং কেন গুরুত্বপূর্ণ?

600

Hyperparameter কী?

Hyperparameters হল এমন প্যারামিটার বা মান যা মডেল প্রশিক্ষণের আগে নির্ধারণ করতে হয় এবং এগুলির সাহায্যে মডেলের আচরণ বা কর্মক্ষমতা নিয়ন্ত্রণ করা হয়। এগুলি মডেলের ট্রেনিং প্রক্রিয়া চলাকালীন পরিবর্তন হয় না এবং সাধারণত ম্যানুয়ালি সেট করা হয়।

মডেল প্রশিক্ষণ করা হলে, কিছু প্যারামিটার থাকে যা মডেল নিজে শিখে নেয় (যেমন ওজন এবং বায়াস), কিন্তু hyperparameters হল সেগুলি যা মডেল ডিজাইন করার সময় পূর্বনির্ধারিত করতে হয় এবং মডেল প্রশিক্ষণ শুরু হওয়ার আগে সেট করা হয়।

Hyperparameters এর উদাহরণ

Learning Rate:
- এটি সেই মান যা নির্দেশ করে মডেলটি প্রতি আপডেটে কতটা পরিবর্তন হবে। অত্যধিক উচ্চ learning rate মডেলকে অপ্রতিরোধ্য বা অতিরিক্ত পরিবর্তন করতে বাধ্য করতে পারে, যা প্রশিক্ষণকে অস্থিতিশীল করে তুলতে পারে। খুব কম learning rate প্রশিক্ষণের সময় বাড়িয়ে দিতে পারে।
Batch Size:
- এটি প্রতিটি আপডেটের জন্য কতটি ডেটা পয়েন্ট মডেল একসাথে প্রক্রিয়া করবে তা নির্দেশ করে। ছোট batch size সাধারণত উচ্চ মেমরি ব্যবহার করে এবং প্রশিক্ষণের সময় কমাতে পারে, কিন্তু একাধিক batch বা larger batch size প্রশিক্ষণ গতি বাড়াতে সহায়ক।
Epochs:
- এটি কতবার মডেলটি ডেটাসেটটি দেখে এবং প্রশিক্ষণ নিবে। অধিক epochs ব্যবহারে মডেলটির accuracy বাড়তে পারে, তবে এটি overfitting (মডেলটি প্রশিক্ষণ ডেটার প্রতি খুব বেশি অভিযোজিত হয়ে যায়) এর কারণও হতে পারে।
Number of Hidden Layers:
- মডেলের মধ্যে কতগুলি হিডেন লেয়ার থাকবে (যেমন নিউরাল নেটওয়ার্কের হিডেন লেয়ার)। বেশি লেয়ার মডেলকে আরও জটিল এবং শক্তিশালী করতে পারে, কিন্তু এর ফলে প্রশিক্ষণ সময়ও বাড়ে।
Number of Units in Each Layer:
- প্রতিটি লেয়ারে কতটি ইউনিট থাকবে তা নির্ধারণ করা। বেশি ইউনিট মডেলকে আরও ক্ষমতাশালী এবং সক্ষম করে তুলতে পারে, কিন্তু এটি প্রশিক্ষণের সময় এবং কম্পিউটেশনাল খরচ বাড়ায়।
Regularization Parameters:
- যেমন Dropout Rate বা L2 Regularization, যা মডেলটি overfitting থেকে রক্ষা করতে সাহায্য করে। Dropout প্যারামিটার মডেলের মধ্যে কিছু নির্দিষ্ট ইউনিটের সাথে কাজ না করতে দেয় প্রশিক্ষণের সময়, যা overfitting রোধে সহায়ক।
Activation Function:
- কোন activation function ব্যবহার করা হবে তা নির্ধারণ করা, যেমন ReLU, Sigmoid, Tanh, ইত্যাদি।
Momentum:
- এটি optimization প্রক্রিয়ার অংশ, যা মডেলকে গতিশীলভাবে converge করতে সহায়ক। এটি পূর্ববর্তী আপডেটের সাথে গতি বা ত্বরান্বিত কাজ প্রদান করে।

Hyperparameters কেন গুরুত্বপূর্ণ?

মডেলের পারফরম্যান্স নিয়ন্ত্রণ:
- Hyperparameters মডেলের কার্যকারিতা বা কর্মক্ষমতা নির্ধারণে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। যেমন, learning rate যথাযথভাবে নির্বাচন করা না হলে মডেল প্রশিক্ষণ অসম্পূর্ণ হতে পারে বা খুব ধীরে এগিয়ে যেতে পারে। সঠিক hyperparameters মডেলের সঠিকতার উন্নতি করতে সহায়ক।
Overfitting এবং Underfitting রোধে সহায়তা:
- Hyperparameters সঠিকভাবে সেট করা মডেলটিকে overfitting বা underfitting এড়িয়ে যেতে সাহায্য করে। উদাহরণস্বরূপ, যদি batch size খুব ছোট হয় বা epochs খুব বেশি হয়, তবে মডেলটি training data এ অতিরিক্ত অভিযোজিত হতে পারে, যা overfitting এর দিকে নিয়ে যায়।
প্রশিক্ষণ সময় এবং কম্পিউটেশনাল খরচ নিয়ন্ত্রণ:
- Hyperparameters যেমন batch size এবং epochs প্রশিক্ষণের সময় নির্ধারণে ভূমিকা রাখে। সঠিক batch size এবং epochs নির্বাচন প্রশিক্ষণের সময় কমিয়ে দেয় এবং কম্পিউটেশনাল খরচও নিয়ন্ত্রণ করে।
মডেলকে আরও জটিল বা সহজ করা:
- Hyperparameters যেমন hidden layers এবং number of units মডেলটির জটিলতা নিয়ন্ত্রণ করে। বেশি লেয়ার এবং ইউনিট মডেলকে শক্তিশালী করে, তবে প্রশিক্ষণের সময়ও বাড়িয়ে দেয়।
মডেলের জেনারেলাইজেশন ক্ষমতা:
- সঠিক regularization hyperparameters যেমন dropout rate বা L2 regularization মডেলকে overfitting থেকে রক্ষা করতে সাহায্য করে, যা মডেলের generalization ক্ষমতা উন্নত করতে সহায়ক। সঠিক regularization প্যারামিটার ব্যবহারে মডেলটি নতুন ডেটার উপর ভালো পারফর্ম করতে পারে।

Hyperparameter Tuning

Hyperparameter tuning হল সেই প্রক্রিয়া যার মাধ্যমে মডেলের জন্য সেরা hyperparameters নির্বাচন করা হয়। এটি সাধারণত Grid Search বা Random Search পদ্ধতি ব্যবহার করে করা হয়:

Grid Search:
- এটি একটি পদ্ধতি যেখানে আপনি সম্ভাব্য সব hyperparameters এর একাধিক মান পরীক্ষা করেন এবং যে সেটটি সর্বোচ্চ accuracy দেয় সেটি নির্বাচন করেন।
Random Search:
- Grid Search এর তুলনায় এটি আরও দ্রুত পদ্ধতি। এখানে আপনি hyperparameters এর মধ্যে কিছু র্যান্ডম কম্বিনেশন নির্বাচন করেন এবং পরীক্ষা করেন।
Bayesian Optimization:
- এটি একটি পরিসংখ্যানিক পদ্ধতি, যা optimal hyperparameter নির্বাচন করতে পরবর্তী সম্ভাব্য মান পূর্ববর্তী পরীক্ষার ফলাফলের উপর ভিত্তি করে নির্বাচন করে।

Hyperparameter Tuning এর উদাহরণ (Keras)

Keras এবং TensorFlow এর সাথে Hyperparameter Tuning করার জন্য Keras Tuner লাইব্রেরি ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, learning rate এবং batch size এর জন্য tuning করার জন্য কোড হতে পারে:

from tensorflow.keras import layers, models
from kerastuner import HyperModel
from kerastuner.tuners import RandomSearch

class MyHyperModel(HyperModel):
    def build(self, hp):
        model = models.Sequential()
        model.add(layers.Dense(64, activation='relu', input_shape=(X_train.shape[1],)))
        model.add(layers.Dense(32, activation='relu'))
        model.add(layers.Dense(1, activation='sigmoid'))
        
        model.compile(optimizer=hp.Choice('optimizer', ['adam', 'sgd']),
                      loss='binary_crossentropy',
                      metrics=['accuracy'])
        return model

# Hyperparameter tuning
tuner = RandomSearch(MyHyperModel(),
                     objective='val_accuracy',
                     max_trials=5,
                     executions_per_trial=3,
                     directory='my_dir',
                     project_name='hyperparameter_tuning')

tuner.search(X_train, y_train, epochs=10, validation_data=(X_val, y_val))

সারাংশ

Hyperparameters হল সেই প্যারামিটার যা মডেল প্রশিক্ষণের আগে নির্ধারণ করতে হয় এবং এগুলি মডেলের কার্যকারিতা এবং প্রশিক্ষণের গতি নিয়ন্ত্রণ করে।
Hyperparameters যেমন learning rate, batch size, epochs, hidden layers এবং activation functions মডেলের পারফরম্যান্সের উপর বড় প্রভাব ফেলে।
সঠিক hyperparameters নির্বাচন করলে মডেলটি ভাল পারফর্ম করতে পারে এবং কম সময় এবং কম্পিউটেশনাল শক্তি খরচ করতে সাহায্য করে।
Hyperparameter tuning এর মাধ্যমে সবচেয়ে উপযুক্ত hyperparameters নির্বাচন করা হয়, যা মডেলের accuracy এবং generalization ক্ষমতা বাড়ায়।

Content added By

Azizar Rahman Aziz

Learning Rate, Batch Size, এবং Epoch কনফিগারেশন

402

মডেল প্রশিক্ষণের সময় Learning Rate, Batch Size, এবং Epoch হল তিনটি গুরুত্বপূর্ণ প্যারামিটার যা মডেলের কার্যকারিতা, প্রশিক্ষণ সময় এবং সাধারণীকরণের ক্ষমতাকে প্রভাবিত করে।

১. Learning Rate (লার্নিং রেট)

Learning Rate (LR) হল সেই প্যারামিটার যা প্রতি ইটারেশন বা আপডেটে প্যারামিটার (ওজন) আপডেট করার গতি নিয়ন্ত্রণ করে। সহজভাবে বললে, এটি নির্ধারণ করে যে মডেলটি কত দ্রুত বা ধীরে শিখবে। খুব ছোট লার্নিং রেট মডেলকে ধীরে ধীরে শিখতে সাহায্য করে, কিন্তু অনেক সময় নিতে পারে। অপরদিকে, খুব বড় লার্নিং রেট মডেলকে শিখতে সমস্যায় ফেলতে পারে এবং convergence এ পৌঁছাতে পারে না।

সাধারণ কনফিগারেশন:

ছোট Learning Rate (যেমন 0.001): এটি সঠিক মানে পৌঁছাতে ধীর গতিতে কাজ করবে এবং সম্ভবত আরও নির্ভুল হতে পারে, তবে এটি অনেক সময় নেয়।
বড় Learning Rate (যেমন 0.1 বা 0.01): এটি দ্রুত কাজ করবে তবে কখনও কখনও সঠিক অবস্থানে পৌঁছাতে নাও পারে, কারণ এটি খুব দ্রুত আপডেট হয় এবং স্থানীয় মিনিমা মিস করতে পারে।

Keras এ Learning Rate সেট করা:

from tensorflow.keras.optimizers import Adam

# লার্নিং রেট 0.001 দিয়ে Adam অপটিমাইজার সেট করা
optimizer = Adam(learning_rate=0.001)

model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])

২. Batch Size (ব্যাচ সাইজ)

Batch Size হল সেই সংখ্যক স্যাম্পল যা একবারে মডেলের মাধ্যমে প্রক্রিয়া করা হয়। এটি মডেলের প্রশিক্ষণের সময় ব্যবহৃত ডেটার একটি ছোট অংশ এবং একটি ব্যাচে প্রক্রিয়া করা হয়।

ছোট Batch Size: মডেল ধীর গতিতে শিখবে তবে এটি অধিক সাবলীল হতে পারে, এবং সাধারণত কম মেমরি ব্যবহার করে। এটি উচ্চ ভ্যারিয়েন্স এবং কিছু ক্ষেত্রে ভালো সাধারণীকরণের জন্য উপকারী হতে পারে।
বড় Batch Size: দ্রুত প্রশিক্ষণ সম্পন্ন হয়, তবে এটি অধিক মেমরি ব্যবহার করে এবং কিছুটা কম সাধারণীকরণ প্রভাবিত করতে পারে।

সাধারণ কনফিগারেশন:

ছোট Batch Size (যেমন 32, 64): এগুলি ছোট স্টেপে মডেলকে শিখতে সহায়ক এবং কখনও কখনও ভালো পারফরম্যান্স দিতে পারে।
বড় Batch Size (যেমন 128, 256): এটি কম্পিউটেশনাল গতি বাড়াতে সাহায্য করতে পারে এবং আরো স্টেবল ফলাফল দিতে পারে।

Keras এ Batch Size সেট করা:

model.fit(x_train, y_train, batch_size=64, epochs=10)

৩. Epoch (ইপোক)

Epoch হল মডেলটির প্রশিক্ষণ প্রক্রিয়ার পুরো ডেটাসেটের উপর কতবার প্রশিক্ষিত হবে তা নির্দেশ করে। এক্ষেত্রে, প্রতি epoch-এ ডেটাসেটের সম্পূর্ণ পরিমাণ একবার মডেলের মাধ্যমে প্রক্রিয়া করা হয়।

কম Epoch: মডেলটি যথেষ্ট শিখতে নাও পারে এবং প্রশিক্ষণের সময় আরও দীর্ঘ হতে পারে।
বেশি Epoch: মডেলটি ভালোভাবে শিখতে পারে তবে অনেক সময় অতিরিক্ত প্রশিক্ষণ এবং overfitting ঘটাতে পারে (যেখানে মডেল খুব ভালোভাবে ট্রেনিং ডেটা শিখে, কিন্তু নতুন ডেটাতে খারাপ পারফরম্যান্স দেয়)।

সাধারণ কনফিগারেশন:

কম Epoch (যেমন 5, 10): কম সময়ে মডেল প্রশিক্ষিত হয় তবে সঠিকভাবে শিখতে নাও পারে।
বেশি Epoch (যেমন 50, 100): মডেল আরো ভালোভাবে শিখতে পারে, তবে এটি অতিরিক্ত প্রশিক্ষণ এবং overfitting এর দিকে নিয়ে যেতে পারে।

Keras এ Epoch সেট করা:

model.fit(x_train, y_train, batch_size=64, epochs=20)

Learning Rate, Batch Size, এবং Epoch এর সম্পর্ক

Learning Rate এবং Batch Size একে অপরের সাথে সম্পর্কিত। বড় ব্যাচ সাইজের সাথে, আপনি সাধারণত বড় লার্নিং রেট ব্যবহার করতে পারেন। তবে ছোট ব্যাচ সাইজের সাথে ছোট লার্নিং রেট ব্যবহার করলে মডেল বেশি স্টেবল হতে পারে।
Epoch এর সংখ্যা বৃদ্ধি পাওয়ার সাথে সাথে আপনি দেখতে পারেন মডেলটির পারফরম্যান্স পরিমার্জিত হচ্ছে, তবে এটিও overfitting ঘটাতে পারে। তাই early stopping এর মত টেকনিক ব্যবহার করা গুরুত্বপূর্ণ, যাতে আপনি মডেলটি অতিরিক্ত প্রশিক্ষণ না দিতে পারেন।

কনফিগারেশন টিপস

Learning Rate Scheduling: মডেলটির প্রশিক্ষণের সময় লার্নিং রেট পরিবর্তন করার জন্য learning rate scheduler ব্যবহার করা যেতে পারে। যেমন, শুরুতে বড় লার্নিং রেট এবং তারপর ধীরে ধীরে সেটিকে ছোট করা।
Grid Search or Random Search: Hyperparameter optimization এর জন্য Grid Search বা Random Search পদ্ধতি ব্যবহার করতে পারেন। এতে বিভিন্ন learning rate, batch size, এবং epoch কনফিগারেশন পরীক্ষা করে সবচেয়ে ভালো ফলাফল খুঁজে পাওয়া যায়।

উদাহরণ

এখানে একটি পুরো কনফিগারেশন সেটিং সহ উদাহরণ দেওয়া হলো:

from tensorflow.keras.optimizers import Adam

# লার্নিং রেট, ব্যাচ সাইজ এবং ইপোক কনফিগারেশন
learning_rate = 0.001
batch_size = 64
epochs = 20

# Adam অপটিমাইজার ব্যবহার করে
optimizer = Adam(learning_rate=learning_rate)

# মডেল কম্পাইল করা
model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])

# মডেল প্রশিক্ষণ
model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_data=(x_test, y_test))

সারাংশ

Learning Rate: মডেলটি শিখতে কত দ্রুত বা ধীরে কাজ করবে তা নির্ধারণ করে।
Batch Size: প্রতি প্রশিক্ষণ সেশনে কতটি স্যাম্পল প্রক্রিয়া করা হবে তা নির্ধারণ করে।
Epoch: প্রশিক্ষণ প্রক্রিয়ায় কতবার পুরো ডেটাসেট মডেলের মাধ্যমে চলবে তা নির্ধারণ করে।

এই প্যারামিটারগুলির সঠিক কনফিগারেশন মডেল প্রশিক্ষণের গতি এবং কার্যকারিতাকে প্রভাবিত করে, এবং এগুলোর উপর সঠিকভাবে কাজ করার মাধ্যমে মডেলের পারফরম্যান্স বৃদ্ধি করা সম্ভব।

Content added By

Azizar Rahman Aziz

Grid Search এবং Random Search এর মাধ্যমে Hyperparameter Tuning

343

Hyperparameter tuning হল মডেলের পারফরম্যান্স বৃদ্ধি করার একটি গুরুত্বপূর্ণ প্রক্রিয়া, যেখানে মডেলের hyperparameters (যেমন, লার্নিং রেট, ব্যাচ সাইজ, ইত্যাদি) চিহ্নিত এবং অপটিমাইজ করা হয়। Grid Search এবং Random Search হল দুটি জনপ্রিয় পদ্ধতি যা Hyperparameter Tuning এর জন্য ব্যবহৃত হয়।

এখন, চলুন প্রতিটি পদ্ধতির মাধ্যমে Hyperparameter Tuning এর বিস্তারিত আলোচনা করা যাক।

১. Grid Search

Grid Search হল একটি exhaustive পদ্ধতি যেখানে একটি নির্দিষ্ট hyperparameter স্পেসের মধ্যে প্রতিটি সম্ভাব্য সমন্বয় পরীক্ষিত হয়। এটি সব সম্ভাব্য সংমিশ্রণ পর্যালোচনা করে, যাতে সর্বোচ্চ পারফরম্যান্স প্রদানকারী hyperparameters পাওয়া যায়।

Grid Search এর কাজ:

নির্দিষ্ট কিছু hyperparameters এবং তাদের সম্ভাব্য মানের একটি গ্রিড তৈরি করা হয়।
প্রতিটি সংমিশ্রণ ট্রেনিং এবং ভ্যালিডেশন ডেটাতে পরীক্ষা করা হয়।
সেরা ফলাফল দেওয়া hyperparameter সেট নির্বাচন করা হয়।

উদাহরণ: Keras মডেলে Grid Search ব্যবহার করা

ধরা যাক, আমরা Keras মডেলে GridSearchCV ব্যবহার করব। প্রথমে, আমরা একটি Keras মডেল তৈরি করবো এবং এরপর GridSearchCV এর মাধ্যমে hyperparameters টিউন করবো।

import tensorflow as tf
from tensorflow.keras import layers, models
from sklearn.model_selection import GridSearchCV
from tensorflow.keras.wrappers.scikit_learn import KerasClassifier

# মডেল তৈরি ফাংশন
def create_model(optimizer='adam', activation='relu'):
    model = models.Sequential()
    model.add(layers.Dense(64, activation=activation, input_dim=8))
    model.add(layers.Dense(64, activation=activation))
    model.add(layers.Dense(1, activation='sigmoid'))
    
    model.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=['accuracy'])
    
    return model

# KerasClassifier wrapper ব্যবহার করে মডেলটি স্কিকিট-লার্নের সাথে কাজ করতে তৈরি করা
model = KerasClassifier(build_fn=create_model, verbose=0)

# GridSearchCV এর মাধ্যমে hyperparameters টিউন করা
param_grid = {
    'optimizer': ['adam', 'sgd'],
    'activation': ['relu', 'tanh'],
    'batch_size': [32, 64],
    'epochs': [10, 20]
}

grid = GridSearchCV(estimator=model, param_grid=param_grid, cv=3)
grid_result = grid.fit(X_train, y_train)

# সেরা পারফরম্যান্স এবং সেরা hyperparameters দেখা
print(f"Best: {grid_result.best_score_} using {grid_result.best_params_}")

ব্যাখ্যা:

KerasClassifier: Keras মডেলকে স্কিকিট-লার্নের সাথে ইন্টিগ্রেট করতে ব্যবহার করা হয়।
param_grid: এখানে বিভিন্ন hyperparameter এর সম্ভাব্য মানের গ্রিড নির্ধারণ করা হয়েছে। GridSearchCV এই গ্রিডের মধ্যে সমস্ত সম্ভাবনা পরীক্ষা করবে।
cv=3: ক্রস ভ্যালিডেশন ফোল্ডস সংখ্যা ৩ নির্ধারণ করা হয়েছে, যা ৩টি ভিন্ন ভ্যালিডেশন সেট ব্যবহার করবে।

Grid Search এর সুবিধা:

পুরো hyperparameter স্পেস পরীক্ষা করা হয়, তাই সেরা hyperparameters পাওয়ার সম্ভাবনা বেশি।
সহজ এবং কার্যকরী পদ্ধতি যখন hyperparametersের সীমিত সংখ্যা থাকে।

Grid Search এর অসুবিধা:

সময়সাপেক্ষ এবং কম্পিউটেশনালভাবে ব্যয়বহুল যদি hyperparametersের সংখ্যার পরিমাণ বড় হয়।
শুধুমাত্র predefined গ্রিডের মধ্যে পরীক্ষা করা হয়, তাই অনেক সময় উপযুক্ত টিউনিং মিস হতে পারে।

২. Random Search

Random Search একটি প্রগ্রাম্যাটিক পদ্ধতি যেখানে মডেলের hyperparameters এর মধ্যে র‍্যান্ডম ভাবে কিছু সম্ভাব্য মান নির্বাচন করা হয়। এটি Grid Search এর তুলনায় কম কম্পিউটেশনাল খরচে অধিক কার্যকরী হতে পারে, কারণ এটি সমস্ত সম্ভাব্য সংমিশ্রণ পরীক্ষা না করে শুধুমাত্র কিছু সম্ভাব্য মান নির্বাচন করে।

Random Search এর কাজ:

hyperparameters এর মধ্যে নির্দিষ্ট মানের একটি র‍্যান্ডম সেট তৈরি করা হয়।
কিছু নির্দিষ্ট সংখ্যক সমন্বয় পরীক্ষা করা হয়।
সেরা ফলাফল দেয়া মান নির্বাচন করা হয়।

উদাহরণ: Keras মডেলে Random Search ব্যবহার করা

from sklearn.model_selection import RandomizedSearchCV
import numpy as np

# Hyperparameters এর জন্য র‍্যান্ডম স্পেস
param_dist = {
    'optimizer': ['adam', 'sgd'],
    'activation': ['relu', 'tanh'],
    'batch_size': [32, 64, 128],
    'epochs': [10, 20, 30]
}

# RandomizedSearchCV ব্যবহার করা
random_search = RandomizedSearchCV(estimator=model, param_distributions=param_dist, n_iter=10, cv=3)
random_search_result = random_search.fit(X_train, y_train)

# সেরা ফলাফল এবং সেরা hyperparameters দেখা
print(f"Best: {random_search_result.best_score_} using {random_search_result.best_params_}")

ব্যাখ্যা:

RandomizedSearchCV: Random Search এর জন্য স্কিকিট-লার্নের RandomizedSearchCV ব্যবহার করা হয়েছে। এখানে n_iter=10 মানে ১০টি র‍্যান্ডম সমন্বয় পরীক্ষা করা হবে।
param_dist: এটি বিভিন্ন hyperparameters এবং তাদের সম্ভাব্য মানের একটি র‍্যান্ডম সেট তৈরি করে।

Random Search এর সুবিধা:

Grid Search এর তুলনায় কম কম্পিউটেশনাল খরচ।
বড় hyperparameter স্পেসের জন্য দ্রুত ফলাফল দেয়।
এটি গ্রিডের বাইরে থাকা কিছু নতুন সমন্বয়ও পরীক্ষা করে।

Random Search এর অসুবিধা:

এটি সমস্ত সম্ভাব্য সমন্বয় পরীক্ষা করে না, তাই কিছু সময় সেরা ফলাফল মিস হতে পারে।

সারাংশ

Grid Search: এটি exhaustive এবং সব সমন্বয় পরীক্ষা করে, তবে অনেক সময় কম্পিউটেশনালভাবে ব্যয়বহুল হতে পারে। এটি ছোট hyperparameter স্পেসের জন্য উপযুক্ত।
Random Search: এটি কম্পিউটেশনালভাবে দ্রুত এবং কার্যকরী হতে পারে বড় স্পেসের জন্য, কারণ এটি কেবল কিছু র‍্যান্ডম সমন্বয় পরীক্ষা করে।

আপনি যদি ছোট hyperparameter স্পেস নিয়ে কাজ করেন এবং আপনার কাছে যথেষ্ট কম্পিউটেশনাল ক্ষমতা থাকে, তাহলে Grid Search একটি ভালো পছন্দ হতে পারে। তবে, যদি আপনি বড় স্পেসে কাজ করছেন এবং কম্পিউটেশনাল খরচ কমাতে চান, তাহলে Random Search আরো কার্যকরী হতে পারে।

Content added By

Azizar Rahman Aziz

Keras Tuner দিয়ে Hyperparameter Optimization

345

Keras Tuner হল একটি ওপেন সোর্স লাইব্রেরি যা মডেলের hyperparameter optimization বা hyperparameter tuning সহজ করে। এটি একটি অত্যন্ত কার্যকরী টুল, যা ডীপ লার্নিং মডেলের পারফরম্যান্স উন্নত করতে সহায়ক, বিশেষ করে যখন আপনি নির্দিষ্ট হাইপারপারামিটারগুলি যেমন লার্নিং রেট, ব্যাচ সাইজ, বা লেয়ারের সংখ্যা ইত্যাদি ঠিক করতে চান।

Hyperparameter optimization হল এমন একটি প্রক্রিয়া, যেখানে মডেলের পারফরম্যান্স সর্বোচ্চ করার জন্য উপযুক্ত হাইপারপারামিটারগুলো খুঁজে বের করা হয়। Keras Tuner এর মাধ্যমে এই প্রক্রিয়াটি খুব সহজেই করা যেতে পারে।

Keras Tuner এর ব্যবহার

Keras Tuner এর মাধ্যমে আপনি বিভিন্ন অপটিমাইজেশন কৌশল ব্যবহার করতে পারেন, যেমন Random Search, Hyperband, এবং Bayesian Optimization।

Keras Tuner Setup

প্রথমে Keras Tuner ইনস্টল করতে হবে:

pip install keras-tuner

১. Keras Tuner এর মাধ্যমে Hyperparameter Optimization এর স্টেপ

১.1. একটি মডেল তৈরি করা

Keras Tuner এ hyperparameter optimization করার জন্য একটি কাস্টম মডেল ফাংশন তৈরি করতে হয়, যেখানে আপনি হাইপারপারামিটারগুলোকে নির্দিষ্ট করে দেন।

ধরা যাক, একটি সিম্পল নিউরাল নেটওয়ার্ক মডেল তৈরি করছি:

import keras
from keras import layers
from keras.models import Sequential
from keras_tuner import HyperModel

class MyHyperModel(HyperModel):
    def build(self, hp):
        model = Sequential()
        
        # First hidden layer
        model.add(layers.Dense(
            units=hp.Int('units', min_value=32, max_value=512, step=32),
            activation='relu',
            input_shape=(x_train.shape[1],)
        ))

        # Second hidden layer
        model.add(layers.Dense(
            units=hp.Int('units_2', min_value=32, max_value=512, step=32),
            activation='relu'
        ))

        # Output layer
        model.add(layers.Dense(10, activation='softmax'))  # Assuming 10 output classes

        # Compile the model
        model.compile(
            optimizer=keras.optimizers.Adam(
                learning_rate=hp.Float('learning_rate', min_value=1e-5, max_value=1e-2, sampling='log')
            ),
            loss='categorical_crossentropy',
            metrics=['accuracy']
        )
        return model

এখানে hp.Int এবং hp.Float ব্যবহার করে আমরা বিভিন্ন হাইপারপারামিটার প্যারামিটারাইজ করেছি। units এবং learning_rate এর মতো হাইপারপারামিটারগুলো আমরা কাস্টমাইজ করেছি, যাতে আমাদের মডেলটি অপ্টিমাইজড হতে পারে।

১.2. Keras Tuner সেটআপ এবং হাইপারপারামিটার অনুসন্ধান

Keras Tuner এ Hyperband অথবা RandomSearch ব্যবহার করে আপনি হাইপারপারামিটার অনুসন্ধান চালাতে পারেন।

from keras_tuner import Hyperband

# Create tuner
tuner = Hyperband(
    MyHyperModel(),
    objective='val_accuracy',
    max_epochs=10,
    factor=3,
    directory='my_dir',
    project_name='hyperparameter_tuning'
)

# Search for the best hyperparameters
tuner.search(x_train, y_train, epochs=10, validation_data=(x_val, y_val))

objective: এখানে 'val_accuracy' ব্যবহার করা হয়েছে, কারণ আমরা ভ্যালিডেশন একুরেসি অপটিমাইজ করতে চাই।
max_epochs: ট্রেনিংয়ের জন্য মোট ইপোকসের সংখ্যা।
factor: এই প্যারামিটারটি ব্যবহার করে Hyperband এর দ্রুততা নিয়ন্ত্রণ করা হয়।

১.3. সেরা হাইপারপারামিটারগুলো পেতে

টিউনিং শেষ হওয়ার পর, আপনি সেরা হাইপারপারামিটারগুলো পেতে পারেন:

best_hps = tuner.get_best_hyperparameters(num_trials=1)[0]
print(f'Best learning rate: {best_hps.get("learning_rate")}')
print(f'Best units: {best_hps.get("units")}')

এতে আপনি সেরা learning rate এবং units এর মান দেখতে পাবেন যা মডেলের জন্য সবচেয়ে ভালো কাজ করেছে।

১.4. সেরা মডেলটি ট্রেনিং করা

একবার সেরা হাইপারপারামিটার পেলে, আপনি সেগুলো দিয়ে নতুন মডেল তৈরি এবং প্রশিক্ষণ দিতে পারেন:

# Build the model with the best hyperparameters
model = tuner.hypermodel.build(best_hps)

# Train the model
model.fit(x_train, y_train, epochs=10, validation_data=(x_val, y_val))

এখানে, tuner.hypermodel.build(best_hps) ব্যবহার করা হয়েছে, যাতে সেরা হাইপারপারামিটার ব্যবহার করে মডেলটি তৈরি করা হয়।

২. অন্যান্য কৌশল: RandomSearch, Bayesian Optimization

২.1. Random Search

Random Search হল একটি সহজ পদ্ধতি যেখানে র্যান্ডমভাবে বিভিন্ন হাইপারপারামিটার সংমিশ্রণ চেষ্টা করা হয়।

from keras_tuner import RandomSearch

tuner = RandomSearch(
    MyHyperModel(),
    objective='val_accuracy',
    max_trials=5,
    executions_per_trial=3,
    directory='my_dir',
    project_name='random_search_tuning'
)

২.2. Bayesian Optimization

Bayesian Optimization কৌশলটি অধিক স্মার্ট, কারণ এটি পূর্ববর্তী ট্রায়াল থেকে শিখে পরবর্তী ট্রায়ালকে অপ্টিমাইজ করে।

from keras_tuner import BayesianOptimization

tuner = BayesianOptimization(
    MyHyperModel(),
    objective='val_accuracy',
    max_trials=5,
    directory='my_dir',
    project_name='bayesian_optimization_tuning'
)

সারাংশ

Keras Tuner দিয়ে hyperparameter optimization ডীপ লার্নিং মডেলের পারফরম্যান্স উন্নত করতে খুবই কার্যকরী টুল। এতে Hyperband, RandomSearch, এবং Bayesian Optimization কৌশল ব্যবহার করে আপনি বিভিন্ন হাইপারপারামিটার পরীক্ষা করে সেরা মডেল তৈরি করতে পারেন। Keras Tuner ব্যবহার করা খুবই সহজ এবং এটি মডেল ট্রেনিং সময় খুবই সাহায্যকারী।

Content added By

Azizar Rahman Aziz

Deep Learning এবং Keras এর পরিচিতি Keras ইনস্টলেশন এবং সেটআপ Keras এর মৌলিক ধারণা Keras তে বেসিক Neural Network তৈরি Data Preprocessing এবং Augmentation

Hyperparameter Tuning এবং Optimization

Hyperparameter Tuning (হাইপারপারামিটার টিউনিং)

Hyperparameter Tuning এর উদ্দেশ্য

Hyperparameter Tuning Methods (হাইপারপারামিটার টিউনিং পদ্ধতি)

Hyperparameter Tuning এবং Optimization এ গুরুত্বপূর্ণ পদ্ধতি

Keras Tuner উদাহরণ

Optimization Techniques (অপটিমাইজেশন টেকনিক)

সারাংশ

Hyperparameter কী এবং কেন গুরুত্বপূর্ণ?

Hyperparameter কী?

Hyperparameters এর উদাহরণ

Hyperparameters কেন গুরুত্বপূর্ণ?

Hyperparameter Tuning

Hyperparameter Tuning এর উদাহরণ (Keras)

সারাংশ

Learning Rate, Batch Size, এবং Epoch কনফিগারেশন

১. Learning Rate (লার্নিং রেট)

সাধারণ কনফিগারেশন:

Keras এ Learning Rate সেট করা:

২. Batch Size (ব্যাচ সাইজ)

সাধারণ কনফিগারেশন:

Keras এ Batch Size সেট করা:

৩. Epoch (ইপোক)

সাধারণ কনফিগারেশন:

Keras এ Epoch সেট করা:

Learning Rate, Batch Size, এবং Epoch এর সম্পর্ক

কনফিগারেশন টিপস

উদাহরণ

সারাংশ

Grid Search এবং Random Search এর মাধ্যমে Hyperparameter Tuning

১. Grid Search

Grid Search এর কাজ:

উদাহরণ: Keras মডেলে Grid Search ব্যবহার করা

ব্যাখ্যা:

Grid Search এর সুবিধা:

Grid Search এর অসুবিধা:

২. Random Search

Random Search এর কাজ:

উদাহরণ: Keras মডেলে Random Search ব্যবহার করা

ব্যাখ্যা:

Random Search এর সুবিধা:

Random Search এর অসুবিধা:

সারাংশ

Keras Tuner দিয়ে Hyperparameter Optimization

Keras Tuner এর ব্যবহার

Keras Tuner Setup

১. Keras Tuner এর মাধ্যমে Hyperparameter Optimization এর স্টেপ

১.1. একটি মডেল তৈরি করা

১.2. Keras Tuner সেটআপ এবং হাইপারপারামিটার অনুসন্ধান

১.3. সেরা হাইপারপারামিটারগুলো পেতে

১.4. সেরা মডেলটি ট্রেনিং করা

২. অন্যান্য কৌশল: RandomSearch, Bayesian Optimization

২.1. Random Search

২.2. Bayesian Optimization

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!