Learning Rate, Batch Size, এবং Epoch কনফিগার করা

Hyperparameter Tuning এবং Optimization - ক্যাফে২ (Caffe2) - Machine Learning

400

Caffe2 বা যেকোনো মেশিন লার্নিং ফ্রেমওয়ার্কে, Learning Rate, Batch Size, এবং Epoch কনফিগার করা খুবই গুরুত্বপূর্ণ কারণ এগুলো মডেল ট্রেনিং প্রক্রিয়ার পারফরম্যান্স এবং সফলতা নির্ধারণ করে। নিচে Caffe2 তে এই প্যারামিটারগুলো কিভাবে কনফিগার করা যায় তা ব্যাখ্যা করা হলো।

১. Learning Rate কনফিগার করা

Learning Rate হল একটি প্যারামিটার যা মডেল ট্রেনিংয়ের সময় প্রতি স্টেপে প্যারামিটার আপডেটের আকার নির্ধারণ করে। এটি অত্যন্ত গুরুত্বপূর্ণ, কারণ খুব বেশি learning rate মডেলকে সঠিক পথে নিয়ে যেতে পারে না, আর খুব কম learning rate ট্রেনিং প্রক্রিয়া ধীর করতে পারে।

Caffe2 তে learning rate কনফিগার করার জন্য, আপনাকে সাধারণত optimizer এর মধ্যে এটি সেট করতে হবে। উদাহরণস্বরূপ, SGD (Stochastic Gradient Descent) অপটিমাইজারের জন্য এটি কিভাবে কনফিগার করা হয় তা নিচে দেখানো হলো।

Learning Rate কনফিগার করার কোড উদাহরণ:

from caffe2.python import workspace, model_lib, core
import numpy as np

# Hyperparameters
learning_rate = 0.001  # Set learning rate
batch_size = 32  # Set batch size
epochs = 10  # Set the number of epochs

# Model Initialization
model = model_lib.ResNet50()

# Learning rate scheduler
optimizer = core.CreateOperator(
    "SGD", 
    ["param", "learning_rate"], 
    ["param_out"]
)

# Set the learning rate in the workspace
workspace.FeedBlob("learning_rate", np.array([learning_rate], dtype=np.float32))

# Run training with set learning rate
for epoch in range(epochs):
    # training loop
    workspace.RunNetOnce(model.param_init_net)
    workspace.RunNetOnce(model.net)

    # Here we can print the loss or accuracy for each epoch
    print(f"Epoch {epoch + 1}/{epochs} completed.")

এখানে, learning_rate কনফিগার করা হয়েছে 0.001 এবং এটি SGD অপটিমাইজারে ব্যবহার করা হয়েছে।

২. Batch Size কনফিগার করা

Batch Size হল কতটি ডেটা পয়েন্ট একসাথে প্রসেস করা হবে প্রতিটি iteration এ। এটি মেমরি ব্যবহারের উপর প্রভাব ফেলে এবং মডেল ট্রেনিংয়ের গতিকে নির্ধারণ করে। ছোট batch size ডেটাকে দ্রুত প্রসেস করে কিন্তু বেশি আপডেট তৈরি করতে পারে, আর বড় batch size ধীর গতিতে কাজ করে তবে ট্রেনিং পরিসংখ্যান আরো সঠিক হতে পারে।

Batch Size কনফিগার করার কোড উদাহরণ:

# Hyperparameters
batch_size = 32  # Set batch size

# Model Data Input
input_data = np.random.randn(batch_size, 3, 224, 224).astype(np.float32)  # Example input data for batch size of 32

# Feed the data to the model
workspace.FeedBlob("data", input_data)

# Run training for the current batch
workspace.RunNetOnce(model.param_init_net)
workspace.RunNetOnce(model.net)

এখানে, batch_size সেট করা হয়েছে 32 এবং প্রতি ব্যাচে 32টি ডেটা পয়েন্ট প্রসেস করা হচ্ছে।

৩. Epoch কনফিগার করা

Epoch হল ট্রেনিংয়ের কতবার পুরো ডেটাসেট মডেলের মাধ্যমে প্রক্রিয়া করা হবে। একটি epoch এর মধ্যে সমস্ত ট্রেনিং ডেটা একবার পাস হয়ে যায়। বেশি epochs ব্যবহার করলে মডেল আরও ভালভাবে ট্রেনিং হতে পারে, তবে অনেক বেশি epochs মডেলের ওভারফিটিং (Overfitting) ঘটাতে পারে।

Epoch কনফিগার করার কোড উদাহরণ:

# Hyperparameters
epochs = 10  # Set number of epochs

# Training loop for multiple epochs
for epoch in range(epochs):
    print(f"Starting epoch {epoch + 1}/{epochs}")
    
    # Training on the current epoch
    workspace.RunNetOnce(model.param_init_net)
    workspace.RunNetOnce(model.net)
    
    # After each epoch, print loss or accuracy if needed
    print(f"Epoch {epoch + 1} completed.")

এখানে, মডেলটি 10টি epoch এর জন্য ট্রেনিং হবে এবং প্রতিটি epoch এ মডেলকে পুনরায় ডেটাসেটের উপর ট্রেনিং করা হবে।

৪. Learning Rate, Batch Size, এবং Epoch কনফিগার করার টিপস:

Learning Rate:
- যদি মডেল ট্রেনিং ধীর হয়ে যায়, তাহলে আপনি learning rate বাড়াতে পারেন।
- যদি মডেল ট্রেনিং সময়মত সঠিক জায়গায় পৌঁছাতে না পারে, তাহলে learning rate কমিয়ে দিতে পারেন।
Batch Size:
- ছোট batch size (যেমন 16 বা 32) ব্যবহার করলে মেমরি কম লাগে এবং মডেল দ্রুত ট্রেনিং হতে পারে, তবে বেশি noisy গ্রেডিয়েন্ট তৈরি হতে পারে।
- বড় batch size (যেমন 64 বা 128) সঠিক গ্রেডিয়েন্টের সাথে ট্রেনিং করতে পারে তবে মেমরি বেশি ব্যবহার করবে।
Epoch:
- অধিক epochs ট্রেনিং সময় বাড়াবে, তবে মডেল আরও ভালভাবে ট্রেন হবে।
- কম epochs দ্রুত ট্রেনিং করতে পারে কিন্তু মডেলটি পরিপূর্ণভাবে শিখতে নাও পারে।

5. Hyperparameter Tuning:

Learning rate, batch size, এবং epoch এর মান নির্ধারণে সাধারণত hyperparameter tuning করা হয়। বিভিন্ন মানের জন্য একাধিক ট্রায়াল চালিয়ে কোন মানগুলি সেরা পারফরম্যান্স দেয় তা নির্ধারণ করা হয়।

সারাংশ:

Learning Rate: এটি মডেল আপডেটের গতি নির্ধারণ করে এবং এটি অপটিমাইজারের মধ্যে কনফিগার করতে হয়।
Batch Size: এটি প্রতি iteration এ কত ডেটা প্রসেস করা হবে তা নির্ধারণ করে এবং এটি মেমরি ব্যবহারে প্রভাব ফেলে।
Epoch: এটি পুরো ডেটাসেট কতবার মডেলটি পাস করবে তা নির্ধারণ করে এবং এটি মডেল ট্রেনিংয়ের পরিমাণের সাথে সম্পর্কিত।

Caffe2 এ এই প্যারামিটারগুলো সঠিকভাবে কনফিগার করা ট্রেনিং পারফরম্যান্স এবং সঠিকতা অর্জন করতে সহায়ক।

Content added By

Azizar Rahman Aziz

Hyperparameter Tuning কী এবং কেন গুরুত্বপূর্ণ? Grid Search এবং Random Search ব্যবহার করে Hyperparameter Tuning Hyperparameter Optimization Techniques

Learning Rate, Batch Size, এবং Epoch কনফিগার করা

১. Learning Rate কনফিগার করা

Learning Rate কনফিগার করার কোড উদাহরণ:

২. Batch Size কনফিগার করা

Batch Size কনফিগার করার কোড উদাহরণ:

৩. Epoch কনফিগার করা

Epoch কনফিগার করার কোড উদাহরণ:

৪. Learning Rate, Batch Size, এবং Epoch কনফিগার করার টিপস:

5. Hyperparameter Tuning:

সারাংশ:

Promotion

Satt AI

Hi, আমি SATT AI!

Learning Rate, Batch Size, এবং Epoch কনফিগার করা

১. Learning Rate কনফিগার করা

Learning Rate কনফিগার করার কোড উদাহরণ:

২. Batch Size কনফিগার করা

Batch Size কনফিগার করার কোড উদাহরণ:

৩. Epoch কনফিগার করা

Epoch কনফিগার করার কোড উদাহরণ:

৪. Learning Rate, Batch Size, এবং Epoch কনফিগার করার টিপস:

5. Hyperparameter Tuning:

সারাংশ:

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!