PyTorch এর Advanced Topics

Machine Learning - পাইটর্চ (Pytorch)

212

PyTorch একটি শক্তিশালী এবং নমনীয় লাইব্রেরি যা ডিপ লার্নিং এবং মেশিন লার্নিংয়ের জন্য ব্যবহৃত হয়। এটি একাধিক Advanced Topics (উন্নত বিষয়) প্রদান করে যা গবেষণায় এবং উৎপাদনে ব্যবহারযোগ্য। এই বিষয়গুলো পেশাদার ডিপ লার্নিং প্রোগ্রামারদের জন্য অত্যন্ত গুরুত্বপূর্ণ। নিচে PyTorch এর কিছু গুরুত্বপূর্ণ Advanced Topics এর বর্ণনা দেওয়া হলো।

১. Transfer Learning

Transfer Learning হল এমন একটি কৌশল যেখানে একটি পূর্ব প্রশিক্ষিত মডেলকে ব্যবহার করা হয় এবং সেই মডেলটি নতুন টাস্কে ফাইন টিউন করা হয়। এটি ডিপ লার্নিং মডেল ট্রেনিংয়ের সময় খুবই উপকারী কারণ এটি প্রশিক্ষণ ডেটাসেটের আকার ছোট করে এবং ট্রেনিংয়ের সময় কমিয়ে আনে।

PyTorch-এ Transfer Learning:

একটি পূর্ব প্রশিক্ষিত মডেল (যেমন ResNet, VGG, Inception) লোড করা হয়।
আউটপুট লেয়ার পরিবর্তন করা হয় যাতে এটি নতুন টাস্কের জন্য কাজ করে (যেমন, 10 ক্লাসের জন্য ফাইন টিউনিং)।
কিছু লেয়ার ফ্রীজ করা হয়, অর্থাৎ, তাদের ওজন আপডেট করা হয় না, আর কিছু লেয়ার প্রশিক্ষণ করা হয়।

import torch
import torch.nn as nn
import torchvision.models as models

# পূর্ব প্রশিক্ষিত মডেল লোড করা
model = models.resnet18(pretrained=True)

# মডেলের আউটপুট লেয়ার পরিবর্তন করা
model.fc = nn.Linear(model.fc.in_features, 10)  # 10 ক্লাসের জন্য

# অপটিমাইজার তৈরি
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# প্রশিক্ষণ শুরু
model.train()

২. Custom Loss Functions

PyTorch আপনাকে Custom Loss Functions তৈরি করার সুযোগ দেয়। এটি বিশেষ করে বিভিন্ন প্রকারের ডিপ লার্নিং অ্যাপ্লিকেশনে দরকার, যেমন semantic segmentation, object detection, বা GANs।

Custom Loss Function উদাহরণ:

import torch

class CustomLoss(nn.Module):
    def __init__(self):
        super(CustomLoss, self).__init__()

    def forward(self, output, target):
        loss = torch.sum((output - target) ** 2)
        return loss

# মডেল এবং লস ফাংশন
model = MyModel()
criterion = CustomLoss()

# মডেল প্রশিক্ষণ
output = model(input)
loss = criterion(output, target)
loss.backward()

৩. Gradient Clipping

Gradient Clipping হল একটি কৌশল যা গ্র্যাডিয়েন্ট ডেসেন্টের সময় অত্যাধিক বড় গ্র্যাডিয়েন্টের কারণে exploding gradients সমস্যা এড়াতে সাহায্য করে। এটি বিশেষত RNN বা LSTM মডেলে ব্যবহৃত হয়, যেখানে দীর্ঘ সিকুয়েন্সের জন্য গ্র্যাডিয়েন্ট বেড়ে যেতে পারে।

PyTorch-এ Gradient Clipping:

import torch

# Gradient clipping
torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

# প্রশিক্ষণ চালানো
optimizer.step()

৪. Dynamic Computation Graph

PyTorch এ Dynamic Computational Graph ব্যবহৃত হয়, যার মানে হল যে গ্রাফটি রানটাইমে তৈরি হয়, আর যখনই কোড পরিবর্তন হয়, তখন গ্রাফও পরিবর্তিত হয়। এটি autograd ব্যবহারের মাধ্যমে সহজে করা হয়, যেখানে মডেল ট্রেনিংয়ের সময় গ্রেডিয়েন্টগুলো ক্যালকুলেট হয়।

Dynamic Graph Example:

import torch

# ডায়নামিক গ্রাফ তৈরি
x = torch.randn(5, 5, requires_grad=True)
y = x + 2
z = y * y
z.backward(torch.ones_like(z))
print(x.grad)  # গ্র্যাডিয়েন্ট দেখানো

৫. Distributed Training

ডিস্ট্রিবিউটেড ট্রেনিং মডেলটি বড় স্কেল ডেটা এবং বড় মডেলগুলির জন্য ব্যবহৃত হয়। PyTorch এ torch.nn.DataParallel এবং torch.distributed ব্যবহৃত হয়। এই কৌশলটি মডেলটি একাধিক GPU তে সমান্তরালে ট্রেন করতে সক্ষম করে।

PyTorch Distributed Training Example:

import torch
import torch.nn as nn
import torch.distributed as dist

# ডিসট্রিবিউটেড ট্রেনিং সেটআপ
dist.init_process_group(backend='nccl')

# মডেল তৈরি
model = nn.Linear(10, 10).to('cuda')

# DataParallel ব্যবহার করা
model = nn.DataParallel(model)

# প্রশিক্ষণ
model.train()

৬. Reinforcement Learning with PyTorch

Reinforcement Learning (RL) হল একটি মেশিন লার্নিং কৌশল যেখানে এজেন্ট পরিবেশের সাথে ইন্টারঅ্যাক্ট করে এবং পুরস্কার বা শাস্তির মাধ্যমে শিখে। PyTorch ব্যবহার করে RL মডেল তৈরি এবং প্রশিক্ষণ করা যায়। Q-learning এবং Deep Q-Network (DQN) RL-এর জনপ্রিয় অ্যাপ্লিকেশন।

PyTorch-এ Reinforcement Learning Example (DQN):

import torch
import torch.nn as nn
import torch.optim as optim

# নিউরাল নেটওয়ার্ক মডেল
class DQN(nn.Module):
    def __init__(self):
        super(DQN, self).__init__()
        self.fc1 = nn.Linear(4, 128)
        self.fc2 = nn.Linear(128, 2)  # 2 actions
    
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        return self.fc2(x)

# মডেল এবং অপটিমাইজার
model = DQN()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# মডেল ট্রেনিং
state = torch.randn(4)  # উদাহরণ স্টেট
output = model(state)

৭. Attention Mechanisms and Transformers

Attention Mechanism এবং Transformers হল আধুনিক ডিপ লার্নিং আর্কিটেকচার যা মূলত Natural Language Processing (NLP) এবং Sequence-to-Sequence টাস্কে ব্যবহৃত হয়। PyTorch এ transformers লাইব্রেরি ব্যবহার করে আপনি বিভিন্ন ট্রান্সফর্মার মডেল যেমন BERT, GPT-3 ইত্যাদি ব্যবহার করতে পারেন।

Transformer Example:

import torch
import torch.nn as nn
import torch.optim as optim

# Transformer মডেল
class TransformerModel(nn.Module):
    def __init__(self):
        super(TransformerModel, self).__init__()
        self.transformer = nn.Transformer()

    def forward(self, src, tgt):
        return self.transformer(src, tgt)

# মডেল ইনস্ট্যান্স তৈরি
model = TransformerModel()

# ট্রেনিং শুরু করা
src = torch.randn(10, 32)  # 10 সিকুয়েন্স লম্বা, 32 ব্যাচ সাইজ
tgt = torch.randn(10, 32)
output = model(src, tgt)

৮. Optimizers and Learning Rate Schedulers

ডিপ লার্নিং মডেল প্রশিক্ষণের সময়, Learning Rate গুরুত্বপূর্ণ ভূমিকা রাখে। Learning Rate Schedulers মডেল ট্রেনিংয়ের সময়ে learning rate নিয়ন্ত্রণ করতে সহায়ক হয়।

Learning Rate Scheduler Example:

import torch.optim as optim

optimizer = optim.Adam(model.parameters(), lr=0.001)

# লার্নিং রেট শিডিউলার
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1)

for epoch in range(100):
    # মডেল প্রশিক্ষণ কোড
    scheduler.step()  # লার্নিং রেট আপডেট করা

সারাংশ

PyTorch এর Advanced Topics আপনার মডেল এবং কোডকে আরও শক্তিশালী এবং দক্ষ করতে সহায়ক। এখানে Transfer Learning, Custom Loss Functions, Gradient Clipping, Distributed Training, Reinforcement Learning, Transformers, এবং Optimizers এর মতো বিভিন্ন উন্নত বিষয় নিয়ে আলোচনা করা হয়েছে। এই বিষয়গুলো আপনাকে গভীরভাবে ডিপ লার্নিং এবং মেশিন লার্নিং এ কাজ করতে সক্ষম করবে এবং আরো দ্রুত এবং নির্ভুল মডেল তৈরি করতে সাহায্য করবে।

Content added By

SATT Academy

PyTorch Lightning ব্যবহার

196

PyTorch Lightning হল একটি হাই-লেভেল API যা PyTorch এর উপরে তৈরি করা হয়েছে এবং এটি মডেল ট্রেনিং, ইভ্যালুয়েশন, এবং ডিপ লার্নিং গবেষণাকে আরও দ্রুত, সংগঠিত, এবং স্কেলযোগ্য করতে সাহায্য করে। PyTorch Lightning এর মূল উদ্দেশ্য হল PyTorch কোডের পুনরাবৃত্তি হ্রাস করা এবং ডেভেলপারদের জন্য সহজ, পরিষ্কার এবং পুনঃব্যবহারযোগ্য কোড তৈরি করা।

Lightning, PyTorch এর শক্তি বজায় রেখে মডেল ট্রেনিং এবং পরীক্ষণের জন্য সরলীকৃত, সুবিন্যস্ত কৌশল সরবরাহ করে, যা দীর্ঘমেয়াদী প্রকল্পগুলির জন্য খুবই উপকারী। এটি কোডের আরও পরিষ্কারতা এবং ফ্লেক্সিবিলিটি প্রদান করে।

PyTorch Lightning এর সুবিধা

কোডের সচ্ছলতা:
- Lightning আপনাকে শুধুমাত্র মডেল সম্পর্কিত অংশে মনোযোগ দিতে সহায়ক করে। এটি ডাটা লোডিং, ট্রেনিং লুপ, ইভ্যালুয়েশন, অপটিমাইজার, ব্যাকপ্রোপাগেশন এবং লস ফাংশন ব্যবস্থাপনা করে।
বিপুল স্কেলিং সুবিধা:
- PyTorch Lightning ব্যবহার করে সহজেই GPU বা একাধিক GPU-তে মডেল প্রশিক্ষণ করা সম্ভব, যার মাধ্যমে প্রশিক্ষণ প্রক্রিয়া দ্রুত এবং দক্ষ হয়।
ইন্টারেক্টিভ ট্রেনিং:
- মডেল ট্রেনিংয়ের সময় লগিং, মেট্রিক্স সংগ্রহ, ইভ্যালুয়েশন এবং অন্যান্য অনেক কাজ Lightning স্বয়ংক্রিয়ভাবে করতে পারে, যা কোডিংয়ের সময় খরচ কমায়।
সংগঠিত কোড:
- Lightning ব্যবহার করলে কোডটি পরিষ্কার ও সংগঠিত থাকে, কারণ এতে নির্দিষ্ট কনভেনশন অনুসরণ করতে হয় যা কোডের পুনঃব্যবহারযোগ্যতা বাড়ায়।

PyTorch Lightning দিয়ে মডেল তৈরি করা

PyTorch Lightning ব্যবহার করতে হলে আপনি কিছু নির্দিষ্ট ধাপ অনুসরণ করবেন। নিচে একটি সাধারণ কোড উদাহরণ দেওয়া হলো, যেখানে একটি নিউরাল নেটওয়ার্ক মডেল তৈরি করা হয়েছে।

১. PyTorch Lightning ইনস্টলেশন

প্রথমে PyTorch Lightning ইনস্টল করতে হবে:

pip install pytorch-lightning

২. PyTorch Lightning মডেল তৈরি

এখানে একটি সাধারণ Fully Connected Neural Network (FCNN) তৈরি করা হয়েছে, যা MNIST ডেটাসেটে প্রশিক্ষিত হবে।

import torch
from torch import nn
import pytorch_lightning as pl
from torchmetrics.classification import Accuracy
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

class LitModel(pl.LightningModule):
    def __init__(self):
        super(LitModel, self).__init__()
        self.layer_1 = nn.Linear(28 * 28, 128)
        self.layer_2 = nn.Linear(128, 64)
        self.layer_3 = nn.Linear(64, 10)  # 10 classes for MNIST digits
        self.loss_fn = nn.CrossEntropyLoss()
        self.accuracy = Accuracy()

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # Flatten the input
        x = torch.relu(self.layer_1(x))
        x = torch.relu(self.layer_2(x))
        x = self.layer_3(x)
        return x

    def training_step(self, batch, batch_idx):
        x, y = batch
        y_hat = self(x)
        loss = self.loss_fn(y_hat, y)
        return loss

    def validation_step(self, batch, batch_idx):
        x, y = batch
        y_hat = self(x)
        val_loss = self.loss_fn(y_hat, y)
        acc = self.accuracy(y_hat, y)
        return {'val_loss': val_loss, 'acc': acc}

    def validation_epoch_end(self, outputs):
        avg_val_loss = torch.stack([x['val_loss'] for x in outputs]).mean()
        avg_acc = torch.stack([x['acc'] for x in outputs]).mean()
        return {'val_loss': avg_val_loss, 'val_acc': avg_acc}

    def configure_optimizers(self):
        return torch.optim.Adam(self.parameters(), lr=0.001)

# Dataset preparation
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
val_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=64)

# Model training
model = LitModel()
trainer = pl.Trainer(max_epochs=5)
trainer.fit(model, train_loader, val_loader)

কোডের ব্যাখ্যা:

LitModel ক্লাস:
- pl.LightningModule ক্লাসকে ইনহেরিট করে মডেলটি তৈরি করা হয়। এখানে নিউরাল নেটওয়ার্কের লেয়ারগুলি (ফুলি কানেক্টেড) এবং ফরওয়ার্ড পাস সংজ্ঞায়িত করা হয়েছে।
- training_step এবং validation_step ফাংশন গুলি ব্যবহৃত হয়েছে, যেখানে প্রতিটি ব্যাচের জন্য লস হিসাব করা হয়।
- validation_epoch_end ফাংশনটি ব্যবহার করে, একেবারে শেষের পর্যায়ে বৈধকরণ (validation) এর মাধ্যমে গড় লস এবং অ্যাকুরেসি বের করা হয়।
configure_optimizers ফাংশন:
- এটি অপটিমাইজার কনফিগার করে। এখানে Adam অপটিমাইজার ব্যবহার করা হয়েছে এবং লার্নিং রেট 0.001 নির্ধারণ করা হয়েছে।
ট্রেনিং এবং ভ্যালিডেশন:
- trainer.fit() ফাংশনটি মডেল ট্রেনিং শুরু করে এবং val_loader দিয়ে মডেলের ভ্যালিডেশন (পরীক্ষা) করা হয়।

PyTorch Lightning এর বৈশিষ্ট্য

সহজ কোডিং: PyTorch Lightning মডেল ট্রেনিং, ভ্যালিডেশন, এবং টেস্টিং প্রক্রিয়া সহজ করে দেয়। আপনাকে শুধু নিউরাল নেটওয়ার্ক আর্কিটেকচার এবং অপটিমাইজার কনফিগারেশন করতে হবে, বাকি কাজ Lightning করবে।
স্কেলেবিলিটি: PyTorch Lightning মডেলকে একাধিক GPU বা TPU তে ট্রেন করার সুবিধা দেয়, যা মডেল ট্রেনিং দ্রুততর এবং দক্ষ করে তোলে। একাধিক GPU ব্যবহার করতে DataParallel বা DistributedDataParallel সাপোর্ট করে।
ক্লিন কোড: Lightning মডেলের কোড খুবই পরিষ্কার এবং সহজ, যাতে ডিবাগিং ও পরীক্ষণের সময় সমস্যা কম হয়।
লগিং ও ভিজ্যুয়ালাইজেশন: PyTorch Lightning বিল্ট-ইন TensorBoard সাপোর্ট করে, যা ট্রেনিং লগ এবং ভিজ্যুয়ালাইজেশন করার জন্য সহজ। আপনি আরও অন্যান্য লগিং লাইব্রেরি যেমন Weights & Biases বা Comet.ml ব্যবহার করতে পারেন।
স্বয়ংক্রিয় চেকপয়েন্টিং: PyTorch Lightning আপনাকে ট্রেনিংয়ের মধ্যে চেকপয়েন্ট সেভিং এবং রিস্টোরিং এর সুবিধা দেয়, যাতে আপনি মাঝপথে ট্রেনিং থামিয়ে পুনরায় চালু করতে পারেন।

PyTorch Lightning এর সাথে GPU ব্যবহার করা

PyTorch Lightning সহজেই GPU তে কাজ করতে পারে। আপনি সহজেই মডেলকে একাধিক GPU তে চালাতে পারেন:

trainer = pl.Trainer(gpus=1)  # এক GPU তে ট্রেনিং
trainer.fit(model, train_loader, val_loader)

একাধিক GPU তে ট্রেনিং করার জন্য:

trainer = pl.Trainer(gpus=2)  # দুটি GPU তে ট্রেনিং

এছাড়া, TPU সাপোর্টও রয়েছে:

trainer = pl.Trainer(tpu_cores=8)  # ৮টি TPU কোরে ট্রেনিং

সারাংশ

PyTorch Lightning PyTorch এর উপরে একটি হাই-লেভেল API যা মডেল ট্রেনিংয়ের জন্য অনেক অস্থায়ী কাজ স্বয়ংক্রিয়ভাবে সম্পাদন করে। এটি মডেল তৈরিতে কোডের পরিমাণ কমিয়ে আনে, ট্রেনিং প্রক্রিয়া সহজ করে, এবং একাধিক GPU বা TPU ব্যবহারের মাধ্যমে স্কেলেবিলিটি বৃদ্ধি করে। PyTorch ব্যবহারকারী যারা নিজের কোডকে আরও পরিষ্কার, দ্রুত, এবং কার্যকরীভাবে লিখতে চান, তাদের জন্য PyTorch Lightning একটি শক্তিশালী টুল।

Content added By

SATT Academy

Distributed Training এবং Data Parallelism

220

Distributed Training এবং Data Parallelism হল দুটি গুরুত্বপূর্ণ কৌশল যা মেশিন লার্নিং এবং ডিপ লার্নিং মডেলগুলির ট্রেনিং প্রক্রিয়া দ্রুত এবং দক্ষ করতে ব্যবহৃত হয়, বিশেষত যখন মডেলটি বড় ডেটাসেট বা বৃহত মডেল আর্কিটেকচারে প্রশিক্ষিত হয়। এই কৌশলগুলি মডেল ট্রেনিং প্রক্রিয়া অপ্রত্যাশিত সময়ে দ্রুত করতে এবং কম্পিউটিং রিসোর্সগুলির ব্যবহার আরও কার্যকরী করতে সহায়ক।

১. Distributed Training কী?

Distributed Training হলো একটি কৌশল যা একাধিক কম্পিউটার বা নোডে মডেল ট্রেনিংয়ের প্রক্রিয়া বিভক্ত করে। এটি বড় মডেল বা বড় ডেটাসেটের জন্য ট্রেনিং সময়কে উল্লেখযোগ্যভাবে কমাতে সাহায্য করে। যখন ডেটা বা মডেল এত বড় হয়ে যায় যে একক মেশিনে তা প্রশিক্ষণ করা সম্ভব হয় না, তখন distributed training ব্যবহার করা হয়।

Distributed training এ সাধারণত দুটি পদ্ধতি ব্যবহার করা হয়:

Model Parallelism:
- মডেলটির বিভিন্ন অংশ একাধিক মেশিনে ভাগ করা হয়। উদাহরণস্বরূপ, একটি গভীর নিউরাল নেটওয়ার্কের বিভিন্ন স্তরগুলি একাধিক মেশিনে চলতে পারে। প্রতিটি মেশিন মডেলের একটি অংশের জন্য দায়ী থাকে।
- এটি বিশেষভাবে ব্যবহৃত হয় যখন মডেল খুব বড় হয় এবং একক মেশিনে এটি রাখা সম্ভব নয়।
Data Parallelism:
- Data Parallelism হল একটি কৌশল যেখানে ডেটাসেটটি একাধিক মেশিনে বিভক্ত করা হয়, এবং প্রতিটি মেশিন একই মডেল ট্রেনিং করে তবে আলাদা আলাদা ডেটার উপর। পরে, প্রতিটি মেশিনের ফলাফল একত্রিত করা হয়।
- এটি একটি সাধারণ কৌশল, যেখানে ডেটার বড় ভলিউম মডেলকে দ্রুত প্রশিক্ষিত করতে ব্যবহৃত হয়।

২. Data Parallelism কী?

Data Parallelism একটি শক্তিশালী কৌশল যা Distributed Training এর অংশ হিসাবে ব্যবহৃত হয়। এটি ডেটা ভাগ করে একাধিক কম্পিউটিং ইউনিটে (যেমন, GPU বা নোড) পাঠানো হয় এবং সেগুলির মধ্যে সমান্তরালভাবে ট্রেনিং করা হয়। প্রতিটি কম্পিউটিং ইউনিট একই মডেল ব্যবহার করে, তবে আলাদা আলাদা ডেটা নিয়ে কাজ করে। তারপরে, মডেলের প্রতিটি ইউনিটের গ্র্যাডিয়েন্ট একত্রিত করা হয় এবং মডেলটি আপডেট করা হয়।

Data Parallelism এর প্রক্রিয়া:

ডেটা বিভাজন (Data Splitting):
- ডেটাসেটকে সমান অংশে ভাগ করা হয় এবং প্রত্যেকটি অংশ একটি আলাদা কম্পিউটিং ইউনিটে পাঠানো হয়।
মডেল ট্রেনিং:
- প্রতিটি ইউনিটে একে একে ডেটার অংশগুলোর উপর মডেলটি ট্রেনিং করা হয়। প্রতিটি ইউনিট তার নিজস্ব গ্র্যাডিয়েন্ট ক্যালকুলেট করে।
গ্র্যাডিয়েন্ট একত্রিতকরণ (Gradient Aggregation):
- সমস্ত ইউনিটের গ্র্যাডিয়েন্ট একত্রিত করা হয়। সাধারণত, এই গ্র্যাডিয়েন্টগুলো গড় (average) করা হয়।
মডেল আপডেট:
- একত্রিত গ্র্যাডিয়েন্ট ব্যবহারের মাধ্যমে মডেলটি আপডেট করা হয়।

Data Parallelism এর সুবিধা:

দ্রুত প্রশিক্ষণ: মডেল দ্রুত প্রশিক্ষিত হয় কারণ ডেটার বিভিন্ন অংশ সমান্তরালভাবে প্রসেস করা হয়।
স্কেলেবিলিটি: বড় ডেটাসেট এবং মডেল ট্রেনিংয়ের জন্য এটি সহজে স্কেল করা যায়।

৩. Distributed Training এর বাস্তব উদাহরণ

Horovod:
- Horovod একটি ওপেন সোর্স লাইব্রেরি যা TensorFlow, Keras, PyTorch ইত্যাদি ফ্রেমওয়ার্কের সাথে সমন্বিত হয়ে distributed training সহজভাবে করতে সাহায্য করে।
- এটি data parallelism পদ্ধতি অনুসরণ করে এবং একাধিক GPU/CPU তে সমান্তরালভাবে ট্রেনিং সম্পাদন করে।
PyTorch Distributed:
- PyTorch এর DistributedDataParallel (DDP) মডিউল ব্যবহার করে একাধিক GPU বা মেশিনে মডেল ট্রেনিং সম্পাদন করা যায়।
- এটি মডেল ট্রেনিংয়ের জন্য মডেল প্যারামিটার সমান্তরালভাবে আপডেট করে এবং গ্র্যাডিয়েন্ট একত্রিত করে।

৪. Data Parallelism এর বাস্তব উদাহরণ

ধরা যাক, আমরা একটি নিউরাল নেটওয়ার্ক মডেল ট্রেনিং করছি এবং আমাদের কাছে একটি বড় ডেটাসেট রয়েছে। আমরা যদি Data Parallelism ব্যবহার করি, তাহলে আমাদের ডেটাসেটটি বিভিন্ন ভাগে বিভক্ত হবে এবং একাধিক GPU বা মেশিনে একসাথে ট্রেনিং হবে। প্রতিটি GPU আলাদা ডেটা নিয়ে কাজ করবে এবং শেষে গ্র্যাডিয়েন্টগুলো একত্রিত হবে। PyTorch এ এই কাজটি করার জন্য torch.nn.DataParallel ব্যবহার করা যায়।

import torch
import torch.nn as nn

# Define a simple neural network
class SimpleNet(nn.Module):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.fc1 = nn.Linear(10, 20)
        self.fc2 = nn.Linear(20, 5)
        
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# Create model and move it to GPUs
model = SimpleNet()
model = nn.DataParallel(model)  # This will enable data parallelism across available GPUs

# Dummy input
input_data = torch.randn(64, 10)  # Batch of 64 samples with 10 features each

# Forward pass
output = model(input_data)

এখানে nn.DataParallel ব্যবহার করা হয়েছে, যা একাধিক GPU তে সমান্তরালভাবে ট্রেনিং সম্পাদন করবে এবং গ্র্যাডিয়েন্ট একত্রিত করবে।

৫. Distributed Training এবং Data Parallelism এর মধ্যে পার্থক্য

বৈশিষ্ট্য	Distributed Training	Data Parallelism
কাজের ধারা	একাধিক মেশিনে বা নোডে ট্রেনিং সম্পাদন	একাধিক GPU বা CPU তে ডেটা ভাগ করে ট্রেনিং সম্পাদন
ব্যবহার	মডেল বা ডেটা বড় হলে ব্যবহৃত হয়	ডেটাসেট বড় হলে ব্যবহৃত হয়
কনফিগারেশন	একাধিক মেশিন এবং নোডের মধ্যে কনফিগারেশন প্রয়োজন	একাধিক GPU/CPU তে কাজ করা সহজ
কার্যকারিতা	মডেলটি অনেক বড় হতে পারে, যেটি একক মেশিনে সম্ভব নয়	দ্রুত ডেটা প্রসেসিং এবং প্রশিক্ষণ

সারাংশ

Distributed Training এবং Data Parallelism হল মেশিন লার্নিং এবং ডিপ লার্নিং মডেলগুলির প্রশিক্ষণ দ্রুত করার দুটি গুরুত্বপূর্ণ কৌশল। Data Parallelism একাধিক GPU/CPU তে ডেটা ভাগ করে কাজ করে এবং গ্র্যাডিয়েন্ট একত্রিত করে, যেখানে Distributed Training মডেল বা ডেটাকে একাধিক মেশিনে ভাগ করে ট্রেনিং করে। এই কৌশলগুলি মডেল এবং ডেটাসেটের আকার বাড়ানোর সাথে সাথে প্রশিক্ষণ সময় কমাতে সাহায্য করে।

Content added By

SATT Academy

Model Quantization এবং Pruning

168

Model Quantization এবং Pruning হল মডেল অপ্টিমাইজেশনের দুটি গুরুত্বপূর্ণ কৌশল, যা ডিপ লার্নিং মডেলগুলিকে আরও দ্রুত এবং কম সম্পদ ব্যবহারের জন্য উন্নত করে। এই দুটি কৌশল মডেলের আকার ছোট করে এবং ইনফারেন্সের সময় (ফিচার এক্সট্রাকশন বা প্রেডিকশন) কম্পিউটেশনাল খরচ কমায়, বিশেষ করে যখন মডেলটি মোবাইল বা এমবেডেড ডিভাইসে চালানো হয়।

নিচে Model Quantization এবং Pruning এর বিস্তারিত আলোচনা করা হলো।

১. Model Quantization

Model Quantization হল একটি প্রক্রিয়া যেখানে মডেলের প্যারামিটার (যেমন, ওজন এবং বায়াস) এবং/অথবা ইনপুট/আউটপুট ভ্যালুগুলোকে কম পজিশনাল প্রেসিশনে রূপান্তরিত করা হয়, যেমন 32-বিট ফ্লোট থেকে 8-বিট ইনটিজার বা 16-বিট ফ্লোটে। এতে মেমরি এবং গণনার জন্য প্রয়োজনীয় শক্তি কমে আসে, তবে মডেলের পারফরম্যান্সে তেমন কোনো ক্ষতি হয় না।

Model Quantization এর প্রধান উপকারিতা:

মেমরি সঞ্চয়: কম বিটে ওজন ও আউটপুট রূপান্তরিত করলে মডেলটির মেমরি প্রয়োজনীয়তা উল্লেখযোগ্যভাবে কমে যায়।
দ্রুত ইনফারেন্স: কম বিট ডেটা ব্যবহারের ফলে ইনফারেন্সের সময় দ্রুত হয়, বিশেষ করে হার্ডওয়্যার অপটিমাইজেশনের জন্য (যেমন, CPU বা GPU)।
নেটওয়ার্ক ব্যান্ডউইথ কমানো: সিস্টেমে ডেটা পাঠানোর জন্য ব্যান্ডউইথ কম ব্যবহৃত হয়, যা বিশেষভাবে ক্লাউড বা এমবেডেড ডিভাইসে গুরুত্বপূর্ণ।

Quantization এর ধরণ:

Weight Quantization: মডেলের সমস্ত ওজন বা প্যারামিটার কম বিটে রূপান্তরিত করা হয় (যেমন, 32-বিট ফ্লোট থেকে 8-বিট ইনটিজার)।
Activation Quantization: ইনপুট বা আউটপুট ডেটার মানও কম বিটে রূপান্তরিত করা হয়, যা আউটপুটের মাপকে ছোট করে।

Quantization পদ্ধতি:

Post-training Quantization: মডেল প্রশিক্ষণ সম্পন্ন হওয়ার পর, আমরা এটি কম বিটে রূপান্তরিত করি।
Quantization-aware Training: মডেল প্রশিক্ষণের সময়ই কম বিটের রূপান্তর করে, যাতে মডেল সঠিকভাবে শিখতে পারে এবং ইনফারেন্সের সময় পারফরম্যান্সে তেমন কোনো পার্থক্য না আসে।

উদাহরণ (PyTorch):

import torch
import torch.quantization

# একটি কাস্টম মডেল উদাহরণ
model = torch.hub.load('pytorch/vision', 'resnet18', pretrained=True)

# Quantization প্রক্রিয়া
model.eval()
model = torch.quantization.quantize_dynamic(model, {torch.nn.Linear}, dtype=torch.qint8)

এখানে, quantize_dynamic ব্যবহার করে মডেলটির Linear লেয়ারগুলির জন্য ডাইনামিক কোয়ান্টাইজেশন সম্পন্ন করা হয়েছে।

২. Model Pruning

Model Pruning হল একটি কৌশল, যেখানে মডেলটির কিছু অংশ (যেমন, নোড, লেয়ার, বা ওজন) সরানো হয়, যা মডেলের পারফরম্যান্সে তেমন কোনো প্রভাব ফেলবে না। প্রুনিংয়ের মাধ্যমে আমরা অপ্রয়োজনীয় প্যারামিটার বা কনেকশন সরিয়ে মডেলটি ছোট এবং আরও দক্ষ করে তুলি।

Model Pruning এর প্রধান উপকারিতা:

মেমরি সঞ্চয়: কিছু অংশ সরিয়ে দেওয়া হলে মডেলের মেমরি প্রয়োজনীয়তা কমে যায়।
দ্রুত ইনফারেন্স: প্রুনিংয়ের ফলে কম প্যারামিটার থাকার কারণে ইনফারেন্স গতি বাড়ে।
কম্পিউটেশনাল দক্ষতা: মডেল কম জটিল হওয়ায় কম্পিউটেশনাল খরচ কমে।

Pruning এর ধরণ:

Weight Pruning: মডেলের ওজনের মধ্যে কিছু ছোট মান (যেমন, 0 এর কাছে) সরানো হয়, যেগুলির কোন প্রভাব পড়ে না।
Neuron Pruning: কিছু নিউরন বা নোড সরানো হয়, যাতে মডেলের আউটপুট অক্ষুণ্ন থাকে।
Layer Pruning: পুরো লেয়ার বা চ্যানেল সরানো হয় যা কম পারফরম্যান্স যোগ করে।

Pruning পদ্ধতি:

Unstructured Pruning: একটি ওজন বা নিউরন কে সরানো হয়, তবে এর অবস্থান নির্দিষ্ট নয়।
Structured Pruning: সম্পূর্ণ লেয়ার বা চ্যানেল সরানো হয়, যা মডেলটির আর্কিটেকচার পরিবর্তন করে।

Pruning এর উদাহরণ (PyTorch):

import torch
import torch.nn.utils.prune as prune

# একটি সিম্পল মডেল উদাহরণ
model = torch.hub.load('pytorch/vision', 'resnet18', pretrained=True)

# প্রুনিং (weight pruning)
prune.random_unstructured(model.fc, name='weight', amount=0.3)

এখানে, prune.random_unstructured ব্যবহার করে fc লেয়ারের ওজনের 30% এলোমেলোভাবে সরানো হয়েছে।

৩. Pruning এবং Quantization এর মধ্যে পার্থক্য

বৈশিষ্ট্য	Pruning	Quantization
লক্ষ্য	অপ্রয়োজনীয় প্যারামিটার সরানো	ওজন এবং আউটপুট কম বিটে রূপান্তর করা
কাজের ধরন	মডেলের আর্কিটেকচার ছোট করা	মডেলগুলির কম্পিউটেশনাল ক্ষমতা বৃদ্ধি করা
ফলস্বরূপ	মডেল সাইজ কমানো, ট্রেনিং ফাস্ট করা	মডেল আউটপুট কম সাইজে এবং দ্রুত হওয়া
কম্পিউটেশনাল দক্ষতা	কমপ্লেক্সিটি কমানো, ইনফারেন্স গতি বাড়ানো	কম মেমরি এবং গতি বাড়ানো
প্রভাব	মডেল আর্কিটেকচার পরিবর্তন	মডেলটির আউটপুট সাইজ এবং গতি পরিবর্তন

সারাংশ

Model Quantization এবং Pruning দুটি শক্তিশালী টুল, যা মডেলকে ছোট এবং দ্রুত করতে সাহায্য করে। Quantization পদ্ধতিতে ইনপুট, আউটপুট বা প্যারামিটারগুলিকে কম বিটে রূপান্তর করা হয়, যাতে মেমরি এবং কম্পিউটেশনাল দক্ষতা বৃদ্ধি পায়। অন্যদিকে, Pruning হল অপ্রয়োজনীয় প্যারামিটার বা লেয়ার সরানোর প্রক্রিয়া, যাতে মডেলটি দ্রুত এবং কম মেমরি ব্যবহার করে কাজ করতে পারে। এই দুটি কৌশল মডেলকে কম্পিউটেশনাল দক্ষতা বাড়ানোর জন্য ব্যবহার করা হয়, বিশেষত মোবাইল বা এমবেডেড ডিভাইসে ইনফারেন্সের জন্য।

Content added By

SATT Academy

ONNX (Open Neural Network Exchange) এবং PyTorch মডেলের ইন্টার-ফ্রেমওয়ার্ক কম্প্যাটিবিলিটি

137

ONNX (Open Neural Network Exchange) হল একটি ওপেন সোর্স প্রোজেক্ট যা বিভিন্ন মেশিন লার্নিং এবং ডিপ লার্নিং ফ্রেমওয়ার্কের মধ্যে মডেল এক্সচেঞ্জ এবং কম্প্যাটিবিলিটি নিশ্চিত করতে সহায়ক। ONNX এর মূল উদ্দেশ্য হলো বিভিন্ন ফ্রেমওয়ার্ক (যেমন PyTorch, TensorFlow, Caffe2, Scikit-learn, এবং আরও অনেক) এর মধ্যে মডেল ট্রান্সফার এবং ইন্টিগ্রেশন সহজ করা।

ONNX এর মাধ্যমে, আপনি একটি মডেল তৈরি করতে পারেন এবং এটি এক ফ্রেমওয়ার্ক থেকে অন্য ফ্রেমওয়ার্কে ট্রান্সফার বা পোর্ট করতে পারেন, এতে মডেলগুলো বিভিন্ন প্ল্যাটফর্মে কাজ করতে পারে।

ONNX এর মূল বৈশিষ্ট্য:

ফ্রেমওয়ার্ক-নিরপেক্ষ: ONNX মডেলগুলি PyTorch, TensorFlow, Caffe2, MXNet, এবং অন্যান্য ফ্রেমওয়ার্কের মধ্যে স্থানান্তর করা যায়, যা বিভিন্ন ফ্রেমওয়ার্কের মধ্যে আন্তঃযোগাযোগকে সহজ করে।
বিভিন্ন প্ল্যাটফর্মে কর্মক্ষমতা: ONNX সমর্থন করে CPU, GPU এবং টেনসর প্রসেসিং ইউনিট (TPU) এর মতো বিভিন্ন হার্ডওয়্যার প্ল্যাটফর্মে।
ইন্টিগ্রেটেড অপ্টিমাইজেশন: ONNX মডেলগুলি দ্রুত চালানোর জন্য অপ্টিমাইজ করা যায়, বিশেষত যখন ONNX Runtime ব্যবহার করা হয়।
এপিআই সমর্থন: ONNX বিভিন্ন ভাষায় API প্রদান করে, যেমন Python, C++, C#, এবং JavaScript।

PyTorch মডেল এবং ONNX এর মধ্যে ইন্টার-ফ্রেমওয়ার্ক কম্প্যাটিবিলিটি

PyTorch মডেলগুলো ONNX ফরম্যাটে এক্সপোর্ট এবং ইমপোর্ট করা যায়, যা PyTorch মডেলগুলোকে অন্য ফ্রেমওয়ার্ক এবং প্ল্যাটফর্মে ব্যবহারযোগ্য করে তোলে।

PyTorch মডেল থেকে ONNX মডেল এক্সপোর্ট করা

PyTorch মডেলগুলোকে ONNX ফরম্যাটে এক্সপোর্ট করতে, আপনি PyTorch এর torch.onnx.export() ফাংশন ব্যবহার করতে পারেন। এর মাধ্যমে, আপনি একটি PyTorch মডেলকে ONNX ফরম্যাটে রূপান্তর করতে পারবেন, যাতে এটি অন্যান্য ফ্রেমওয়ার্কে ব্যবহৃত হতে পারে, যেমন TensorFlow, Caffe2, বা ONNX Runtime।

PyTorch থেকে ONNX মডেল এক্সপোর্টের উদাহরণ:

import torch
import torch.onnx
import torchvision.models as models

# PyTorch মডেল লোড করা
model = models.resnet18(pretrained=True)
model.eval()

# Dummy ইনপুট (ব্রডকাস্ট আকারের)
dummy_input = torch.randn(1, 3, 224, 224)

# ONNX ফাইলে এক্সপোর্ট
torch.onnx.export(model,               # PyTorch মডেল
                  dummy_input,         # ইনপুট ডেটা
                  "resnet18.onnx",      # ONNX ফাইলের নাম
                  export_params=True,  # মডেলের প্যারামিটার এক্সপোর্ট করুন
                  opset_version=11,    # ONNX অপসেট ভার্সন
                  do_constant_folding=True,  # কনস্ট্যান্ট অপ্টিমাইজেশন
                  input_names=['input'],    # ইনপুট নাম
                  output_names=['output'],  # আউটপুট নাম
                  dynamic_axes={'input': {0: 'batch_size'},    # ব্যাচ সাইজ পরিবর্তনযোগ্য
                                'output': {0: 'batch_size'}})

ONNX মডেল লোড এবং চালানো

ONNX মডেলটি লোড এবং চালাতে, আপনি ONNX Runtime ব্যবহার করতে পারেন, যা ONNX ফাইল চালানোর জন্য একটি উচ্চ কার্যক্ষমতা সম্পন্ন রানটাইম ইঞ্জিন।

ONNX Runtime ইনস্টল করুন:

pip install onnxruntime

ONNX মডেল চালানো:

import onnx
import onnxruntime as ort
import numpy as np

# ONNX মডেল লোড করা
onnx_model = onnx.load("resnet18.onnx")
onnx.checker.check_model(onnx_model)  # মডেলটি সঠিক কিনা তা যাচাই

# ONNX Runtime দিয়ে মডেল চালানো
ort_session = ort.InferenceSession("resnet18.onnx")

# ইনপুট তৈরি করা
input_name = ort_session.get_inputs()[0].name
dummy_input = np.random.randn(1, 3, 224, 224).astype(np.float32)

# আউটপুট প্রাপ্তি
outputs = ort_session.run(None, {input_name: dummy_input})
print(outputs[0].shape)  # আউটপুটের আকার

PyTorch মডেল থেকে ONNX মডেলে রূপান্তর করার সুবিধা

প্ল্যাটফর্ম কম্প্যাটিবিলিটি:
- PyTorch মডেলটি ONNX ফরম্যাটে এক্সপোর্ট করার মাধ্যমে, এটি অন্যান্য ফ্রেমওয়ার্কের সাথে ব্যবহারযোগ্য হয়, যেমন TensorFlow, Caffe2, বা ONNX Runtime।
গতি ও দক্ষতা:
- ONNX Runtime অপ্টিমাইজড রানটাইম ব্যবহার করে, PyTorch মডেলগুলি কমপিউটেশনে আরও দ্রুত চালানো যেতে পারে, বিশেষত হার্ডওয়্যার নির্ভর (GPU বা TPU) অপ্টিমাইজেশনের মাধ্যমে।
স্বতন্ত্র ফ্রেমওয়ার্ক সমর্থন:
- ONNX মডেলগুলি ব্যবহার করে, মডেলটি বিভিন্ন ফ্রেমওয়ার্কে এবং প্ল্যাটফর্মে পুনরায় ব্যবহার করা যেতে পারে, এটি মডেল এক্সচেঞ্জ এবং ইন্টিগ্রেশন সহজ করে তোলে।

সারাংশ

ONNX (Open Neural Network Exchange) একটি ওপেন সোর্স ফ্রেমওয়ার্ক যা বিভিন্ন মেশিন লার্নিং ফ্রেমওয়ার্কের মধ্যে মডেল এক্সচেঞ্জ এবং কম্প্যাটিবিলিটি নিশ্চিত করে।
PyTorch মডেল কে ONNX ফরম্যাটে এক্সপোর্ট করে অন্য ফ্রেমওয়ার্কে ব্যবহার করা যায়, যেমন TensorFlow, Caffe2, এবং ONNX Runtime।
PyTorch থেকে ONNX মডেল এক্সপোর্ট এবং ONNX Runtime দিয়ে চালানোর মাধ্যমে মডেলের প্ল্যাটফর্ম নন-নির্ভরতা এবং গতি বাড়ানো সম্ভব।

Content added By

SATT Academy

পাইটর্চ পরিচিতি PyTorch ইনস্টলেশন এবং সেটআপ PyTorch এর মৌলিক ধারণা PyTorch টেনসর ম্যানিপুলেশন PyTorch দিয়ে মডেল তৈরি করা

PyTorch এর Advanced Topics

১. Transfer Learning

PyTorch-এ Transfer Learning:

২. Custom Loss Functions

Custom Loss Function উদাহরণ:

৩. Gradient Clipping

PyTorch-এ Gradient Clipping:

৪. Dynamic Computation Graph

Dynamic Graph Example:

৫. Distributed Training

PyTorch Distributed Training Example:

৬. Reinforcement Learning with PyTorch

PyTorch-এ Reinforcement Learning Example (DQN):

৭. Attention Mechanisms and Transformers

Transformer Example:

৮. Optimizers and Learning Rate Schedulers

Learning Rate Scheduler Example:

সারাংশ

PyTorch Lightning ব্যবহার

PyTorch Lightning এর সুবিধা

PyTorch Lightning দিয়ে মডেল তৈরি করা

১. PyTorch Lightning ইনস্টলেশন

২. PyTorch Lightning মডেল তৈরি

কোডের ব্যাখ্যা:

PyTorch Lightning এর বৈশিষ্ট্য

PyTorch Lightning এর সাথে GPU ব্যবহার করা

সারাংশ

Distributed Training এবং Data Parallelism

১. Distributed Training কী?

২. Data Parallelism কী?

Data Parallelism এর প্রক্রিয়া:

Data Parallelism এর সুবিধা:

৩. Distributed Training এর বাস্তব উদাহরণ

৪. Data Parallelism এর বাস্তব উদাহরণ

৫. Distributed Training এবং Data Parallelism এর মধ্যে পার্থক্য

সারাংশ

Model Quantization এবং Pruning

১. Model Quantization

Model Quantization এর প্রধান উপকারিতা:

Quantization এর ধরণ:

Quantization পদ্ধতি:

উদাহরণ (PyTorch):

২. Model Pruning

Model Pruning এর প্রধান উপকারিতা:

Pruning এর ধরণ:

Pruning পদ্ধতি:

Pruning এর উদাহরণ (PyTorch):

৩. Pruning এবং Quantization এর মধ্যে পার্থক্য

সারাংশ

ONNX (Open Neural Network Exchange) এবং PyTorch মডেলের ইন্টার-ফ্রেমওয়ার্ক কম্প্যাটিবিলিটি

ONNX এর মূল বৈশিষ্ট্য:

PyTorch মডেল এবং ONNX এর মধ্যে ইন্টার-ফ্রেমওয়ার্ক কম্প্যাটিবিলিটি

PyTorch মডেল থেকে ONNX মডেল এক্সপোর্ট করা

PyTorch থেকে ONNX মডেল এক্সপোর্টের উদাহরণ:

ONNX মডেল লোড এবং চালানো

PyTorch মডেল থেকে ONNX মডেলে রূপান্তর করার সুবিধা

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!

Hi, আমি SATT AI!