CNTK তে বেসিক মডেল তৈরি

মাইক্রোসফট কগনিটিভ টুলকিট (Microsoft Cognitive Toolkit) - Machine Learning

309

Microsoft Cognitive Toolkit (CNTK) তে একটি বেসিক মডেল তৈরি করার জন্য আপনাকে কিছু মূল ধাপ অনুসরণ করতে হবে, যেমন ইনপুট ডেটা প্রস্তুতি, মডেল তৈরি, অপ্টিমাইজেশন, এবং প্রশিক্ষণ। এখানে আমি একটি বেসিক নিউরাল নেটওয়ার্ক মডেল তৈরি করার সম্পূর্ণ প্রক্রিয়া ব্যাখ্যা করছি।

CNTK তে বেসিক মডেল তৈরি

১. লাইব্রেরি এবং ইনপুট ডেটা প্রস্তুতি

প্রথমে, CNTK লাইব্রেরি ইমপোর্ট করতে হবে এবং ইনপুট ডেটা প্রস্তুত করতে হবে। এখানে একটি সাধারণ নিউরাল নেটওয়ার্ক মডেল তৈরি করার জন্য আমরা কিছু সাদামাটা ডেটা ব্যবহার করব, যেমন সিঙ্গেল ফিচারের লিনিয়ার রিগ্রেশন সমস্যা।

import cntk
import numpy as np

# ইনপুট এবং আউটপুট ভেরিয়েবল তৈরি
input_dim = 1  # একক ইনপুট
output_dim = 1  # একক আউটপুট

# ইনপুট এবং আউটপুট ভেরিয়েবল ডিফাইন করা
input_var = cntk.input_variable(input_dim)
output_var = cntk.input_variable(output_dim)

# ডেটার প্রস্তুতি (যেমন একটি সিম্পল লিনিয়ার রিগ্রেশন সমস্যা)
# একদম সাদামাটা ডেটা: X (input) এবং Y (output)
X = np.array([[1], [2], [3], [4], [5]], dtype=np.float32)
Y = np.array([[2], [4], [6], [8], [10]], dtype=np.float32)

২. মডেল তৈরি করা

এখন, আমরা একটি সাদামাটা নিউরাল নেটওয়ার্ক তৈরি করব। এটি একটি একটি লেয়ার এর সাথে লিনিয়ার রিগ্রেশন হবে যেখানে ইনপুট এবং আউটপুট ভেরিয়েবলগুলোর মধ্যে একটি সরল রৈখিক সম্পর্ক থাকবে।

# মডেল তৈরি
# এখানে একটি সরল লিনিয়ার রিগ্রেশন মডেল
# আউটপুটের জন্য একটি একক নিউরন (প্যারামিটার সহ)
weight = cntk.parameter((input_dim, output_dim), name="weight")
bias = cntk.parameter((output_dim,), name="bias")

# লিনিয়ার অপারেশন: y = Wx + b
model = cntk.ops.times(input_var, weight) + bias

৩. লস ফাংশন এবং অপ্টিমাইজেশন

এখন, মডেল তৈরির পর, আমাদের লস ফাংশন এবং অপ্টিমাইজেশন অ্যালগরিদম সেট করতে হবে। এই উদাহরণে, আমরা Mean Squared Error (MSE) লস ফাংশন এবং Stochastic Gradient Descent (SGD) অপ্টিমাইজার ব্যবহার করব।

# লস ফাংশন (Mean Squared Error)
loss = cntk.ops.squared_error(model, output_var)

# অপ্টিমাইজেশন অ্যালগরিদম (SGD)
learning_rate = 0.1
trainer = cntk.Trainer(model, (loss, loss), [cntk.sgd(model.parameters, learning_rate)])

# লস ফাংশন এবং অপ্টিমাইজেশন

৪. মডেল প্রশিক্ষণ

এখন, আমাদের মডেল প্রশিক্ষণের জন্য trainer ব্যবহার করতে হবে। মডেল প্রশিক্ষণের জন্য trainer.train() ফাংশন ব্যবহার করতে হবে এবং ডেটাসেটের মাধ্যমে মডেলকে প্রশিক্ষিত করতে হবে।

# প্রশিক্ষণ চলানো
for epoch in range(100):  # 100 epoch পর্যন্ত প্রশিক্ষণ
    trainer.train_minibatch({input_var: X, output_var: Y})
    
    # প্রতি 10 epoch পর পর লস প্রিন্ট করা
    if epoch % 10 == 0:
        print(f"Epoch {epoch}, Loss: {trainer.previous_minibatch_loss}")

৫. মডেল পরীক্ষা (Prediction)

মডেল প্রশিক্ষণের পর, আপনি প্রশিক্ষণ করা মডেল দিয়ে নতুন ইনপুট ডেটার পূর্বাভাস (prediction) করতে পারেন।

# মডেল পরীক্ষা করা
test_input = np.array([[6]], dtype=np.float32)  # নতুন ইনপুট
prediction = model.eval({input_var: test_input})  # পূর্বাভাস
print(f"Prediction for input {test_input}: {prediction}")

৬. পূর্ণ কোড

import cntk
import numpy as np

# ইনপুট এবং আউটপুট ভেরিয়েবল তৈরি
input_dim = 1  # একক ইনপুট
output_dim = 1  # একক আউটপুট

input_var = cntk.input_variable(input_dim)
output_var = cntk.input_variable(output_dim)

# সিম্পল ডেটা (একটি লিনিয়ার রিগ্রেশন সমস্যা)
X = np.array([[1], [2], [3], [4], [5]], dtype=np.float32)
Y = np.array([[2], [4], [6], [8], [10]], dtype=np.float32)

# মডেল তৈরি
weight = cntk.parameter((input_dim, output_dim), name="weight")
bias = cntk.parameter((output_dim,), name="bias")

model = cntk.ops.times(input_var, weight) + bias

# লস ফাংশন এবং অপ্টিমাইজেশন
loss = cntk.ops.squared_error(model, output_var)
learning_rate = 0.1
trainer = cntk.Trainer(model, (loss, loss), [cntk.sgd(model.parameters, learning_rate)])

# প্রশিক্ষণ
for epoch in range(100):
    trainer.train_minibatch({input_var: X, output_var: Y})
    if epoch % 10 == 0:
        print(f"Epoch {epoch}, Loss: {trainer.previous_minibatch_loss}")

# মডেল পরীক্ষা
test_input = np.array([[6]], dtype=np.float32)
prediction = model.eval({input_var: test_input})
print(f"Prediction for input {test_input}: {prediction}")

সারাংশ

এই উদাহরণে, আমরা CNTK তে একটি সাধারণ নিউরাল নেটওয়ার্ক মডেল তৈরি করেছি। আমরা একটি লিনিয়ার রিগ্রেশন সমস্যা ব্যবহার করেছি যেখানে ইনপুট এবং আউটপুট মধ্যে একটি সরল রৈখিক সম্পর্ক ছিল। Mean Squared Error (MSE) লস ফাংশন এবং Stochastic Gradient Descent (SGD) অপ্টিমাইজার ব্যবহার করে মডেলটি প্রশিক্ষণ করেছি। আপনি এই প্রক্রিয়ার মাধ্যমে CNTK তে সহজ ডিপ লার্নিং মডেল তৈরি এবং প্রশিক্ষণ করতে পারেন।

Content added By

Azizar Rahman Aziz

Sequential মডেল তৈরি করা

281

Sequential মডেল হল একটি নিউরাল নেটওয়ার্ক আর্কিটেকচার যা লেয়ারগুলির একটি সোজা সিরিজ অনুসরণ করে। এটি বিশেষভাবে উপযুক্ত যখন আপনার মডেল কেবল একের পর এক লেয়ার ব্যবহার করে ডেটা প্রক্রিয়া করে এবং কোথাও শাখা বা জটিল সংযোগের প্রয়োজন হয় না। CNTK তে Sequential মডেল তৈরি করতে, আপনি Sequential ক্লাস ব্যবহার করতে পারেন।

CNTK তে Sequential মডেল তৈরি করা

১. CNTK ইনস্টলেশন

প্রথমে CNTK ইনস্টল করতে হবে, যদি আপনি ইতিমধ্যেই ইনস্টল না করে থাকেন:

pip install cntk

২. Python কোডের মাধ্যমে Sequential মডেল তৈরি করা

এখানে একটি সিম্পল Sequential মডেল তৈরি করার উদাহরণ দেওয়া হচ্ছে যা Dense লেয়ার ব্যবহার করে:

import cntk
from cntk import layers

# Sequential মডেল তৈরি করা
model = layers.Sequential([
    layers.Dense(64, activation=cntk.ops.relu),  # প্রথম লেয়ার, 64 নিউরন এবং ReLU একটিভেশন
    layers.Dense(32, activation=cntk.ops.relu),  # দ্বিতীয় লেয়ার, 32 নিউরন এবং ReLU একটিভেশন
    layers.Dense(1)  # আউটপুট লেয়ার, 1 নিউরন (যেমন রিগ্রেশন সমস্যা)
])

# ইনপুট ভেরিয়েবল তৈরি
input_var = cntk.input_variable((3,))  # 3 ডাইমেনশন ইনপুট

# মডেল দিয়ে আউটপুট তৈরি করা
output = model(input_var)

# মডেল সারাংশ
print("Model Summary:")
print(model)

এখানে আমরা 3 ডাইমেনশন ইনপুট গ্রহণ করছি এবং ৩টি লেয়ার ব্যবহার করেছি: প্রথম দুটি লেয়ার 64 এবং 32 নিউরন ধারণ করে এবং ReLU অ্যাক্টিভেশন ফাংশন ব্যবহার করে। পরবর্তী লেয়ারটি 1 নিউরন ধারণ করে, যা সাধারণত রিগ্রেশন সমস্যা বা একটি স্কেলার আউটপুট প্রযোজ্য।

Sequential মডেল তৈরির উপাদানসমূহ:

Dense লেয়ার:
- একটি Dense লেয়ার হল একটি সাধারণ ফিডফরওয়ার্ড লেয়ার যা fully connected নিউরন ধারণ করে।
- লেয়ার তৈরির সময় আপনি নিউরনের সংখ্যা এবং অ্যাক্টিভেশন ফাংশন নির্ধারণ করতে পারেন।
উদাহরণ:
```
layers.Dense(64, activation=cntk.ops.relu)
```
ReLU অ্যাক্টিভেশন ফাংশন:
- ReLU (Rectified Linear Unit) হল একটি সাধারণ অ্যাক্টিভেশন ফাংশন যা ইনপুট মানে ঋণাত্মক মানকে 0 এ রূপান্তরিত করে এবং পজিটিভ মানের জন্য অপরিবর্তিত রাখে।
Input Variable:
- cntk.input_variable ব্যবহার করে ইনপুট ভেরিয়েবল তৈরি করা হয়, যা আপনার মডেলের ইনপুট ডেটার আকৃতি (shape) নির্ধারণ করে।
উদাহরণ:
```
input_var = cntk.input_variable((3,))
```
Model Execution:
- মডেল তৈরি করার পর, ইনপুট ভেরিয়েবল দেওয়া হলে মডেল আউটপুট প্রদান করবে।
উদাহরণ:
```
output = model(input_var)
```

Training মডেল

Sequential মডেল তৈরি করার পর, আপনি এটি train করতে পারেন। ট্রেনিংয়ের জন্য, মডেলকে loss function এবং optimizer প্রয়োজন। উদাহরণস্বরূপ:

from cntk import learners, losses

# ডেটা (random data used for simplicity)
import numpy as np
X_train = np.random.rand(100, 3)  # 100 স্যাম্পল, প্রতিটি 3 ডাইমেনশন
y_train = np.random.rand(100, 1)  # 100 আউটপুট

# Loss function এবং Optimizer নির্বাচন করা
loss = losses.mean_squared_error(output, cntk.input_variable((1,)))  # রিগ্রেশন সমস্যা
learner = learners.sgd(model.parameters, lr=0.01)

# মডেল ট্রেনিং
trainer = cntk.Trainer(model, (loss, None), learner)
trainer.train_minibatch({input_var: X_train, output: y_train})

সারাংশ

CNTK তে Sequential মডেল তৈরি করতে Sequential ক্লাস ব্যবহার করা হয়। এটি একের পর এক লেয়ার তৈরি করে এবং মডেলটির আউটপুট প্রদান করে। মডেল তৈরি করার পর, আপনি সহজেই ডেটা ইনপুট করতে এবং মডেল প্রশিক্ষণ করতে পারবেন। এই ধরনের মডেলগুলি সাধারণত সোজা কাঠামোতে থাকে এবং বিশেষত ফিডফরওয়ার্ড নিউরাল নেটওয়ার্কের জন্য উপযুক্ত।

Content added By

Azizar Rahman Aziz

Dense লেয়ার এবং Activation Functions (ReLU, Sigmoid, Softmax)

345

Dense Layer এবং Activation Functions ডিপ লার্নিং মডেলগুলির অত্যন্ত গুরুত্বপূর্ণ উপাদান। Dense Layer মডেলের প্রতিটি নিউরনের মধ্যে সম্পূর্ণ সংযোগ প্রদান করে এবং Activation Functions মডেলের প্রতিটি নিউরনের আউটপুট নির্ধারণ করে। নিচে আমি Dense Layer এবং জনপ্রিয় Activation Functions যেমন ReLU, Sigmoid, এবং Softmax এর ব্যাখ্যা প্রদান করছি।

Dense Layer (Fully Connected Layer)

Dense Layer বা Fully Connected Layer (FC Layer) হল নিউরাল নেটওয়ার্কের একটি অন্যতম মৌলিক লেয়ার যেখানে প্রতিটি ইনপুট নিউরন পরবর্তী লেয়ারের প্রতিটি নিউরনের সাথে সংযুক্ত থাকে। এটি একটি মেট্রিক্স মাল্টিপ্লিকেশন অপারেশন করে, যেখানে ইনপুট ভেক্টর এবং লেয়ারের ওজন (weights) একটি ম্যাট্রিক্স মাল্টিপ্লিকেশন দ্বারা গুণিত হয়, তারপর একটি বায়াস (bias) যোগ করা হয়।

ওজন (Weights): Dense লেয়ারে প্রতিটি ইনপুট এবং আউটপুট নিউরনের মধ্যে একটি সম্পর্ক থাকে যা ওজন দ্বারা প্রতিনিধিত্ব করা হয়।
বায়াস (Bias): প্রতিটি আউটপুট নিউরনের জন্য একটি অতিরিক্ত প্যারামিটার হিসেবে বায়াস ব্যবহৃত হয়।

Dense Layer মডেলকে আরও জটিল এবং ক্ষমতাশালী করতে সাহায্য করে, কারণ এটি নিউরাল নেটওয়ার্কের প্রতিটি স্তরের মধ্যে সম্পর্কের গঠন করে।

Dense Layer উদাহরণ (Python / CNTK):

import cntk as c

# ইনপুট ভেরিয়েবল তৈরি করা
input_var = c.input_variable(2)

# Dense লেয়ার (3 আউটপুট নিউরন)
dense_layer = c.layers.Dense(3)(input_var)

Activation Functions (এ্যাকটিভেশন ফাংশন)

Activation Functions হল ফাংশনগুলি যা Dense Layer এর আউটপুটে অ্যাপ্লাই করা হয় এবং এটি নিউরাল নেটওয়ার্কের প্রতিটি নিউরনের জন্য আউটপুট নির্ধারণ করে। এটি একটি নির্দিষ্ট ইনপুটের উপর ভিত্তি করে আউটপুট তৈরি করতে ব্যবহৃত হয় এবং এটি মডেলটিকে non-linear করে তোলে, যার ফলে এটি জটিল ডেটা প্যাটার্ন শিখতে সক্ষম হয়।

১. ReLU (Rectified Linear Unit)

ReLU হল সবচেয়ে জনপ্রিয় অ্যাক্টিভেশন ফাংশনগুলির মধ্যে একটি। এটি ইনপুটের জন্য সরল লিনিয়ার ফাংশন ব্যবহার করে যা শূন্যের নিচে সমস্ত মানকে শূন্যে রূপান্তরিত করে এবং শূন্যের উপরে থাকা মানগুলো অপরিবর্তিত রাখে।

ReLU Formula:

$\text{ReLU}(x) = \max(0, x)$

পজিটিভ ইনপুট: ইনপুটটি পজিটিভ হলে আউটপুট ইনপুটের সমান থাকে।
নেগেটিভ ইনপুট: ইনপুটটি নেগেটিভ হলে আউটপুট শূন্য (0) হয়।

ReLU ফাংশন ব্যবহারের সুবিধা:

দ্রুত কনভার্জেন্স
সহজ এবং কার্যকর
গ্র্যাডিয়েন্ট বিলুপ্তি সমস্যা কমায়

ReLU উদাহরণ (Python / CNTK):

import cntk as c

# ইনপুট ভেরিয়েবল
input_var = c.input_variable(2)

# ReLU অ্যাকটিভেশন ফাংশন
relu_layer = c.relu(input_var)

২. Sigmoid Activation Function

Sigmoid ফাংশন একটি সিগময়েডাল আকারের গঠন প্রদান করে যা ইনপুটের উপর ভিত্তি করে ০ থেকে ১ এর মধ্যে আউটপুট প্রদান করে। এটি মূলত বাইনারি ক্লাসিফিকেশন সমস্যার জন্য ব্যবহৃত হয়। সিগময়েড ফাংশন মসৃণ এবং ডিফারেন্সিয়েবল, যা ব্যাকপ্রপাগেশন অ্যালগরিদমে সাহায্য করে।

Sigmoid Formula:

$\sigma(x) = \frac{1}{1 + e^{-x}}$

নেট পজিটিভ ইনপুট: সিগময়েডের আউটপুট ১ এর কাছে চলে আসে।
নেট নেগেটিভ ইনপুট: সিগময়েডের আউটপুট ০ এর কাছে চলে আসে।

Sigmoid ফাংশন ব্যবহারের সুবিধা:

ছোট এবং মাঝারি আকারের ডেটার জন্য কার্যকর।
আউটপুটকে ০ থেকে ১ এর মধ্যে সীমাবদ্ধ রাখে।

Sigmoid উদাহরণ (Python / CNTK):

import cntk as c

# ইনপুট ভেরিয়েবল
input_var = c.input_variable(2)

# Sigmoid অ্যাকটিভেশন ফাংশন
sigmoid_layer = c.sigmoid(input_var)

৩. Softmax Activation Function

Softmax ফাংশন একটি নরমাকৃত আউটপুট দেয় এবং এটি সাধারণত মাল্টি-ক্লাস ক্লাসিফিকেশন সমস্যায় ব্যবহৃত হয়। এটি ইনপুট ডেটার মানগুলোকে ০ থেকে ১ এর মধ্যে রূপান্তরিত করে, যাতে তাদের সমষ্টি ১ হয়। এটি প্রতিটি ক্লাসের জন্য প্রোবাবিলিটি প্রদান করে, যা পরবর্তী পর্যায়ে সর্বাধিক প্রোবাবিলিটির ক্লাস নির্বাচন করতে সহায়ক।

Softmax Formula:

$\text{Softmax}(x_i) = \frac{e^{x_i}}{\sum_{j=1}^K e^{x_j}}$

এখানে, $x_i$ হল ইনপুটের $i$ -তম ভ্যালু এবং $K$ হল আউটপুট ক্লাসের সংখ্যা।

Softmax বিভিন্ন ক্লাসের মধ্যে সবচেয়ে সম্ভাব্য ক্লাসকে চিহ্নিত করে, যেখানে সকল আউটপুট যোগফলে ১ সমান থাকে।

Softmax উদাহরণ (Python / CNTK):

import cntk as c

# ইনপুট ভেরিয়েবল
input_var = c.input_variable(4)

# Softmax অ্যাকটিভেশন ফাংশন
softmax_layer = c.softmax(input_var)

সারাংশ

Dense Layer হল নিউরাল নেটওয়ার্কের একটি গুরুত্বপূর্ণ লেয়ার, যেখানে ইনপুট এবং আউটপুট নিউরনের মধ্যে সম্পূর্ণ সংযোগ থাকে। এটি গাণিতিক অপারেশন দ্বারা আউটপুট তৈরি করে এবং এটি নিউরাল নেটওয়ার্কের মূল অংশ।
Activation Functions (যেমন ReLU, Sigmoid, এবং Softmax) নিউরাল নেটওয়ার্কের আউটপুট নির্ধারণ করে।
- ReLU আউটপুটকে ০ বা ইনপুটের মতো রাখে, যা দ্রুত শিখন নিশ্চিত করে।
- Sigmoid বাইনারি আউটপুটে ব্যবহার করা হয় এবং এটি ০ থেকে ১ মধ্যে মান প্রদান করে।
- Softmax মাল্টি-ক্লাস সমস্যার জন্য ব্যবহৃত হয় এবং এটি আউটপুটকে প্রোবাবিলিটি আকারে রূপান্তরিত করে।

এই Activation Functions গুলি একটি মডেলকে non-linear করে তোলে, যাতে এটি জটিল প্যাটার্ন এবং সম্পর্ক শিখতে সক্ষম হয়।

Content added By

Azizar Rahman Aziz

মডেল Compile, Train, এবং Evaluate করা

290

CNTK-এ মডেল Compile, Train, এবং Evaluate করার প্রক্রিয়া ডিপ লার্নিং মডেল তৈরির মূল অংশ। এই প্রক্রিয়াগুলির মাধ্যমে মডেল তৈরি করা, প্রশিক্ষণ দেওয়া এবং এর কর্মক্ষমতা মূল্যায়ন করা হয়। এখানে প্রতিটি পদক্ষেপের বিস্তারিত আলোচনা করা হলো:

১. মডেল Compile (মডেল কম্পাইল করা)

Model Compile এর মানে হল মডেল তৈরি করার পর অপ্টিমাইজার এবং লস ফাংশন নির্বাচন করা। মডেলটি compiling করার সময় loss function এবং optimizer নির্ধারণ করতে হয়, যা মডেলটির শিক্ষার (training) প্রক্রিয়া চালনা করবে।

মডেল কম্পাইল করার পদক্ষেপ:

লস ফাংশন (Loss Function): এটি মডেল প্রশিক্ষণের সময় ভুল (error) পরিমাপ করে এবং প্রশিক্ষণ ডেটা অনুযায়ী মডেলকে আপডেট করতে সহায়তা করে।
অপ্টিমাইজার (Optimizer): অপ্টিমাইজার হল একটি অ্যালগরিদম যা লস ফাংশনের আউটপুট থেকে গ্রেডিয়েন্ট ব্যবহার করে মডেল প্যারামিটার আপডেট করে।

CNTK-এ মডেল কম্পাইল করা:

import cntk

# ইনপুট এবং আউটপুট ভেরিয়েবল তৈরি
input_var = cntk.input_variable(2)
output_var = cntk.input_variable(1)

# মডেল তৈরি (যেমন একটি সহজ রিগ্রেশন মডেল)
model = cntk.ops.times(input_var, output_var)

# লস ফাংশন (যেমন Mean Squared Error)
loss = cntk.ops.squared_error(model, output_var)

# অপ্টিমাইজার (যেমন SGD)
optimizer = cntk.adam(model.parameters)

# মডেল কম্পাইল করা
trainer = cntk.Trainer(model, loss, optimizer)

২. মডেল Train (মডেল প্রশিক্ষণ)

Model Training হল মডেলটি ইনপুট ডেটা ব্যবহার করে প্রশিক্ষণ দেওয়ার প্রক্রিয়া, যাতে মডেল তার প্যারামিটারগুলি (ওজন, বায়াস) ঠিকভাবে আপডেট করতে শিখে।

মডেল প্রশিক্ষণের জন্য প্রয়োজনীয় পদক্ষেপ:

ডেটা প্রস্তুতি (Data Preparation): প্রশিক্ষণ ডেটা (training data) প্রস্তুত করতে হবে, যেমন ইনপুট ডেটা এবং আউটপুট লেবেল (labels)।
ফিডফরওয়ার্ড (Forward Pass): ডেটা মডেলের মাধ্যমে পাঠানো হয় এবং আউটপুট পাওয়া যায়।
ব্যাকপ্রপাগেশন (Backpropagation): ভুল (error) প্রক্ষেপণ করা হয় এবং গ্রেডিয়েন্ট গণনা করা হয়, যা প্যারামিটার আপডেট করতে ব্যবহৃত হয়।
অপ্টিমাইজেশন: অপ্টিমাইজার ব্যবহার করে প্যারামিটার আপডেট করা হয়।

CNTK-এ মডেল প্রশিক্ষণ:

# ইনপুট ডেটা তৈরি
training_data = cntk.input_variable(2)
training_labels = cntk.input_variable(1)

# মডেল প্রশিক্ষণ
for epoch in range(epochs):
    trainer.train_minibatch({input_var: training_data, output_var: training_labels})
    print(f"Epoch {epoch}, Loss: {trainer.previous_minibatch_loss}")

এই কোডটি প্রতিটি epoch এর জন্য প্রশিক্ষণ চালাবে এবং লস (error) মাপবে।

৩. মডেল Evaluate (মডেল মূল্যায়ন)

Model Evaluation হল মডেল প্রশিক্ষণ শেষ হওয়ার পর তার কর্মক্ষমতা মূল্যায়ন করার প্রক্রিয়া, সাধারণত টেস্ট ডেটা (test data) ব্যবহার করে। এটি মডেলের সাধারিতার (generalization) ক্ষমতা যাচাই করতে সহায়ক।

মডেল মূল্যায়নের জন্য প্রয়োজনীয় পদক্ষেপ:

টেস্ট ডেটা: প্রশিক্ষণের সময় ব্যবহৃত ডেটার বাইরে নতুন ডেটা ব্যবহার করা হয়, যার মাধ্যমে মডেলটি কতটা ভালো কাজ করছে তা মূল্যায়ন করা হয়।
মেট্রিক্স (Metrics): বিভিন্ন ধরনের মেট্রিক্স যেমন accuracy, precision, recall, F1-score ইত্যাদি ব্যবহার করে মডেলের কার্যকারিতা পরিমাপ করা হয়।

CNTK-এ মডেল মূল্যায়ন:

# টেস্ট ডেটা প্রস্তুতি
test_data = cntk.input_variable(2)
test_labels = cntk.input_variable(1)

# মডেল মূল্যায়ন
test_loss = trainer.test_minibatch({input_var: test_data, output_var: test_labels})
print(f"Test Loss: {test_loss}")

এটি মডেলটির টেস্ট ডেটার উপর মূল্যায়ন করবে এবং লস প্রদান করবে। অন্যান্য মূল্যায়ন মেট্রিক্স যেমন accuracy বা অন্যান্য নির্দিষ্ট মেট্রিক্সও ব্যবহার করা যেতে পারে।

সারাংশ

মডেল কম্পাইল (Compile): মডেল কম্পাইল করার সময় লস ফাংশন এবং অপ্টিমাইজার নির্বাচন করা হয়, যা প্রশিক্ষণের সময় মডেল প্যারামিটার আপডেট করতে সহায়ক।
মডেল প্রশিক্ষণ (Train): প্রশিক্ষণ প্রক্রিয়ায় ইনপুট ডেটা ব্যবহার করে মডেলকে শিখানো হয় এবং অপ্টিমাইজেশন এবং ব্যাকপ্রপাগেশন প্রক্রিয়া সম্পন্ন হয়।
মডেল মূল্যায়ন (Evaluate): প্রশিক্ষণের পরে, টেস্ট ডেটার উপর মডেলটির কর্মক্ষমতা মূল্যায়ন করা হয়।

এই তিনটি পদক্ষেপ—Compile, Train, এবং Evaluate—একটি ডিপ লার্নিং মডেল তৈরির মূল উপাদান, যা মডেলটির কার্যক্ষমতা বাড়ানোর জন্য অত্যন্ত গুরুত্বপূর্ণ।

Content added By

Azizar Rahman Aziz

Training এবং Testing এর জন্য Loss Function এবং Optimizer নির্বাচন

295

Training এবং Testing পর্যায়ে Loss Function এবং Optimizer নির্বাচন ডিপ লার্নিং মডেল তৈরি এবং প্রশিক্ষণ প্রক্রিয়ায় অত্যন্ত গুরুত্বপূর্ণ। এটি মডেলের কার্যকারিতা, শিক্ষার গতি, এবং সঠিকতা নির্ধারণে সহায়ক। এখানে আমি Loss Function এবং Optimizer সম্পর্কে ব্যাখ্যা করব এবং CNTK-এ এদের নির্বাচন কিভাবে করবেন তা বিস্তারিতভাবে আলোচনা করব।

Loss Function (হানি ফাংশন)

Loss Function হল একটি গাণিতিক ফাংশন যা মডেল প্রশিক্ষণের সময় মডেলের আউটপুট এবং বাস্তব আউটপুটের মধ্যে ত্রুটি বা "হানি" গণনা করে। এটি মডেলকে সঠিক ফলাফল প্রাপ্তির জন্য শিখতে সাহায্য করে। Training পর্যায়ে, Loss Function ব্যবহার করা হয় যাতে মডেল তার ভবিষ্যদ্বাণীগুলির মধ্যে ত্রুটি কমাতে পারে।

Loss Function এর ধরন:

Mean Squared Error (MSE): এটি রেগ্রেশন সমস্যা সমাধানে ব্যবহৃত হয়, যেখানে প্রতিটি পয়েন্টের জন্য ত্রুটি বা "এরর" এর বর্গ গুণ করা হয়। এটি সাধারণত রিগ্রেশন মডেলগুলিতে ব্যবহৃত হয়।
- ফাংশন: $L = \frac{1}{n} \sum_{i=1}^{n} (y_{i} - \hat{y_{i}})^{2}$
- ব্যবহার: রিগ্রেশন টাস্ক।
Cross-Entropy Loss (Categorical Cross-Entropy): এটি শ্রেণীবিভাগ (classification) সমস্যার জন্য ব্যবহৃত হয়। এটি প্রকৃত লেবেল এবং মডেলের পূর্বাভাসের মধ্যে ক্রস-এন্ট্রপি গণনা করে।
- ফাংশন: $L = - \sum_{i=1}^{n} y_{i} \log(\hat{y_{i}})$
- ব্যবহার: ক্লাসিফিকেশন টাস্ক।
Binary Cross-Entropy Loss: এটি বাইনারি ক্লাসিফিকেশন সমস্যায় ব্যবহৃত হয়, যেখানে দুটি ক্লাস রয়েছে (যেমন, হ্যাঁ বা না, সত্যি বা মিথ্যা)।
- ফাংশন: $L = - \left( y \log(\hat{y}) + (1 - y) \log(1 - \hat{y}) \right)$
- ব্যবহার: বাইনারি ক্লাসিফিকেশন।
Hinge Loss: এটি সাপোর্ট ভেক্টর মেশিন (SVM) এবং অন্যান্য মার্জিন ভিত্তিক শ্রেণীবিভাগের জন্য ব্যবহৃত হয়।
- ফাংশন: $L = \max(0, 1 - y \cdot \hat{y})$
- ব্যবহার: মার্জিন ভিত্তিক ক্লাসিফিকেশন (যেমন, SVM)।

CNTK-এ Loss Function নির্বাচন:

CNTK তে Loss Function নির্বাচন করতে, আপনি cntk.ops প্যাকেজের মধ্যে উপলব্ধ বিভিন্ন loss function ব্যবহার করতে পারেন। উদাহরণস্বরূপ:

Cross-Entropy Loss:

loss = cntk.cross_entropy_with_softmax(output, target)

Mean Squared Error:

loss = cntk.squared_error(output, target)

Optimizer (অপ্টিমাইজার)

Optimizer হল একটি অ্যালগরিদম যা মডেলের প্যারামিটারগুলির (যেমন, ওজন বা weights) মান আপডেট করে, যাতে Loss Function এর মান কমানো যায় এবং মডেলটি আরও সঠিকভাবে কাজ করতে পারে। Training পর্যায়ে, Optimizer ব্যবহার করা হয় যাতে মডেল তার প্যারামিটারগুলোকে সঠিকভাবে আপডেট করে।

Optimizer এর ধরন:

Stochastic Gradient Descent (SGD): এটি সবচেয়ে সাধারণ অপ্টিমাইজার, যা মডেলের প্যারামিটার আপডেট করতে গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম ব্যবহার করে। এটি শুধুমাত্র একটি ছোট অংশ (ব্যাচ) এর মাধ্যমে গ্রেডিয়েন্ট ক্যালকুলেট করে এবং প্যারামিটার আপডেট করে।
- ফাংশন: $\theta = \theta - \eta \nabla_\theta J(\theta)$
- ব্যবহার: সাধারণত সস্তা, কিন্তু ধীর।
Momentum (মোমেন্টাম): এটি SGD এর একটি সংস্করণ, যেখানে পূর্ববর্তী গ্রেডিয়েন্টের গতি ব্যবহার করে আরও দ্রুত convergence এর জন্য আপডেট করা হয়। এটি স্থানীয় মিনি-ইউটারেন্স (local minima) থেকে বের হতে সাহায্য করে।
- ফাংশন: $v_t = \beta v_{t-1} + (1 - \beta) \nabla_\theta J(\theta)$
- ব্যবহার: দ্রুত convergence এবং স্থানীয় minima তে আটকে পড়া প্রতিরোধ করে।
Adam (Adaptive Moment Estimation): এটি SGD এবং Momentum এর সমন্বয়, যা শিখন হার (learning rate) এবং গ্রেডিয়েন্টের মোমেন্টাম অ্যাডাপ্টিভভাবে কাস্টমাইজ করে। এটি সাধারণত ডিপ লার্নিং মডেলগুলির জন্য খুব ভালো কাজ করে।
- ফাংশন: $\theta = \theta - \eta \frac{m_t}{\sqrt{v_t} + \epsilon}$
- ব্যবহার: খুব দ্রুত convergence, শিখন হার অ্যাডাপ্টিভ।
Adagrad: এটি একটি অ্যাডাপ্টিভ অপ্টিমাইজার যা প্রতিটি প্যারামিটারের জন্য আলাদা শিখন হার ব্যবহার করে, যার ফলে কম-সদৃশ ডেটাতে খুব ভালো কাজ করে।
- ফাংশন: $\theta = \theta - \frac{\eta}{\sqrt{G_t} + \epsilon} \nabla_\theta J(\theta)$
- ব্যবহার: কম শিখন হার এবং ডেটার অ্যাডাপ্টিভ প্রকৃতির জন্য উপযুক্ত।

CNTK-এ Optimizer নির্বাচন:

CNTK তে আপনি cntk.train প্যাকেজ ব্যবহার করে বিভিন্ন অপ্টিমাইজার ব্যবহার করতে পারেন:

SGD (Stochastic Gradient Descent):
```
learner = cntk.sgd(learning_rate=0.01)
```

Adam Optimizer:

learner = cntk.adam(learning_rate=0.01, momentum=0.9)

Loss Function এবং Optimizer নির্বাচন করার সময় কিসে লক্ষ্য রাখতে হবে:

Loss Function:
- Classification সমস্যা সমাধান করতে Cross-Entropy Loss সবচেয়ে উপযুক্ত।
- Regression সমস্যা সমাধান করতে Mean Squared Error (MSE) ব্যবহার করা হয়।
- Binary classification জন্য Binary Cross-Entropy Loss বা Hinge Loss উপযুক্ত।
Optimizer:
- SGD সাধারণত ছোট বা মডারেট আকারের মডেল বা ডেটাসেটের জন্য ভাল কাজ করে।
- Adam এবং Momentum বড় এবং জটিল মডেলগুলির জন্য ভালো, কারণ তারা দ্রুত converge করতে সাহায্য করে এবং স্থানীয় minima তে আটকে পড়তে বাধা দেয়।

সারাংশ

Loss Function এবং Optimizer মডেল ট্রেনিং প্রক্রিয়ার মূল অংশ। Loss Function মডেলের ত্রুটি নির্ধারণ করে এবং Optimizer সেই ত্রুটির ভিত্তিতে প্যারামিটার আপডেট করে।
Loss Function নির্বাচন করতে হবে মডেলের কাজের ধরন অনুযায়ী (যেমন, Cross-Entropy ক্লাসিফিকেশন এবং MSE রিগ্রেশন সমস্যা জন্য)।
Optimizer নির্বাচন করতে হবে মডেলের আকার এবং ডেটাসেটের জটিলতার উপর ভিত্তি করে, যেমন Adam বা SGD বড় বা ছোট ডেটাসেটের জন্য উপযুক্ত হতে পারে।

Content added By

Azizar Rahman Aziz

Microsoft Cognitive Toolkit (CNTK) পরিচিতি CNTK ইনস্টলেশন এবং সেটআপ CNTK এর মৌলিক ধারণা Data Preprocessing এবং Loading Convolutional Neural Networks (CNN) তৈরি করা

CNTK তে বেসিক মডেল তৈরি

CNTK তে বেসিক মডেল তৈরি

১. লাইব্রেরি এবং ইনপুট ডেটা প্রস্তুতি

২. মডেল তৈরি করা

৩. লস ফাংশন এবং অপ্টিমাইজেশন

৪. মডেল প্রশিক্ষণ

৫. মডেল পরীক্ষা (Prediction)

৬. পূর্ণ কোড

সারাংশ

Sequential মডেল তৈরি করা

CNTK তে Sequential মডেল তৈরি করা

১. CNTK ইনস্টলেশন

২. Python কোডের মাধ্যমে Sequential মডেল তৈরি করা

Sequential মডেল তৈরির উপাদানসমূহ:

Training মডেল

সারাংশ

Dense লেয়ার এবং Activation Functions (ReLU, Sigmoid, Softmax)

Dense Layer (Fully Connected Layer)

Dense Layer উদাহরণ (Python / CNTK):

Activation Functions (এ্যাকটিভেশন ফাংশন)

১. ReLU (Rectified Linear Unit)

ReLU উদাহরণ (Python / CNTK):

২. Sigmoid Activation Function

Sigmoid উদাহরণ (Python / CNTK):

৩. Softmax Activation Function

Softmax উদাহরণ (Python / CNTK):

সারাংশ

মডেল Compile, Train, এবং Evaluate করা

১. মডেল Compile (মডেল কম্পাইল করা)

মডেল কম্পাইল করার পদক্ষেপ:

CNTK-এ মডেল কম্পাইল করা:

২. মডেল Train (মডেল প্রশিক্ষণ)

মডেল প্রশিক্ষণের জন্য প্রয়োজনীয় পদক্ষেপ:

CNTK-এ মডেল প্রশিক্ষণ:

৩. মডেল Evaluate (মডেল মূল্যায়ন)

মডেল মূল্যায়নের জন্য প্রয়োজনীয় পদক্ষেপ:

CNTK-এ মডেল মূল্যায়ন:

সারাংশ

Training এবং Testing এর জন্য Loss Function এবং Optimizer নির্বাচন

Loss Function (হানি ফাংশন)

Loss Function এর ধরন:

CNTK-এ Loss Function নির্বাচন:

Optimizer (অপ্টিমাইজার)

Optimizer এর ধরন:

CNTK-এ Optimizer নির্বাচন:

Loss Function এবং Optimizer নির্বাচন করার সময় কিসে লক্ষ্য রাখতে হবে:

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!