L1 এবং L2 Regularization (Ridge এবং Lasso)

Regularization এবং Overfitting প্রতিরোধ - পাইথনে লজিস্টিক রিগ্রেশন (Logistic Regression in Python) - Machine Learning

405

Regularization হল একটি টেকনিক যা মডেলের জটিলতা নিয়ন্ত্রণ করতে ব্যবহৃত হয় এবং এটি মডেলটির ওভারফিটিং কমাতে সাহায্য করে। লিনিয়ার রিগ্রেশন বা অন্যান্য মেশিন লার্নিং অ্যালগরিদমে L1 এবং L2 Regularization দুইটি জনপ্রিয় পদ্ধতি। L1 Regularization কে Lasso এবং L2 Regularization কে Ridge বলা হয়। এই দুটি পদ্ধতি মডেলের ওজনের মান নিয়ন্ত্রণ করে যাতে মডেলটি সাধারণ এবং বেশি সাধারণীকৃত (generalized) হয়।

1. L1 Regularization (Lasso)

L1 Regularization বা Lasso (Least Absolute Shrinkage and Selection Operator) হল একটি পদ্ধতি যা লিনিয়ার রিগ্রেশন বা অন্য যেকোনো মডেলের উপর প্রয়োগ করা হয়। এটি ওজনের মান কমানোর জন্য লিনিয়ার রিগ্রেশন মডেলের লস ফাংশনে একটি অতিরিক্ত শর্ত যোগ করে, যা কিছু ফিচারের ওজন শূন্যে নিয়ে আসে। এর ফলে কিছু ফিচার বাদ পড়ে যায় এবং এটি ফিচার সিলেকশন হিসেবে কাজ করে।

L1 Regularization এর গাণিতিক রূপ:

লিনিয়ার রিগ্রেশন মডেলের জন্য সাধারণত লস ফাংশন হল:

$J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2$

এখন, L1 Regularization এর সাথে এটি পরিবর্তিত হয়:

$J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2 + \lambda \sum_{j=1}^{n} |\theta_j|$

এখানে:

$\lambda$ হল Regularization Parameter বা শাস্তি মান, যা নির্ধারণ করে কতটা শাস্তি দেওয়া হবে।
$\theta_j$ হল মডেলের ফিচারের জন্য ওজন।

L1 Regularization মডেলটিকে কিছু ফিচারের ওজন শূন্যে নিয়ে আসতে বাধ্য করে, যার ফলে ফিচার সিলেকশন হয় এবং এটি মডেলের অপ্রয়োজনীয় বা কম গুরুত্বপূর্ণ ফিচারগুলো সরিয়ে ফেলতে সাহায্য করে।

2. L2 Regularization (Ridge)

L2 Regularization বা Ridge হল একটি পদ্ধতি যা লিনিয়ার রিগ্রেশন মডেলের লস ফাংশনে অতিরিক্ত শর্ত যোগ করে। এটি ওজনের মান কমাতে সাহায্য করে তবে কখনো শূন্যে নিয়ে আসে না। এর পরিবর্তে, এটি সমস্ত ফিচারের ওজনের মান কমিয়ে দেয়, তবে তাদের কম গুরুত্বের ফিচারের কিছুটা অবদান রাখা হয়।

L2 Regularization এর গাণিতিক রূপ:

লিনিয়ার রিগ্রেশন মডেলের জন্য সাধারণ লস ফাংশন:

$J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2$

এখন, L2 Regularization এর সাথে এটি পরিবর্তিত হয়:

$J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2 + \lambda \sum_{j=1}^{n} \theta_j^2$

এখানে:

$\lambda$ হল Regularization Parameter।
$\theta_j$ হল মডেলের ফিচারের জন্য ওজন।

L2 Regularization ফিচারগুলির ওজনগুলোকে ছোট করে দেয় কিন্তু শূন্যের দিকে নিয়ে যায় না, ফলে সব ফিচারের কিছু পরিমাণ অবদান থাকে।

3. L1 vs L2 Regularization: পার্থক্য

বৈশিষ্ট্য	L1 Regularization (Lasso)	L2 Regularization (Ridge)
উদ্দেশ্য	ফিচার সিলেকশন (কিছু ফিচার বাদ দেয়)	ফিচারের মান কমিয়ে আনে
ফিচার সিলেকশন	হ্যাঁ, কিছু ফিচারের ওজন শূন্য হয়	না, সমস্ত ফিচারের অবদান থাকে
ফিচারের শাস্তি	ফিচারের মান শূন্যে নিয়ে আসে	ফিচারের মান কমিয়ে দেয় তবে শূন্যে নিয়ে আসে না
মডেল কমপ্লেক্সিটি	কমপ্লেক্সিটি হ্রাস পায়, কারণ কিছু ফিচার বাদ দেয়	মডেলটি কম্প্যাক্ট থাকে, তবে সব ফিচারের অবদান রাখা হয়
ব্যবহার	যখন কিছু ফিচার কম গুরুত্বপূর্ণ	যখন সব ফিচার গুরুত্বপূর্ণ এবং তাদের অবদান রাখা গুরুত্বপূর্ণ

4. Ridge এবং Lasso এর ব্যবহার:

Ridge Regression (L2 Regularization) ব্যবহার করা হয় যখন আপনার ডেটাতে বহু ফিচার থাকে এবং আপনি চান সব ফিচারের কিছু অবদান রাখা। এটি মডেলকে ওভারফিটিং থেকে রক্ষা করতে সাহায্য করে এবং পুরো ফিচার স্পেসের উপর কাজ করে।
Lasso Regression (L1 Regularization) ব্যবহার করা হয় যখন আপনি চান কিছু ফিচার বাদ দিতে। এটি মডেলকে ফিচার সিলেকশন করতে সহায়ক এবং মডেলটিকে আরো সাধারণীকৃত (generalized) করে তোলে।

5. ElasticNet Regularization:

যখন L1 এবং L2 এর সংমিশ্রণ প্রয়োজন হয়, তখন ElasticNet Regularization ব্যবহার করা হয়। এটি L1 এবং L2 Regularization এর সুবিধা একত্রিত করে এবং $\lambda$ এবং $\alpha$ এর মান দ্বারা নিয়ন্ত্রিত হয়।

সারাংশ:

L1 Regularization (Lasso): ফিচার সিলেকশন করতে ব্যবহৃত হয়, কিছু ফিচার শূন্যে নিয়ে আসে।
L2 Regularization (Ridge): সমস্ত ফিচারের মান কমিয়ে আনে, তবে শূন্যে নিয়ে আসে না।
Ridge মডেলটির জটিলতা নিয়ন্ত্রণ করে এবং Lasso ফিচার সিলেকশন করতে সাহায্য করে।

এই দুটি টেকনিক মডেলের পারফরম্যান্স উন্নত করতে এবং ওভারফিটিং কমাতে সাহায্য করে, ডেটা ও মডেলের ধরণ অনুযায়ী সঠিক পদ্ধতি নির্বাচন করা গুরুত্বপূর্ণ।

Content added By

Azizar Rahman Aziz

Overfitting এর সমস্যা এবং এর সমাধান Regularization Parameter (C) এর ব্যবহার Regularization এর বাস্তব উদাহরণ

L1 এবং L2 Regularization (Ridge এবং Lasso)

1. L1 Regularization (Lasso)

L1 Regularization এর গাণিতিক রূপ:

2. L2 Regularization (Ridge)

L2 Regularization এর গাণিতিক রূপ:

3. L1 vs L2 Regularization: পার্থক্য

4. Ridge এবং Lasso এর ব্যবহার:

5. ElasticNet Regularization:

সারাংশ:

Promotion

Satt AI

Hi, আমি SATT AI!

L1 এবং L2 Regularization (Ridge এবং Lasso)

1. L1 Regularization (Lasso)

L1 Regularization এর গাণিতিক রূপ:

2. L2 Regularization (Ridge)

L2 Regularization এর গাণিতিক রূপ:

3. L1 vs L2 Regularization: পার্থক্য

4. Ridge এবং Lasso এর ব্যবহার:

5. ElasticNet Regularization:

সারাংশ:

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!