L1 এবং L2 Regularization (Ridge এবং Lasso)

Regularization এবং Overfitting প্রতিরোধ - পাইথনে লজিস্টিক রিগ্রেশন (Logistic Regression in Python) - Machine Learning

405

Regularization হল একটি টেকনিক যা মডেলের জটিলতা নিয়ন্ত্রণ করতে ব্যবহৃত হয় এবং এটি মডেলটির ওভারফিটিং কমাতে সাহায্য করে। লিনিয়ার রিগ্রেশন বা অন্যান্য মেশিন লার্নিং অ্যালগরিদমে L1 এবং L2 Regularization দুইটি জনপ্রিয় পদ্ধতি। L1 Regularization কে Lasso এবং L2 Regularization কে Ridge বলা হয়। এই দুটি পদ্ধতি মডেলের ওজনের মান নিয়ন্ত্রণ করে যাতে মডেলটি সাধারণ এবং বেশি সাধারণীকৃত (generalized) হয়।


1. L1 Regularization (Lasso)

L1 Regularization বা Lasso (Least Absolute Shrinkage and Selection Operator) হল একটি পদ্ধতি যা লিনিয়ার রিগ্রেশন বা অন্য যেকোনো মডেলের উপর প্রয়োগ করা হয়। এটি ওজনের মান কমানোর জন্য লিনিয়ার রিগ্রেশন মডেলের লস ফাংশনে একটি অতিরিক্ত শর্ত যোগ করে, যা কিছু ফিচারের ওজন শূন্যে নিয়ে আসে। এর ফলে কিছু ফিচার বাদ পড়ে যায় এবং এটি ফিচার সিলেকশন হিসেবে কাজ করে।

L1 Regularization এর গাণিতিক রূপ:

লিনিয়ার রিগ্রেশন মডেলের জন্য সাধারণত লস ফাংশন হল:

J(θ)=12mi=1m(h(x(i))y(i))2J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2

এখন, L1 Regularization এর সাথে এটি পরিবর্তিত হয়:

J(θ)=12mi=1m(h(x(i))y(i))2+λj=1nθjJ(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2 + \lambda \sum_{j=1}^{n} |\theta_j|

এখানে:

  • λ\lambda হল Regularization Parameter বা শাস্তি মান, যা নির্ধারণ করে কতটা শাস্তি দেওয়া হবে।
  • θj\theta_j হল মডেলের ফিচারের জন্য ওজন।

L1 Regularization মডেলটিকে কিছু ফিচারের ওজন শূন্যে নিয়ে আসতে বাধ্য করে, যার ফলে ফিচার সিলেকশন হয় এবং এটি মডেলের অপ্রয়োজনীয় বা কম গুরুত্বপূর্ণ ফিচারগুলো সরিয়ে ফেলতে সাহায্য করে।


2. L2 Regularization (Ridge)

L2 Regularization বা Ridge হল একটি পদ্ধতি যা লিনিয়ার রিগ্রেশন মডেলের লস ফাংশনে অতিরিক্ত শর্ত যোগ করে। এটি ওজনের মান কমাতে সাহায্য করে তবে কখনো শূন্যে নিয়ে আসে না। এর পরিবর্তে, এটি সমস্ত ফিচারের ওজনের মান কমিয়ে দেয়, তবে তাদের কম গুরুত্বের ফিচারের কিছুটা অবদান রাখা হয়।

L2 Regularization এর গাণিতিক রূপ:

লিনিয়ার রিগ্রেশন মডেলের জন্য সাধারণ লস ফাংশন:

J(θ)=12mi=1m(h(x(i))y(i))2J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2

এখন, L2 Regularization এর সাথে এটি পরিবর্তিত হয়:

J(θ)=12mi=1m(h(x(i))y(i))2+λj=1nθj2J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h(x^{(i)}) - y^{(i)})^2 + \lambda \sum_{j=1}^{n} \theta_j^2

এখানে:

  • λ\lambda হল Regularization Parameter।
  • θj\theta_j হল মডেলের ফিচারের জন্য ওজন।

L2 Regularization ফিচারগুলির ওজনগুলোকে ছোট করে দেয় কিন্তু শূন্যের দিকে নিয়ে যায় না, ফলে সব ফিচারের কিছু পরিমাণ অবদান থাকে।


3. L1 vs L2 Regularization: পার্থক্য

বৈশিষ্ট্যL1 Regularization (Lasso)L2 Regularization (Ridge)
উদ্দেশ্যফিচার সিলেকশন (কিছু ফিচার বাদ দেয়)ফিচারের মান কমিয়ে আনে
ফিচার সিলেকশনহ্যাঁ, কিছু ফিচারের ওজন শূন্য হয়না, সমস্ত ফিচারের অবদান থাকে
ফিচারের শাস্তিফিচারের মান শূন্যে নিয়ে আসেফিচারের মান কমিয়ে দেয় তবে শূন্যে নিয়ে আসে না
মডেল কমপ্লেক্সিটিকমপ্লেক্সিটি হ্রাস পায়, কারণ কিছু ফিচার বাদ দেয়মডেলটি কম্প্যাক্ট থাকে, তবে সব ফিচারের অবদান রাখা হয়
ব্যবহারযখন কিছু ফিচার কম গুরুত্বপূর্ণযখন সব ফিচার গুরুত্বপূর্ণ এবং তাদের অবদান রাখা গুরুত্বপূর্ণ

4. Ridge এবং Lasso এর ব্যবহার:

  • Ridge Regression (L2 Regularization) ব্যবহার করা হয় যখন আপনার ডেটাতে বহু ফিচার থাকে এবং আপনি চান সব ফিচারের কিছু অবদান রাখা। এটি মডেলকে ওভারফিটিং থেকে রক্ষা করতে সাহায্য করে এবং পুরো ফিচার স্পেসের উপর কাজ করে।
  • Lasso Regression (L1 Regularization) ব্যবহার করা হয় যখন আপনি চান কিছু ফিচার বাদ দিতে। এটি মডেলকে ফিচার সিলেকশন করতে সহায়ক এবং মডেলটিকে আরো সাধারণীকৃত (generalized) করে তোলে।

5. ElasticNet Regularization:

যখন L1 এবং L2 এর সংমিশ্রণ প্রয়োজন হয়, তখন ElasticNet Regularization ব্যবহার করা হয়। এটি L1 এবং L2 Regularization এর সুবিধা একত্রিত করে এবং λ\lambda এবং α\alpha এর মান দ্বারা নিয়ন্ত্রিত হয়।


সারাংশ:

  • L1 Regularization (Lasso): ফিচার সিলেকশন করতে ব্যবহৃত হয়, কিছু ফিচার শূন্যে নিয়ে আসে।
  • L2 Regularization (Ridge): সমস্ত ফিচারের মান কমিয়ে আনে, তবে শূন্যে নিয়ে আসে না।
  • Ridge মডেলটির জটিলতা নিয়ন্ত্রণ করে এবং Lasso ফিচার সিলেকশন করতে সাহায্য করে।

এই দুটি টেকনিক মডেলের পারফরম্যান্স উন্নত করতে এবং ওভারফিটিং কমাতে সাহায্য করে, ডেটা ও মডেলের ধরণ অনুযায়ী সঠিক পদ্ধতি নির্বাচন করা গুরুত্বপূর্ণ।

Content added By
Promotion

Are you sure to start over?

Loading...