Machine Learning Hyperplane এবং Margin এর ধারণা গাইড ও নোট

383

হাইপারপ্লেন এবং মার্জিন দুটি গুরুত্বপূর্ণ ধারণা সাপোর্ট ভেক্টর মেশিন (Support Vector Machine - SVM) অ্যালগরিদমে, যা ক্লাসিফিকেশন সমস্যা সমাধানের জন্য ব্যবহৃত হয়। এই ধারণাগুলি মডেলটিকে সিদ্ধান্ত নিতে সহায়ক হয়, বিশেষ করে দ্বৈত শ্রেণী (binary classification) সমস্যা সমাধানে।


হাইপারপ্লেন (Hyperplane)

হাইপারপ্লেন হলো একটি সমতল (flat) যে পরিসরে একটি nn-মাত্রিক স্থানকে দুটি ভিন্ন অংশে বিভক্ত করে। সাধারণভাবে, একটি nn-মাত্রিক স্পেসে একটি হাইপারপ্লেন একটি (n1)(n-1)-মাত্রিক উপবিভাগ (subspace) হিসেবে কাজ করে।

  • ২-মাত্রিক স্পেসে (2D): হাইপারপ্লেন হলো একটি রেখা (line)।
  • ৩-মাত্রিক স্পেসে (3D): হাইপারপ্লেন হলো একটি সমতল (plane)।
  • nn-মাত্রিক স্পেসে (nD): হাইপারপ্লেন হলো একটি (n1)(n-1)-মাত্রিক সারণী বা সমতল।

সাপোর্ট ভেক্টর মেশিন (SVM) মডেলে, হাইপারপ্লেনটি সেই সমতল বা রেখা যা ইনপুট ডেটাকে দুটি শ্রেণীতে বিভক্ত করে। এই প্লেনের এক পাশে একটি শ্রেণী এবং অন্য পাশে আরেকটি শ্রেণী থাকবে।

উদাহরণ:

ধরা যাক, আপনি একটি দ্বৈত শ্রেণী (binary classification) সমস্যায় কাজ করছেন, যেখানে একটি কুকুর এবং একটি বিড়াল চিত্রের মধ্যে পার্থক্য করতে হবে। হাইপারপ্লেন হলো এমন একটি রেখা যা কুকুর এবং বিড়ালের চিত্রগুলিকে স্পষ্টভাবে দুটি শ্রেণীতে আলাদা করে।

হাইপারপ্লেনের সূত্র:

  • হাইপারপ্লেনের সাধারণ সমীকরণ হলো:

wx+b=0w \cdot x + b = 0

এখানে,

  • ww হলো হাইপারপ্লেনের সমতল নির্দেশক ভেক্টর।
  • xx হলো ইনপুট বৈশিষ্ট্য।
  • bb হলো বায়াস (bias) টার্ম, যা হাইপারপ্লেনের স্থান নির্ধারণে সহায়ক।

মার্জিন (Margin)

মার্জিন হলো হাইপারপ্লেন এবং শ্রেণীভুক্ত সাপোর্ট ভেক্টরের মধ্যে দূরত্ব। সাপোর্ট ভেক্টর হলো সেই ডেটা পয়েন্টগুলি যা হাইপারপ্লেনের সবচেয়ে কাছাকাছি থাকে এবং শ্রেণী বিভাজন করার জন্য অত্যন্ত গুরুত্বপূর্ণ।

SVM-এ, আমাদের লক্ষ্য হল এমন একটি হাইপারপ্লেন খুঁজে বের করা যা শ্রেণীভুক্ত ডেটা পয়েন্টগুলির জন্য সবচেয়ে বড় মার্জিন প্রদান করে। এর মানে হলো, আমরা সেই হাইপারপ্লেনটি খুঁজে বের করতে চাই যা সাপোর্ট ভেক্টরগুলির সাথে সবচেয়ে বড় দূরত্বে থাকে, যাতে এটি নতুন ডেটার জন্য সর্বোত্তম ভবিষ্যদ্বাণী করতে পারে।

মার্জিনের সূত্র:

  • মার্জিনের দৈর্ঘ্য হলো:

2w\frac{2}{\|w\|}

এখানে,

  • ww হলো হাইপারপ্লেনের ওজন ভেক্টর (weight vector)।

SVM-এ হাইপারপ্লেন এবং মার্জিনের গুরুত্ব

  1. বৃহত্তম মার্জিনের জন্য SVM: SVM একটি মৌলিক ধারণা হিসাবে মার্জিনের সাইজ সর্বাধিক করতে চায়। বৃহত্তম মার্জিনের হাইপারপ্লেন সাধারণত নতুন ডেটার জন্য সবচেয়ে ভাল শ্রেণীভুক্তকরণ ফলাফল দেয়। এটি "ম্যাক্সিমাম মার্জিন ক্লাসিফায়ার" (Maximum Margin Classifier) নামে পরিচিত।
  2. সাপোর্ট ভেক্টর: যেহেতু মার্জিনের দৈর্ঘ্য কমানোর জন্য প্রয়োজনীয় সাপোর্ট ভেক্টরগুলিই সবচেয়ে গুরুত্বপূর্ণ, সুতরাং অন্য ডেটা পয়েন্টগুলি মডেলের জন্য তেমন প্রভাব ফেলে না। এই কারণে, SVM অনেক সময় শক্তিশালী এবং ভাল সাধারণীকরণ ক্ষমতা (generalization power) প্রদান করে।

উপসংহার

  • হাইপারপ্লেন হলো সেই রেখা বা সমতল যা ডেটাকে দুটি শ্রেণীতে বিভক্ত করে।
  • মার্জিন হলো হাইপারপ্লেন এবং শ্রেণীভুক্ত সাপোর্ট ভেক্টরের মধ্যে দূরত্ব, এবং SVM এর লক্ষ্য একটি বৃহত্তম মার্জিনের হাইপারপ্লেন খুঁজে বের করা।
  • সাপোর্ট ভেক্টর মেশিনের মূল উদ্দেশ্য হলো একটি হাইপারপ্লেন নির্বাচন করা যা মার্জিনের দৈর্ঘ্য সর্বাধিক করে এবং সঠিক ক্লাসিফিকেশন নিশ্চিত করে।
Content added By
Promotion

Are you sure to start over?

Loading...