Hyperplane এবং Margin এর ধারণা

Support Vector Machine (SVM) - মেশিন লার্নিং (Machine Learning) - Machine Learning

471

হাইপারপ্লেন এবং মার্জিন দুটি গুরুত্বপূর্ণ ধারণা সাপোর্ট ভেক্টর মেশিন (Support Vector Machine - SVM) অ্যালগরিদমে, যা ক্লাসিফিকেশন সমস্যা সমাধানের জন্য ব্যবহৃত হয়। এই ধারণাগুলি মডেলটিকে সিদ্ধান্ত নিতে সহায়ক হয়, বিশেষ করে দ্বৈত শ্রেণী (binary classification) সমস্যা সমাধানে।

হাইপারপ্লেন (Hyperplane)

হাইপারপ্লেন হলো একটি সমতল (flat) যে পরিসরে একটি $n$ -মাত্রিক স্থানকে দুটি ভিন্ন অংশে বিভক্ত করে। সাধারণভাবে, একটি $n$ -মাত্রিক স্পেসে একটি হাইপারপ্লেন একটি $(n-1)$ -মাত্রিক উপবিভাগ (subspace) হিসেবে কাজ করে।

২-মাত্রিক স্পেসে (2D): হাইপারপ্লেন হলো একটি রেখা (line)।
৩-মাত্রিক স্পেসে (3D): হাইপারপ্লেন হলো একটি সমতল (plane)।
$n$ -মাত্রিক স্পেসে (nD): হাইপারপ্লেন হলো একটি $(n-1)$ -মাত্রিক সারণী বা সমতল।

সাপোর্ট ভেক্টর মেশিন (SVM) মডেলে, হাইপারপ্লেনটি সেই সমতল বা রেখা যা ইনপুট ডেটাকে দুটি শ্রেণীতে বিভক্ত করে। এই প্লেনের এক পাশে একটি শ্রেণী এবং অন্য পাশে আরেকটি শ্রেণী থাকবে।

উদাহরণ:

ধরা যাক, আপনি একটি দ্বৈত শ্রেণী (binary classification) সমস্যায় কাজ করছেন, যেখানে একটি কুকুর এবং একটি বিড়াল চিত্রের মধ্যে পার্থক্য করতে হবে। হাইপারপ্লেন হলো এমন একটি রেখা যা কুকুর এবং বিড়ালের চিত্রগুলিকে স্পষ্টভাবে দুটি শ্রেণীতে আলাদা করে।

হাইপারপ্লেনের সূত্র:

হাইপারপ্লেনের সাধারণ সমীকরণ হলো:

$w \cdot x + b = 0$

এখানে,

$w$ হলো হাইপারপ্লেনের সমতল নির্দেশক ভেক্টর।
$x$ হলো ইনপুট বৈশিষ্ট্য।
$b$ হলো বায়াস (bias) টার্ম, যা হাইপারপ্লেনের স্থান নির্ধারণে সহায়ক।

মার্জিন (Margin)

মার্জিন হলো হাইপারপ্লেন এবং শ্রেণীভুক্ত সাপোর্ট ভেক্টরের মধ্যে দূরত্ব। সাপোর্ট ভেক্টর হলো সেই ডেটা পয়েন্টগুলি যা হাইপারপ্লেনের সবচেয়ে কাছাকাছি থাকে এবং শ্রেণী বিভাজন করার জন্য অত্যন্ত গুরুত্বপূর্ণ।

SVM-এ, আমাদের লক্ষ্য হল এমন একটি হাইপারপ্লেন খুঁজে বের করা যা শ্রেণীভুক্ত ডেটা পয়েন্টগুলির জন্য সবচেয়ে বড় মার্জিন প্রদান করে। এর মানে হলো, আমরা সেই হাইপারপ্লেনটি খুঁজে বের করতে চাই যা সাপোর্ট ভেক্টরগুলির সাথে সবচেয়ে বড় দূরত্বে থাকে, যাতে এটি নতুন ডেটার জন্য সর্বোত্তম ভবিষ্যদ্বাণী করতে পারে।

মার্জিনের সূত্র:

মার্জিনের দৈর্ঘ্য হলো:

$\frac{2}{\|w\|}$

এখানে,

$w$ হলো হাইপারপ্লেনের ওজন ভেক্টর (weight vector)।

SVM-এ হাইপারপ্লেন এবং মার্জিনের গুরুত্ব

বৃহত্তম মার্জিনের জন্য SVM: SVM একটি মৌলিক ধারণা হিসাবে মার্জিনের সাইজ সর্বাধিক করতে চায়। বৃহত্তম মার্জিনের হাইপারপ্লেন সাধারণত নতুন ডেটার জন্য সবচেয়ে ভাল শ্রেণীভুক্তকরণ ফলাফল দেয়। এটি "ম্যাক্সিমাম মার্জিন ক্লাসিফায়ার" (Maximum Margin Classifier) নামে পরিচিত।
সাপোর্ট ভেক্টর: যেহেতু মার্জিনের দৈর্ঘ্য কমানোর জন্য প্রয়োজনীয় সাপোর্ট ভেক্টরগুলিই সবচেয়ে গুরুত্বপূর্ণ, সুতরাং অন্য ডেটা পয়েন্টগুলি মডেলের জন্য তেমন প্রভাব ফেলে না। এই কারণে, SVM অনেক সময় শক্তিশালী এবং ভাল সাধারণীকরণ ক্ষমতা (generalization power) প্রদান করে।

উপসংহার

হাইপারপ্লেন হলো সেই রেখা বা সমতল যা ডেটাকে দুটি শ্রেণীতে বিভক্ত করে।
মার্জিন হলো হাইপারপ্লেন এবং শ্রেণীভুক্ত সাপোর্ট ভেক্টরের মধ্যে দূরত্ব, এবং SVM এর লক্ষ্য একটি বৃহত্তম মার্জিনের হাইপারপ্লেন খুঁজে বের করা।
সাপোর্ট ভেক্টর মেশিনের মূল উদ্দেশ্য হলো একটি হাইপারপ্লেন নির্বাচন করা যা মার্জিনের দৈর্ঘ্য সর্বাধিক করে এবং সঠিক ক্লাসিফিকেশন নিশ্চিত করে।

Content added By

Azizar Rahman Aziz

SVM কী এবং এর ভূমিকা Linear এবং Non-linear SVM Kernel Functions (Linear, Polynomial, RBF)

Hyperplane এবং Margin এর ধারণা

হাইপারপ্লেন (Hyperplane)

উদাহরণ:

হাইপারপ্লেনের সূত্র:

মার্জিন (Margin)

মার্জিনের সূত্র:

SVM-এ হাইপারপ্লেন এবং মার্জিনের গুরুত্ব

উপসংহার

Promotion

Satt AI

Hi, আমি SATT AI!

Hyperplane এবং Margin এর ধারণা

হাইপারপ্লেন (Hyperplane)

উদাহরণ:

হাইপারপ্লেনের সূত্র:

মার্জিন (Margin)

মার্জিনের সূত্র:

SVM-এ হাইপারপ্লেন এবং মার্জিনের গুরুত্ব

উপসংহার

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!