Logistic Regression

Machine Learning - মেশিন লার্নিং (Machine Learning)

183

লজিস্টিক রিগ্রেশন (Logistic Regression) একটি জনপ্রিয় মেশিন লার্নিং অ্যালগরিদম যা বিশেষভাবে ক্লাসিফিকেশন সমস্যার জন্য ব্যবহৃত হয়। এটি একটি সুপারভাইজড লার্নিং পদ্ধতি যা ইনপুট বৈশিষ্ট্য (features) থেকে আউটপুট ক্লাস (output class) প্রেডিক্ট করে। যদিও এটি "রিগ্রেশন" নামে পরিচিত, তবে এটি মূলত একটি ক্লাসিফিকেশন অ্যালগরিদম এবং এটি দ্বৈত শ্রেণী (binary classification) সমস্যাগুলির জন্য ব্যবহৃত হয়।

লজিস্টিক রিগ্রেশনের উদ্দেশ্য

লজিস্টিক রিগ্রেশন এমন একটি পদ্ধতি যা একটি প্রবাহ ফাংশন (sigmoid function) ব্যবহার করে সম্ভাবনা (probability) গণনা করে। এই অ্যালগরিদমটি প্রবাহের মাধ্যমে আউটপুট ক্লাসের সম্ভাবনা বের করে এবং পরে একটি সিদ্ধান্ত সীমা (decision boundary) তৈরি করে, যার মাধ্যমে বিভিন্ন ক্লাস চিহ্নিত করা হয়।

লজিস্টিক রিগ্রেশন কাজ করার পদ্ধতি:

লিনিয়ার রিগ্রেশন (Linear Regression) এর মতো প্রথমে, ইনপুট বৈশিষ্ট্যগুলির লিনিয়ার সমন্বয় (linear combination) গণনা করা হয়।
এরপর, এই সমন্বয়ে লজিস্টিক ফাংশন (sigmoid function) প্রয়োগ করা হয়, যা ফলাফলকে একটি সম্ভাবনা (probability) এর মধ্যে রূপান্তরিত করে।
লজিস্টিক ফাংশন (sigmoid function) এর সূত্র:
$σ(z)=11+e−z<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>σ</mi><mo stretchy="false">(</mo><mi>z</mi><mo stretchy="false">)</mo><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>−</mo><mi>z</mi></mrow></msup></mrow></mfrac></mrow><annotation encoding="application/x-tex">\sigma(z) = \frac{1}{1 + e^{-z}}</annotation></semantics></math>$
যেখানে $z = w 0 + w 1 x 1 + w 2 x 2 + . . . + w n x n <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>z</mi><mo>=</mo><msub><mi>w</mi><mn>0</mn></msub><mo>+</mo><msub><mi>w</mi><mn>1</mn></msub><msub><mi>x</mi><mn>1</mn></msub><mo>+</mo><msub><mi>w</mi><mn>2</mn></msub><msub><mi>x</mi><mn>2</mn></msub><mo>+</mo><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mo>+</mo><msub><mi>w</mi><mi>n</mi></msub><msub><mi>x</mi><mi>n</mi></msub></mrow><annotation encoding="application/x-tex">z = w_0 + w_1 x_1 + w_2 x_2 + ... + w_n x_n</annotation></semantics></math>$ এবং $w i <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><msub><mi>w</mi><mi>i</mi></msub></mrow><annotation encoding="application/x-tex">w_i</annotation></semantics></math>$ হলো প্রতিটি বৈশিষ্ট্যের ওজন (weights), $x i <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><msub><mi>x</mi><mi>i</mi></msub></mrow><annotation encoding="application/x-tex">x_i</annotation></semantics></math>$ হলো বৈশিষ্ট্য (features)।
আউটপুট: এই সম্ভাবনা $[0,1]$ এর মধ্যে থাকে, যার মানের উপর ভিত্তি করে সিদ্ধান্ত নেয়া হয়:
- যদি সম্ভাবনা 0.5 এর বেশি হয়, তবে মডেল "পজিটিভ" ক্লাস চিহ্নিত করবে (যেমন, "হ্যাঁ" বা "১")।
- যদি সম্ভাবনা 0.5 এর কম হয়, তবে মডেল "নেগেটিভ" ক্লাস চিহ্নিত করবে (যেমন, "না" বা "০")।

লজিস্টিক রিগ্রেশন-এর উদাহরণ:

ধরা যাক, আপনি একটি মডেল তৈরি করতে চান যা নির্ধারণ করবে একটি ইমেল স্প্যাম কি না। এর জন্য আপনি ইনপুট বৈশিষ্ট্য হিসেবে ইমেলের বিষয়বস্তু, প্রেরকের তথ্য ইত্যাদি ব্যবহার করতে পারেন। লজিস্টিক রিগ্রেশন মডেলটি এই বৈশিষ্ট্যগুলির ভিত্তিতে একটি সম্ভাবনা বের করবে যে, ইমেলটি স্প্যাম হতে পারে কিনা। এর পরে, এটি সিদ্ধান্ত নেবে যে ইমেলটি স্প্যাম (১) না নন-স্প্যাম (০)।

লজিস্টিক রিগ্রেশন মডেল প্রশিক্ষণ:

লজিস্টিক রিগ্রেশন মডেলটি লজিস্টিক লস ফাংশন (Logistic Loss Function) বা ক্রস-এন্ট্রপি (Cross-Entropy Loss) ব্যবহার করে প্রশিক্ষিত হয়, যা আউটপুট প্রেডিকশনের সঙ্গে প্রকৃত লেবেলের (actual label) পার্থক্য কমানোর চেষ্টা করে।

ক্রস-এন্ট্রপি লস ফাংশন:

$L(y,ˆy)=−(ylog(ˆy)+(1−y)log(1−ˆy))<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>L</mi><mo stretchy="false">(</mo><mi>y</mi><mo separator="true">,</mo><mover accent="true"><mi>y</mi><mo>^</mo></mover><mo stretchy="false">)</mo><mo>=</mo><mo>−</mo><mrow><mo fence="true">(</mo><mi>y</mi><mi>log</mi><mo>⁡</mo><mo stretchy="false">(</mo><mover accent="true"><mi>y</mi><mo>^</mo></mover><mo stretchy="false">)</mo><mo>+</mo><mo stretchy="false">(</mo><mn>1</mn><mo>−</mo><mi>y</mi><mo stretchy="false">)</mo><mi>log</mi><mo>⁡</mo><mo stretchy="false">(</mo><mn>1</mn><mo>−</mo><mover accent="true"><mi>y</mi><mo>^</mo></mover><mo stretchy="false">)</mo><mo fence="true">)</mo></mrow></mrow><annotation encoding="application/x-tex">L(y, \hat{y}) = - \left( y \log(\hat{y}) + (1 - y) \log(1 - \hat{y}) \right)</annotation></semantics></math>$

এখানে, $y <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>y</mi></mrow><annotation encoding="application/x-tex">y</annotation></semantics></math>$ হলো প্রকৃত আউটপুট (actual output), এবং $ˆy<math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mover accent="true"><mi>y</mi><mo>^</mo></mover></mrow><annotation encoding="application/x-tex">\hat{y}</annotation></semantics></math>$ হলো প্রেডিক্টেড সম্ভাবনা (predicted probability)।

লজিস্টিক রিগ্রেশনের বৈশিষ্ট্য:

সোজাসুজি (Simple): এটি একটি সোজাসুজি অ্যালগরিদম, যেখানে আউটপুট ক্লাসের জন্য একটি সম্ভাবনা বের করা হয়।
দ্বৈত শ্রেণী (Binary Classification): লজিস্টিক রিগ্রেশন সাধারণত দ্বৈত শ্রেণী সমস্যার জন্য ব্যবহৃত হয়, তবে একাধিক শ্রেণী নিয়ে কাজ করার জন্য মাল্টি-ক্লাস লজিস্টিক রিগ্রেশন (Multiclass Logistic Regression) ব্যবহার করা হয়।
বিশ্লেষণ (Interpretability): লজিস্টিক রিগ্রেশন মডেলটি অন্যান্য মডেলগুলির তুলনায় বেশ সহজভাবে ব্যাখ্যা করা যায়। মডেলের মধ্যে প্রতিটি বৈশিষ্ট্যের অবদান বুঝতে সহজ।
সম্ভাবনা প্রদান (Probability Output): লজিস্টিক রিগ্রেশন শুধুমাত্র একটি ক্লাস চিহ্নিত করে না, এটি একটি সম্ভাবনা প্রদান করে, যা মডেলটির নিশ্চিততা নির্দেশ করে।

লজিস্টিক রিগ্রেশন এর সীমাবদ্ধতা:

লিনিয়ার সম্পর্ক (Linear Relationship): এটি শুধুমাত্র তখন কার্যকরী, যখন ইনপুট বৈশিষ্ট্য এবং আউটপুটের মধ্যে একটি লিনিয়ার সম্পর্ক থাকে। যদি সম্পর্ক জটিল হয়, তবে এটি সঠিক ফলাফল নাও দিতে পারে।
আউটলায়ার প্রভাব (Outlier Sensitivity): লজিস্টিক রিগ্রেশন আউটলায়ারের প্রভাব হতে পারে, কারণ এটি লিনিয়ার মডেল এবং আউটলায়ারগুলি মডেলের ওপর অত্যধিক প্রভাব ফেলতে পারে।

লজিস্টিক রিগ্রেশন ব্যবহার:

স্প্যাম ইমেল শনাক্তকরণ: এটি ইমেলটি স্প্যাম কি না তা চিহ্নিত করতে ব্যবহার করা যেতে পারে।
ক্রেডিট স্কোর বিশ্লেষণ: একটি গ্রাহকের ঋণ গ্রহীতার সম্ভাবনা চিহ্নিত করতে।
রোগ নির্ণয়: একটি রোগের সম্ভাবনা পূর্বানুমান করতে।
মার্কেটিং: একটি গ্রাহকের পণ্য কিনতে আগ্রহী হওয়ার সম্ভাবনা চিহ্নিত করতে।

উপসংহার

লজিস্টিক রিগ্রেশন একটি শক্তিশালী এবং সহজ মেশিন লার্নিং অ্যালগরিদম যা দ্বৈত শ্রেণী (binary classification) সমস্যার জন্য কার্যকরী। এটি সম্ভবনা প্রদান করে, যা মডেলের সিদ্ধান্তের উপর দৃঢ়তা বুঝতে সাহায্য করে এবং মডেল ব্যাখ্যা করতে সহজ। তবে, এর কিছু সীমাবদ্ধতাও রয়েছে, যেমন লিনিয়ার সম্পর্কের প্রয়োজনীয়তা।

Content added By

Md Azizur Rahman

Logistic Regression এর ভূমিকা

263

লগিস্টিক রিগ্রেশন (Logistic Regression) একটি পরিসংখ্যানগত মডেল যা মূলত ক্লাসিফিকেশন সমস্যা সমাধানে ব্যবহৃত হয়। এটি একটি সুপারভাইজড লার্নিং অ্যালগরিদম যা ইনপুট বৈশিষ্ট্যগুলির উপর ভিত্তি করে কোন একটি নির্দিষ্ট শ্রেণীতে (class) কোন অবজেক্ট বা ইনপুটকে শ্রেণীভুক্ত করবে তা অনুমান করে। যদিও এর নাম "রিগ্রেশন" তবে এটি মূলত ক্লাসিফিকেশন সমস্যা সমাধান করতে ব্যবহৃত হয়।

লগিস্টিক রিগ্রেশন এর কাজের মূল ধারণা:

লগিস্টিক রিগ্রেশন একটি সিগময়েড ফাংশন (Sigmoid Function) ব্যবহার করে, যার মাধ্যমে ইনপুট ভ্যালুগুলির উপর ভিত্তি করে আউটপুটকে একটি সম্ভাব্যতা (probability) আকারে রূপান্তর করা হয়। সিগময়েড ফাংশনটি ইনপুট ডেটার উপর ভিত্তি করে একটি আউটপুট (0 থেকে 1 এর মধ্যে) প্রদান করে, যা কোনও অবজেক্টের কোন শ্রেণীতে (class) পড়বে তার সম্ভাবনা নির্দেশ করে।

১. লগিস্টিক রিগ্রেশন কীভাবে কাজ করে?

লগিস্টিক রিগ্রেশন কাজের জন্য প্রথমে একটি লিনিয়ার সমীকরণ ব্যবহার করে:

$z = b + w 1 x 1 + w 2 x 2 + . . . + w n x n <math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>z</mi><mo>=</mo><mi>b</mi><mo>+</mo><msub><mi>w</mi><mn>1</mn></msub><msub><mi>x</mi><mn>1</mn></msub><mo>+</mo><msub><mi>w</mi><mn>2</mn></msub><msub><mi>x</mi><mn>2</mn></msub><mo>+</mo><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mo>+</mo><msub><mi>w</mi><mi>n</mi></msub><msub><mi>x</mi><mi>n</mi></msub></mrow><annotation encoding="application/x-tex">z = b + w_1x_1 + w_2x_2 + ... + w_nx_n</annotation></semantics></math>$

এখানে:

$x 1, x 2, . . ., x n <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><msub><mi>x</mi><mn>1</mn></msub><mo separator="true">,</mo><msub><mi>x</mi><mn>2</mn></msub><mo separator="true">,</mo><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mo separator="true">,</mo><msub><mi>x</mi><mi>n</mi></msub></mrow><annotation encoding="application/x-tex">x_1, x_2, ..., x_n</annotation></semantics></math>$ হল ইনপুট বৈশিষ্ট্য।
$w 1, w 2, . . ., w n <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><msub><mi>w</mi><mn>1</mn></msub><mo separator="true">,</mo><msub><mi>w</mi><mn>2</mn></msub><mo separator="true">,</mo><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mi mathvariant="normal">.</mi><mo separator="true">,</mo><msub><mi>w</mi><mi>n</mi></msub></mrow><annotation encoding="application/x-tex">w_1, w_2, ..., w_n</annotation></semantics></math>$ হল সংশ্লিষ্ট কোঅফিসিয়েন্ট।
$b <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>b</mi></mrow><annotation encoding="application/x-tex">b</annotation></semantics></math>$ হল বায়াস বা ইন্টারসেপ্ট।

এটি একটি লিনিয়ার কম্বিনেশন তৈরি করে যা পরে সিগময়েড ফাংশনে (Logistic function) প্রবাহিত হয়, যাতে আউটপুটটি 0 থেকে 1 এর মধ্যে পরিণত হয়:

$σ(z)=11+e−z<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>σ</mi><mo stretchy="false">(</mo><mi>z</mi><mo stretchy="false">)</mo><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>−</mo><mi>z</mi></mrow></msup></mrow></mfrac></mrow><annotation encoding="application/x-tex">\sigma(z) = \frac{1}{1 + e^{-z}}</annotation></semantics></math>$

এটি মূলত সম্ভাবনা (probability) প্রদান করে যে কোন একটি ইনপুটকে একটি নির্দিষ্ট শ্রেণীতে (class) শ্রেণীভুক্ত করা হবে।

২. লগিস্টিক রিগ্রেশন এর ব্যবহার ক্ষেত্র

লগিস্টিক রিগ্রেশন বিভিন্ন ক্ষেত্রে ব্যবহৃত হয়, বিশেষ করে যেগুলিতে বাইনারি ক্লাসিফিকেশন (Binary Classification) প্রয়োজন। এখানে কিছু উদাহরণ দেওয়া হল:

স্প্যাম ফিল্টারিং (Spam Filtering): ইমেল স্প্যাম বা নন-স্প্যাম চিহ্নিত করতে লগিস্টিক রিগ্রেশন ব্যবহার করা হয়। মডেলটি বিভিন্ন বৈশিষ্ট্য যেমন ইমেল এর বিষয়বস্তু, প্রেরকের তথ্য ইত্যাদির উপর ভিত্তি করে স্প্যাম বা নন-স্প্যাম শ্রেণীভুক্ত করতে পারে।
ক্রেডিট স্কোরিং (Credit Scoring): ক্রেডিট স্কোর এবং ঋণ প্রদান ক্ষেত্রে, লগিস্টিক রিগ্রেশন ব্যবহার করে নির্ধারণ করা হয় যে কোন ব্যক্তি ঋণ ফেরত দিতে সক্ষম কিনা (যে ক্ষেত্রে "হ্যাঁ" বা "না" হবে)।
রোগ শনাক্তকরণ (Disease Detection): মেডিকেল ফিল্ডে রোগের উপস্থিতি চিহ্নিত করতে, যেমন ক্যান্সার শনাক্তকরণে, লগিস্টিক রিগ্রেশন ব্যবহার করা হয়। এখানে আউটপুটটি রোগের উপস্থিতির সম্ভাবনা নির্ধারণ করে।
বিক্রয় পূর্বাভাস (Sales Prediction): কিছু পণ্য কিনতে সম্ভাব্য গ্রাহক চিহ্নিত করতে, যেমন "গ্রাহক কেনার জন্য প্রস্তুত কিনা", লগিস্টিক রিগ্রেশন ব্যবহার করা যেতে পারে।

৩. লগিস্টিক রিগ্রেশন এর সুবিধা:

সহজ এবং ব্যাখ্যাতমক (Simple and Interpretable): লগিস্টিক রিগ্রেশন একটি সহজ এবং ব্যাখ্যাতমক মডেল। এটি সহজে ব্যাখ্যা করা যায় এবং ফলস্বরূপ মডেলটি ব্যবসায়িক সিদ্ধান্তের জন্য অত্যন্ত কার্যকরী হতে পারে।
দ্রুত এবং দক্ষ (Fast and Efficient): ছোট এবং সোজা ডেটাসেটের জন্য এটি খুব দ্রুত কাজ করে এবং কম্পিউটেশনাল শক্তি বেশি খরচ করে না।
প্রবণতা চিহ্নিত করতে সহায়ক (Helps to Identify Trends): এটি সম্ভাব্যতার আকারে সিদ্ধান্ত প্রদান করে, যা বিভিন্ন ইনপুট বৈশিষ্ট্যের মধ্যে সম্পর্ক বা প্রবণতা চিহ্নিত করতে সহায়ক।
বাইনারি ক্লাসিফিকেশনে কার্যকর (Effective for Binary Classification): প্রধানত বাইনারি ক্লাসিফিকেশন সমস্যা সমাধানে এটি কার্যকর। এটি যখন দুটি শ্রেণীর মধ্যে সিদ্ধান্ত নিতে হয়, তখন লগিস্টিক রিগ্রেশন একটি শক্তিশালী পদ্ধতি।

৪. লগিস্টিক রিগ্রেশন এর সীমাবদ্ধতা:

লিনিয়ার সম্পর্কের উপর নির্ভরশীল (Depends on Linear Relationship): লগিস্টিক রিগ্রেশন লিনিয়ার সম্পর্কের উপর কাজ করে, এবং এটি শুধুমাত্র সোজা লিনিয়ার ক্লাসিফিকেশন সমস্যার জন্য উপযুক্ত। জটিল সম্পর্কের জন্য এটি সীমাবদ্ধ হতে পারে।
অনেক বৈশিষ্ট্য থাকলে সঠিক নয় (Not Effective for High-Dimensional Data): যদি ডেটাতে অনেক বৈশিষ্ট্য থাকে, তবে এটি মাল্টি-ডাইমেনশনাল স্পেসে অপ্রয়োজনীয়ভাবে জটিল হয়ে উঠতে পারে।
অপর্যাপ্ত নন-লিনিয়ার ক্লাসিফিকেশন (Limited to Non-Linear Classification): যদি ডেটা উচ্চমাত্রায় নন-লিনিয়ার হয়, তবে এটি সঠিকভাবে কাজ নাও করতে পারে।

উপসংহার:

লগিস্টিক রিগ্রেশন একটি শক্তিশালী এবং সহজ মডেল যা ক্লাসিফিকেশন সমস্যার সমাধানে ব্যবহার হয়, বিশেষ করে বাইনারি ক্লাসিফিকেশন ক্ষেত্রে। এটি সহজ, ব্যাখ্যাতমক এবং দ্রুত, তবে কিছু জটিল সমস্যা (যেমন নন-লিনিয়ার সম্পর্ক) সমাধান করতে সীমাবদ্ধ হতে পারে।

Content added By

Md Azizur Rahman

Binary Classification এবং Sigmoid Function

205

Binary Classification এবং Sigmoid Function মেশিন লার্নিংয়ের দুটি অত্যন্ত গুরুত্বপূর্ণ ধারণা। এখানে আমরা দুটি বিষয়ের বিশদ আলোচনা করবো।

১. Binary Classification

Binary Classification হলো একটি মেশিন লার্নিং টাস্ক যেখানে দুটি শ্রেণীর মধ্যে (যেমন, হ্যাঁ/না, ১/০, True/False) কোনো কিছুকে শ্রেণীবদ্ধ করা হয়। এটি একটি শ্রেণীভুক্ত সমস্যা, যেখানে আমাদের দুটি সম্ভাব্য আউটপুট থাকে এবং মডেলটি একটি ইনপুটের জন্য কোন শ্রেণীটি সঠিক তা অনুমান করে।

উদাহরণ:

ইমেল স্প্যাম ফিল্টারিং: একটি মডেল ইনপুট হিসেবে একটি ইমেল নেয় এবং এর আউটপুট হতে পারে "স্প্যাম" বা "নন-স্প্যাম"।
ক্রেডিট কার্ড ফ্রড ডিটেকশন: মডেলটি একটি লেনদেনের উপর ভিত্তি করে সিদ্ধান্ত নেবে যে এটি ফ্রড (Fraud) নাকি না (Not Fraud)।
ডায়াবেটিস শনাক্তকরণ: মডেলটি একটি রোগীকে নিয়ে সিদ্ধান্ত নেবে যে তিনি ডায়াবেটিক (Diabetic) নাকি না (Non-Diabetic)।

কীভাবে কাজ করে:

Binary Classification সমস্যা সমাধান করতে, মডেলটি একটি সংখ্যা তৈরি করে যা 0 থেকে 1 এর মধ্যে থাকে, এবং এই সংখ্যা থেকে সিদ্ধান্ত নেওয়া হয় কোন শ্রেণীতে পড়বে। 0 মানে একটি শ্রেণী এবং 1 মানে অন্য শ্রেণী।
মডেলটি ইনপুট ফিচারগুলো ব্যবহার করে একটি স্কোর বা প্রেডিকশন তৈরি করে, যা তখন একটি নির্দিষ্ট থ্রেশহোল্ডের (যেমন 0.5) মাধ্যমে 0 বা 1 এ রূপান্তরিত হয়।

একটি সাধারণ ব্যাখ্যা:

যদি মডেলটির আউটপুট 0.8 হয়, এটি পরামর্শ দিচ্ছে যে এটি প্রথম শ্রেণীতে (যেমন, স্প্যাম বা ফ্রড) পড়বে, এবং যদি আউটপুট 0.3 হয়, এটি পরামর্শ দিচ্ছে যে এটি দ্বিতীয় শ্রেণীতে (যেমন, নন-স্প্যাম বা নন-ফ্রড) পড়বে।

২. Sigmoid Function

Sigmoid Function (যার অন্য নাম "Logistic Function" বা "Logistic Curve") হল একটি সিঙ্গেল ভ্যালু আউটপুট ফাংশন, যা যে কোন ইনপুটকে 0 থেকে 1 এর মধ্যে একটি মানে রূপান্তরিত করে। এটি Binary Classification সমস্যাগুলির জন্য আদর্শ কারণ এটি আউটপুটকে একটি নির্দিষ্ট সীমার মধ্যে রাখতে সাহায্য করে।

Sigmoid Function এর গাণিতিক ফর্ম:

সিগময়েড ফাংশনটির গাণিতিক রূপ হলো:

$S(x)=11+e−x<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>S</mi><mo stretchy="false">(</mo><mi>x</mi><mo stretchy="false">)</mo><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>−</mo><mi>x</mi></mrow></msup></mrow></mfrac></mrow><annotation encoding="application/x-tex">S(x) = \frac{1}{1 + e^{-x}}</annotation></semantics></math>$

এখানে:

$S (x) <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>S</mi><mo stretchy="false">(</mo><mi>x</mi><mo stretchy="false">)</mo></mrow><annotation encoding="application/x-tex">S(x)</annotation></semantics></math>$ হলো সিগময়েড ফাংশনের আউটপুট।
$x <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>x</mi></mrow><annotation encoding="application/x-tex">x</annotation></semantics></math>$ হলো ইনপুট ভ্যালু।
$e <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>e</mi></mrow><annotation encoding="application/x-tex">e</annotation></semantics></math>$ হলো ন্যাচারাল লগের বেস (প্রায় ২.৭১৮)।

সিগময়েড ফাংশনের বৈশিষ্ট্য:

আউটপুট 0 এবং 1 এর মধ্যে: সিগময়েড ফাংশন যে কোন ইনপুটকে 0 থেকে 1 এর মধ্যে স্কেল করে। তাই এটি প্রবabilité (probability) হিসেবেও ব্যাবহার করা যেতে পারে।
প্রবণতা (Monotonic): সিগময়েড ফাংশনটি ক্রমাগত এবং একমুখী থাকে, অর্থাৎ এর গ্রাফ একটি "S" আকারে হয় এবং এর মধ্যে কোন পিক বা ভ্যালি থাকে না।
সেমেট্রিক: $x = 0 <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><annotation encoding="application/x-tex">x = 0</annotation></semantics></math>$ হলে আউটপুট $0.5 <math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mn>0.5</mn></mrow><annotation encoding="application/x-tex">0.5</annotation></semantics></math>$ , $x→∞<math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>x</mi><mo>→</mo><mi mathvariant="normal">∞</mi></mrow><annotation encoding="application/x-tex">x \to \infty</annotation></semantics></math>$ হলে আউটপুট 1, এবং $x→−∞<math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>x</mi><mo>→</mo><mo>−</mo><mi mathvariant="normal">∞</mi></mrow><annotation encoding="application/x-tex">x \to -\infty</annotation></semantics></math>$ হলে আউটপুট 0।

উদাহরণ:

ধরা যাক, আমাদের একটি মডেল আছে যা একটি রোগীকে ডায়াবেটিস থাকা বা না থাকার জন্য শ্রেণীবদ্ধ করবে। মডেলটি রোগী সম্পর্কে কিছু তথ্য (যেমন বয়স, BMI, ইত্যাদি) নিয়ে ইনপুট হিসেবে দেয়। সিগময়েড ফাংশনটি ইনপুটের জন্য একটি মান উৎপন্ন করে, যা 0 এবং 1 এর মধ্যে থাকে।

যদি সিগময়েডের আউটপুট হয় 0.8, তবে আমরা বলতে পারি যে রোগীটির ডায়াবেটিস হওয়ার সম্ভাবনা 80%।
যদি আউটপুট হয় 0.2, তবে আমরা বলতে পারি যে ডায়াবেটিস হওয়ার সম্ভাবনা 20%।

সিগময়েড ফাংশনের গ্রাফ:

এটি একটি "S" আকারে গ্রাফে দেখায়, যেখানে ইনপুটের মান খুবই বড় বা ছোট হলে আউটপুট 0 বা 1 এর কাছাকাছি চলে যায়, এবং মধ্যবর্তী মানে 0.5।

Binary Classification এবং Sigmoid Function এর মধ্যে সম্পর্ক

Binary Classification সমস্যার মধ্যে সিগময়েড ফাংশন ব্যবহার করা হয় কারণ এটি আউটপুটকে 0 এবং 1 এর মধ্যে একটি সম্ভাবনা (probability) তৈরি করে, যা দুটি শ্রেণীতে (যেমন, "হ্যাঁ" অথবা "না", "স্প্যাম" অথবা "নন-স্প্যাম") ভাগ করা সহজ হয়।
Sigmoid Function আউটপুট হিসাবে একটি ধ্রুবক মান তৈরি করে, যা সহজেই শ্রেণীবদ্ধ করার জন্য ব্যবহার করা যেতে পারে। সাধারণত, 0.5 এর একটি থ্রেশহোল্ড ব্যবহার করা হয়, এর ওপরে আউটপুটকে প্রথম শ্রেণী এবং এর নিচে আউটপুটকে দ্বিতীয় শ্রেণী হিসেবে চিহ্নিত করা হয়।

উদাহরণ:

যদি একটি মডেল একটি রোগীকে ডায়াবেটিস হওয়ার জন্য 0.8 রেটিং দেয় (সিগময়েড আউটপুট), তবে এটি প্রথম শ্রেণীতে (ডায়াবেটিস) পড়বে, কারণ আউটপুট 0.5 এর বেশি। যদি আউটপুট 0.3 হয়, এটি দ্বিতীয় শ্রেণীতে (নন-ডায়াবেটিস) পড়বে।

উপসংহার

Binary Classification হলো একটি মেশিন লার্নিং টাস্ক যেখানে দুটি শ্রেণীর মধ্যে শ্রেণীবদ্ধকরণ করা হয়।
Sigmoid Function হলো একটি অ্যাক্টিভেশন ফাংশন যা ইনপুটকে 0 এবং 1 এর মধ্যে স্কেল করে, এবং এটি Binary Classification সমস্যায় আউটপুট প্রদান করতে ব্যবহৃত হয়, যেখানে আউটপুটটি শ্রেণীবিভাজনের জন্য একটি সম্ভাবনা প্রতিনিধিত্ব করে।

Content added By

Md Azizur Rahman

Decision Boundary এবং Probabilistic Prediction

182

Decision Boundary এবং Probabilistic Prediction মেশিন লার্নিং মডেলের সিদ্ধান্ত গ্রহণের প্রক্রিয়াকে আরও বিস্তারিতভাবে বোঝানোর জন্য গুরুত্বপূর্ণ ধারণা। এই দুটি ধারণা শ্রেণীবদ্ধকরণ সমস্যার সাথে সম্পর্কিত, বিশেষত ক্লাসিফিকেশন মডেল (যেমন, লজিস্টিক রিগ্রেশন, সাপোর্ট ভেক্টর মেশিন, কিভি এন) এর ক্ষেত্রে। চলুন, এগুলো বিস্তারিতভাবে আলোচনা করি।

১. Decision Boundary (সিদ্ধান্ত সীমা)

Decision Boundary (বা সিদ্ধান্ত রেখা) হল সেই রেখা বা পৃষ্ঠ যা দুটি বা তার বেশি শ্রেণীর মধ্যে পার্থক্য তৈরি করে। এটি একটি গাণিতিক কনসেপ্ট, যা ক্লাসিফিকেশন মডেলগুলির দ্বারা সৃষ্ট হয়, যেখানে এটি কোনো ইনপুট ডেটা পয়েন্টকে দুটি শ্রেণীর মধ্যে একটি নির্বাচন করতে সহায়ক হয়। Decision boundary একধরনের রেখা বা পৃষ্ঠ যা একাধিক ক্লাসের মধ্যে সিদ্ধান্ত নেয়।

উদাহরণ:

ধরা যাক, আপনি একটি ক্লাসিফিকেশন মডেল তৈরি করছেন যা দুইটি শ্রেণী (যেমন, স্প্যাম এবং নন-স্প্যাম ইমেল) চিহ্নিত করবে। মডেলটি ইমেলের বৈশিষ্ট্য (যেমন, কিওয়ার্ড ব্যবহার, ইমেল পাঠানোর সময় ইত্যাদি) উপর ভিত্তি করে সিদ্ধান্ত নেবে। Decision boundary একটি রেখা বা সীমানা হবে যা স্প্যাম এবং নন-স্প্যাম ইমেলের মধ্যে পার্থক্য তৈরি করবে।

Decision Boundary কিভাবে কাজ করে?

সাধারণত: যখন মডেলটি একটি দুই শ্রেণীর সমস্যা সমাধান করে, তখন decision boundary একটি রেখার আকারে থাকবে।
উচ্চ মাত্রায়: যদি একাধিক বৈশিষ্ট্য থাকে (যেমন, X1, X2, X3, ...), তখন decision boundary একটি বহু-মাত্রিক পৃষ্ঠ হতে পারে।

Visual Representation:

2D প্লটে: যখন দুইটি বৈশিষ্ট্য থাকে, তখন decision boundary একটি রেখা হিসেবে দেখা যাবে, যা ইনপুট স্পেসকে দুটি ক্লাসে ভাগ করে দেয়।
3D প্লটে: যখন তিনটি বৈশিষ্ট্য থাকে, তখন decision boundary একটি পৃষ্ঠ বা ফ্ল্যাট প্লেনের আকারে থাকতে পারে।

২. Probabilistic Prediction (সম্ভাব্যতা ভিত্তিক পূর্বাভাস)

Probabilistic Prediction হল একটি পদ্ধতি যেখানে মডেলটি শুধুমাত্র একটি নির্দিষ্ট শ্রেণী (class) চিহ্নিত না করে, বরং সেই শ্রেণীর সদস্য হওয়ার সম্ভাব্যতা (probability) দেয়। এটি ক্লাসিফিকেশন সমস্যায় একটি অত্যন্ত গুরুত্বপূর্ণ বৈশিষ্ট্য, বিশেষ করে যখন আপনি শুধু একটি নির্দিষ্ট শ্রেণী জানাতে চান না, বরং সেই শ্রেণীর সম্ভাব্যতার হিসাব করতে চান।

উদাহরণ:

ধরা যাক, একটি মডেল ০ থেকে ১ এর মধ্যে একটি মান প্রদান করবে, যা একটি ইমেল স্প্যাম বা নন-স্প্যাম হওয়ার সম্ভাব্যতা দেখাবে। উদাহরণস্বরূপ:

যদি মডেলটি 0.80 আউটপুট দেয়, তাহলে এর মানে হলো, "এই ইমেলটি স্প্যাম হওয়ার ৮০% সম্ভাবনা রয়েছে"।
যদি মডেলটি 0.20 আউটপুট দেয়, তাহলে এর মানে হলো, "এই ইমেলটি নন-স্প্যাম হওয়ার ৮০% সম্ভাবনা রয়েছে"।

Probabilistic Prediction কিভাবে কাজ করে?

লজিস্টিক রিগ্রেশন: এটি একটি জনপ্রিয় ক্লাসিকেশন অ্যালগরিদম যা Sigmoid Function ব্যবহার করে যে কোনো ইনপুট ডেটা পয়েন্টের জন্য সম্ভাব্যতা প্রদান করে।
- উদাহরণ: লজিস্টিক রিগ্রেশন একটি ইমেলের স্প্যাম হওয়ার সম্ভাব্যতা দিতে পারে, যেমন: "এই ইমেলটির স্প্যাম হওয়ার সম্ভাবনা ৭০%।"
নাইভ বায়েস (Naive Bayes): এটি সম্ভাব্যতা ভিত্তিক মডেল, যা ইনপুট ডেটার প্রতিটি বৈশিষ্ট্যের সম্ভাবনা নির্ণয় করে এবং তারপর সেগুলিকে একত্রিত করে ক্লাসের সম্ভাবনা বের করে।
সাপোর্ট ভেক্টর মেশিন (SVM): যদিও এটি সাধারণত ডিটারমিনিস্টিক (নির্দিষ্ট শ্রেণী নির্ধারণ করে), কিছু উন্নত SVM মডেল probabilistic prediction দেয়।

Probabilistic Prediction এর সুবিধা:

আস্থার স্তর প্রদান: সম্ভাব্যতা ভিত্তিক পূর্বাভাস প্রদান করে, যা আপনাকে সিদ্ধান্ত গ্রহণের সময় আস্থা বা ঝুঁকির স্তর বুঝতে সহায়ক হয়। যেমন, ৭০% সম্ভাবনা মানে এটি তুলনামূলকভাবে শক্তিশালী সিদ্ধান্ত, তবে ৫৫% সম্ভবনা মানে এটি খুবই অনিশ্চিত।
ধারণার বিস্তৃতি: এটি বিভিন্ন ক্লাসের মধ্যে সম্পর্কের বোঝাপড়া দেয়, যেমন, কোন শ্রেণী সম্ভবত অন্য শ্রেণীর তুলনায় আরও প্রাধান্য পায়।

Decision Boundary এবং Probabilistic Prediction এর মধ্যে সম্পর্ক:

Decision Boundary: দুটি শ্রেণীর মধ্যে সীমানা তৈরি করে, যেখানে মডেল সিদ্ধান্ত নেয় কোন শ্রেণী নির্বাচন করতে হবে।
Probabilistic Prediction: এটি এমন একটি প্রক্রিয়া যা সম্ভাবনা নির্ধারণ করে এবং মডেলকে একটি শ্রেণী নির্ধারণে সাহায্য করে, যা decision boundary-এর কাছাকাছি অথবা তার অন্য দিকে থাকতে পারে।

সারসংক্ষেপ:

Decision Boundary হল সেই রেখা বা পৃষ্ঠ যা শ্রেণীবিভাগের মধ্যে সীমানা তৈরি করে।
Probabilistic Prediction হল সম্ভাবনার ভিত্তিতে শ্রেণী নির্ধারণ, যা মডেলকে একাধিক শ্রেণীর মধ্যে একটি সম্ভাব্যতা প্রদান করে।

এই দুটি ধারণা মেশিন লার্নিং মডেলের সিদ্ধান্ত গ্রহণের প্রক্রিয়ায় গুরুত্বপূর্ণ ভূমিকা রাখে এবং মডেলটির পারফরম্যান্স ও বৈশিষ্ট্য উন্নত করতে সাহায্য করে।

Content added By

Md Azizur Rahman

Confusion Matrix এবং ROC-AUC Curve

165

১. Confusion Matrix

Confusion Matrix একটি টেবিল বা ম্যাট্রিক্স যা মডেলটির কর্মক্ষমতা বিশ্লেষণ করতে ব্যবহৃত হয়, বিশেষ করে ক্লাসিফিকেশন মডেলগুলির জন্য। এটি সঠিকভাবে এবং ভুলভাবে ক্লাসিফাই করা ট্যাগ করা ডেটার সম্পর্কের একটি সন্নিবেশ দেখায়। এতে মডেলের সত্যি ও মিথ্যা পজিটিভ এবং নেগেটিভের সংখ্যা এবং অন্যান্য পরিমাপ দেখানো হয়।

Confusion Matrix-এর কম্পোনেন্টস:

True Positive (TP): সঠিকভাবে পজিটিভ ক্লাসিফাই করা আইটেমগুলি।
True Negative (TN): সঠিকভাবে নেগেটিভ ক্লাসিফাই করা আইটেমগুলি।
False Positive (FP): ভুলভাবে পজিটিভ ক্লাসিফাই করা আইটেমগুলি (Type I error)।
False Negative (FN): ভুলভাবে নেগেটিভ ক্লাসিফাই করা আইটেমগুলি (Type II error)।

Confusion Matrix এর কাঠামো:

	Predicted Positive	Predicted Negative
Actual Positive	True Positive (TP)	False Negative (FN)
Actual Negative	False Positive (FP)	True Negative (TN)

Confusion Matrix থেকে নির্ণীত মেট্রিকস:

Accuracy (সঠিকতা):
$Accuracy=TP+TNTP+TN+FP+FN<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>A</mi><mi>c</mi><mi>c</mi><mi>u</mi><mi>r</mi><mi>a</mi><mi>c</mi><mi>y</mi><mo>=</mo><mfrac><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>T</mi><mi>N</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>T</mi><mi>N</mi><mo>+</mo><mi>F</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>N</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">Accuracy = \frac{TP + TN}{TP + TN + FP + FN}</annotation></semantics></math>$
সঠিকভাবে ক্লাসিফাই করা সমস্ত আইটেমের অনুপাত।
Precision (প্রিসিশন):
$Precision=TPTP+FP<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>=</mo><mfrac><mrow><mi>T</mi><mi>P</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>P</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">Precision = \frac{TP}{TP + FP}</annotation></semantics></math>$
এটি মডেলের পজিটিভ পূর্বানুমানগুলির মধ্যে কতটা সঠিক ছিল তা নির্দেশ করে।
Recall (রিকল) বা Sensitivity:
$Recall=TPTP+FN<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi><mo>=</mo><mfrac><mrow><mi>T</mi><mi>P</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>N</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">Recall = \frac{TP}{TP + FN}</annotation></semantics></math>$
এটি মডেলের পজিটিভ ক্লাস সঠিকভাবে চিহ্নিত করার ক্ষমতা পরিমাপ করে।
F1-Score:
$F1−Score=2×Precision×RecallPrecision+Recall<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>F</mi><mn>1</mn><mo>−</mo><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mo>=</mo><mn>2</mn><mo>×</mo><mfrac><mrow><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>×</mo><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi></mrow><mrow><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>+</mo><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">F1-Score = 2 \times \frac{Precision \times Recall}{Precision + Recall}</annotation></semantics></math>$
Precision এবং Recall এর মধ্যে ভারসাম্য রাখার জন্য ব্যবহৃত হয়।
Specificity:
$Specificity=TNTN+FP<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>S</mi><mi>p</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>f</mi><mi>i</mi><mi>c</mi><mi>i</mi><mi>t</mi><mi>y</mi><mo>=</mo><mfrac><mrow><mi>T</mi><mi>N</mi></mrow><mrow><mi>T</mi><mi>N</mi><mo>+</mo><mi>F</mi><mi>P</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">Specificity = \frac{TN}{TN + FP}</annotation></semantics></math>$
এটি মডেলের নেগেটিভ ক্লাস সঠিকভাবে চিহ্নিত করার ক্ষমতা পরিমাপ করে।

২. ROC-AUC Curve

ROC (Receiver Operating Characteristic) Curve এবং AUC (Area Under the Curve) হল একটি বিশ্লেষণাত্মক সরঞ্জাম যা ক্লাসিফিকেশন মডেলের পারফরম্যান্স মূল্যায়নে ব্যবহৃত হয়। এটি প্রধানত মডেলের ক্ষমতা চিহ্নিত করে যে কীভাবে এটি পজিটিভ এবং নেগেটিভ ক্লাসকে আলাদা করতে পারে।

ROC Curve:

ROC Curve হলো একটি গ্রাফ যা মডেলের True Positive Rate (TPR) (রিকল) এবং False Positive Rate (FPR) (এক্স পজিটিভ) এর মধ্যে সম্পর্ক দেখায়। এটি মডেলের ক্ষমতা বিশ্লেষণ করতে সহায়ক।

True Positive Rate (TPR) বা Recall: $TPR=TPTP+FN<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>T</mi><mi>P</mi><mi>R</mi><mo>=</mo><mfrac><mrow><mi>T</mi><mi>P</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>N</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">TPR = \frac{TP}{TP + FN}</annotation></semantics></math>$
False Positive Rate (FPR): $FPR=FPFP+TN<math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>F</mi><mi>P</mi><mi>R</mi><mo>=</mo><mfrac><mrow><mi>F</mi><mi>P</mi></mrow><mrow><mi>F</mi><mi>P</mi><mo>+</mo><mi>T</mi><mi>N</mi></mrow></mfrac></mrow><annotation encoding="application/x-tex">FPR = \frac{FP}{FP + TN}</annotation></semantics></math>$

ROC Curve এর গ্রাফ:

X-axis: False Positive Rate (FPR)
Y-axis: True Positive Rate (TPR)

এটি গ্রাফের মধ্যে যতটা উপরের দিকে এবং বাম দিকের কাছাকাছি থাকে, ততই মডেলটি ভালো। আদর্শ মডেলটি (সর্বোচ্চ পারফরম্যান্স) গ্রাফের শীর্ষ বাম কোণে অবস্থিত।

AUC (Area Under the Curve):

AUC (Area Under the Curve) হল ROC Curve-এর নিচে থাকা এলাকা, যা মডেলের ক্ষমতা পরিমাপ করে। AUC এর মান 0 থেকে 1 এর মধ্যে থাকে:

AUC = 1: এটি একটি আদর্শ মডেলকে নির্দেশ করে, যেখানে মডেলটি 100% সঠিকভাবে পজিটিভ এবং নেগেটিভ ক্লাস আলাদা করতে পারে।
AUC = 0.5: এটি একটি র্যান্ডম মডেলকে নির্দেশ করে, যেটি সঠিকভাবে আলাদা করতে পারছে না (যেমন, মাথা বা পা ছুঁড়ে যাওয়া)।
AUC < 0.5: এটি একটি মডেলকে নির্দেশ করে যা বিপরীতভাবে কাজ করছে এবং ভুল সিদ্ধান্ত নিচ্ছে।

ROC-AUC এর সুবিধা:

ক্লাস ইমব্যালেন্স: ROC-AUC Curve খুবই উপকারী যখন আপনার ডেটাতে ক্লাস ইমব্যালেন্স থাকে। যেহেতু এটি True Positive Rate এবং False Positive Rate এর মধ্যে সম্পর্ক দেখায়, এটি ইমব্যালেন্সের প্রভাব কমাতে সাহায্য করে।
মডেল তুলনা: বিভিন্ন মডেলের পারফরম্যান্স তুলনা করতে এটি একটি শক্তিশালী সরঞ্জাম। উচ্চ AUC মান একটি ভাল মডেল নির্দেশ করে।

উপসংহার

Confusion Matrix একটি সঠিক এবং ভুল পূর্বানুমান বিশ্লেষণ করতে ব্যবহৃত হয়, যা Accuracy, Precision, Recall, F1-Score এবং Specificity এর মতো মেট্রিকস নির্ধারণ করতে সাহায্য করে।
ROC-AUC Curve এবং AUC মডেলের পারফরম্যান্স বিশ্লেষণ করতে ব্যবহৃত হয়, যেখানে ROC Curve মডেলের True Positive Rate এবং False Positive Rate এর সম্পর্ক দেখায় এবং AUC এর মাধ্যমে মডেলের সক্ষমতা পরিমাপ করা হয়।

Content added By

Md Azizur Rahman

Machine Learning পরিচিতি Machine Learning এর মৌলিক ধারণা Data Preprocessing এবং Feature Engineering Supervised Learning এর বেসিক ধারণা Linear Regression

Logistic Regression

লজিস্টিক রিগ্রেশনের উদ্দেশ্য

লজিস্টিক রিগ্রেশন কাজ করার পদ্ধতি:

লজিস্টিক রিগ্রেশন-এর উদাহরণ:

লজিস্টিক রিগ্রেশন মডেল প্রশিক্ষণ:

লজিস্টিক রিগ্রেশনের বৈশিষ্ট্য:

লজিস্টিক রিগ্রেশন এর সীমাবদ্ধতা:

লজিস্টিক রিগ্রেশন ব্যবহার:

উপসংহার

Logistic Regression এর ভূমিকা

লগিস্টিক রিগ্রেশন এর কাজের মূল ধারণা:

১. লগিস্টিক রিগ্রেশন কীভাবে কাজ করে?

২. লগিস্টিক রিগ্রেশন এর ব্যবহার ক্ষেত্র

৩. লগিস্টিক রিগ্রেশন এর সুবিধা:

৪. লগিস্টিক রিগ্রেশন এর সীমাবদ্ধতা:

উপসংহার:

Binary Classification এবং Sigmoid Function

১. Binary Classification

উদাহরণ:

কীভাবে কাজ করে:

একটি সাধারণ ব্যাখ্যা:

২. Sigmoid Function

Sigmoid Function এর গাণিতিক ফর্ম:

সিগময়েড ফাংশনের বৈশিষ্ট্য:

উদাহরণ:

সিগময়েড ফাংশনের গ্রাফ:

Binary Classification এবং Sigmoid Function এর মধ্যে সম্পর্ক

উদাহরণ:

উপসংহার

Decision Boundary এবং Probabilistic Prediction

১. Decision Boundary (সিদ্ধান্ত সীমা)

উদাহরণ:

Decision Boundary কিভাবে কাজ করে?

Visual Representation:

২. Probabilistic Prediction (সম্ভাব্যতা ভিত্তিক পূর্বাভাস)

উদাহরণ:

Probabilistic Prediction কিভাবে কাজ করে?

Probabilistic Prediction এর সুবিধা:

Decision Boundary এবং Probabilistic Prediction এর মধ্যে সম্পর্ক:

সারসংক্ষেপ:

Confusion Matrix এবং ROC-AUC Curve

১. Confusion Matrix

Confusion Matrix-এর কম্পোনেন্টস:

Confusion Matrix এর কাঠামো:

Confusion Matrix থেকে নির্ণীত মেট্রিকস:

২. ROC-AUC Curve

ROC Curve:

ROC Curve এর গ্রাফ:

AUC (Area Under the Curve):

ROC-AUC এর সুবিধা:

উপসংহার

All Notifications

Promotion