মেশিন লার্নিং মডেলের কার্যকারিতা বা পারফরম্যান্স মাপার জন্য বিভিন্ন evaluation metrics ব্যবহার করা হয়। Accuracy, Precision, Recall, এবং F1-Score হল সবচেয়ে সাধারণ এবং গুরুত্বপূর্ণ মেট্রিক যা শ্রেণীবদ্ধকরণ (Classification) সমস্যা সমাধানে ব্যবহৃত হয়।
1. Accuracy (সঠিকতা)
Accuracy হল একটি মডেলের পারফরম্যান্স মাপার জন্য সবচেয়ে সহজ এবং সাধারণ মেট্রিক। এটি মোট সঠিক পূর্বাভাসের হার প্রকাশ করে।
সুত্র:
- True Positives (TP): সঠিকভাবে পজিটিভ শ্রেণী পূর্বাভাস করা।
- True Negatives (TN): সঠিকভাবে নেগেটিভ শ্রেণী পূর্বাভাস করা।
- False Positives (FP): ভুলভাবে পজিটিভ শ্রেণী পূর্বাভাস করা।
- False Negatives (FN): ভুলভাবে নেগেটিভ শ্রেণী পূর্বাভাস করা।
ব্যবহার:
- যখন ডেটাসেটের শ্রেণী সমানভাবে বিতরণ করা থাকে এবং মডেলের সঠিকতা গুরুত্বপূৰ্ণ হয়, তখন accuracy ব্যবহার করা হয়।
উদাহরণ:
যদি আপনার 100টি পূর্বাভাসের মধ্যে 90টি সঠিক হয়, তবে accuracy হবে 90%।
2. Precision (প্রিসিশন)
Precision হল মডেলের positive পূর্বাভাসগুলোর মধ্যে সঠিক কতটা ছিল তার অনুপাত। এটি ভুল পজিটিভ রেট (False Positive Rate) কমানোর জন্য গুরুত্বপূর্ণ।
সুত্র:
ব্যবহার:
- Precision গুরুত্বপূর্ণ যখন আমরা চাই ফলস পজিটিভ কমাতে, যেমন স্প্যাম ইমেইল সিস্টেম যেখানে আমাদের স্প্যাম হিসাবে চিহ্নিত ইমেইলগুলো আসলেই স্প্যাম না হলে তা সমস্যার সৃষ্টি করতে পারে।
উদাহরণ:
যদি মডেল 100টি পজিটিভ পূর্বাভাস করে এবং তার মধ্যে 80টি সঠিক হয়, তবে precision হবে বা 80%।
3. Recall (রিকল)
Recall হল মডেলের ক্ষমতা সত্য পজিটিভ (True Positive) শনাক্ত করার ক্ষেত্রে। এটি বলছে যে, প্রকৃত পজিটিভ মানগুলির মধ্যে মডেল কতটা সঠিকভাবে তাদের পূর্বাভাস করেছে। Recall কে Sensitivity বা True Positive Rate বলেও পরিচিত।
সুত্র:
ব্যবহার:
- Recall গুরুত্বপূর্ণ যখন false negatives কমানো অত্যন্ত গুরুত্বপূর্ণ। যেমন, চিকিৎসা ডায়াগনসিস-এ রোগের শনাক্তকরণে recall বেশি হওয়া উচিত, কারণ ভুলভাবে রোগীকে সুস্থ মনে করলে সমস্যা হতে পারে।
উদাহরণ:
যদি 100টি প্রকৃত পজিটিভ মধ্যে 85টি সঠিকভাবে পূর্বাভাস করা হয়, তবে recall হবে বা 85%।
4. F1-Score
F1-Score হল precision এবং recall এর গাণিতিক গড়, যা তাদের মধ্যে একটি ভারসাম্য সৃষ্টি করে। এটি একটি গুরুত্বপূর্ণ মেট্রিক যখন precision এবং recall এর মধ্যে ট্রেড-অফ রয়েছে এবং উভয়কেই একইভাবে গুরুত্ব দেওয়া প্রয়োজন।
সুত্র:
ব্যবহার:
- যখন precision এবং recall উভয়ের গুরুত্ব সমান হয়, তখন F1-Score ব্যবহার করা হয়। উদাহরণস্বরূপ, একটি ফলস পজিটিভ এবং ফলস নেগেটিভ উভয়ই গ্রহণযোগ্য না হলে F1-Score শ্রেষ্ঠ মেট্রিক হতে পারে।
উদাহরণ:
যদি precision এবং recall হয়, তবে F1-Score হবে:
মেট্রিকের তুলনা:
| Metric | Formula | Usage |
|---|---|---|
| Accuracy | When classes are balanced | |
| Precision | Minimizing false positives | |
| Recall | Minimizing false negatives | |
| F1-Score | Balancing precision and recall |
সারাংশ
- Accuracy: সর্বমোট সঠিক পূর্বাভাসের হার।
- Precision: মডেল যে পজিটিভ পূর্বাভাস করেছে তার মধ্যে কতটা সঠিক ছিল।
- Recall: মডেল যে পজিটিভগুলি সঠিকভাবে পূর্বাভাস করেছে, তার মধ্যে কতটা সঠিক ছিল।
- F1-Score: Precision এবং Recall এর একটি ভারসাম্যপূর্ণ গড়, যা উভয়ের গুরুত্ব সমান হলে ব্যবহৃত হয়।
এগুলি মেশিন লার্নিং মডেলের কার্যকারিতা বিশ্লেষণে সহায়ক এবং ব্যবহারকারীকে সঠিক মেট্রিক নির্বাচন করার সুযোগ দেয়, যা প্রয়োগের উপর নির্ভর করে।
Read more