Skill

মডেল ইভ্যালুয়েশন মেট্রিক্স: Accuracy, Precision, Recall

Model Evaluation এবং Hyperparameter Tuning - চেইনার (Chainer) - Latest Technologies

327

মডেল ইভ্যালুয়েশন মেট্রিক্সগুলো মডেলের কার্যকারিতা নির্ধারণ করতে ব্যবহৃত হয়। Classification মডেলগুলোর জন্য Accuracy, Precision, এবং Recall হলো তিনটি গুরুত্বপূর্ণ মেট্রিক্স যা মডেলের performance এর বিভিন্ন দিক সম্পর্কে ধারণা দেয়।

১. Accuracy

Accuracy হলো সঠিক প্রেডিকশন সংখ্যা এবং মোট প্রেডিকশন সংখ্যার অনুপাত। এটি সাধারণত একটি মডেল কতটা সঠিকভাবে কাজ করছে তা নির্ধারণ করতে ব্যবহৃত হয়।

ফর্মুলা:

উদাহরণ:

ধরা যাক, আমাদের একটি মডেল আছে যা ১০০টি instance এর মধ্যে ৯০টি সঠিকভাবে classify করতে পেরেছে। তাহলে Accuracy হবে:

Accuracy=90100=0.90 বা 90%\text{Accuracy} = \frac{90}{100} = 0.90 \text{ বা } 90\%Accuracy=10090​=0.90 বা 90%

ব্যবহার ক্ষেত্র:

  • যখন dataset এ class imbalance কম থাকে এবং সঠিক প্রেডিকশন একটি প্রধান লক্ষ্য, তখন Accuracy মেট্রিকটি ব্যবহার উপযোগী।

২. Precision

Precision মেট্রিকটি আমাদের জানায়, মডেল যে positive প্রেডিকশন করেছে তার মধ্যে কতগুলো আসলেই সঠিক ছিল। এটি বিশেষ করে তখন গুরুত্বপূর্ণ, যখন False Positive সংখ্যা কমাতে চাওয়া হয়।

ফর্মুলা:

উদাহরণ:

ধরা যাক, একটি মডেল ৫০টি positive প্রেডিকশন করেছে, যার মধ্যে ৪০টি সঠিক এবং ১০টি ভুল (False Positive)। তাহলে Precision হবে:

Precision=4040+10=4050=0.80 বা 80%\text{Precision} = \frac{40}{40 + 10} = \frac{40}{50} = 0.80 \text{ বা } 80\%Precision=40+1040​=5040​=0.80 বা 80%

ব্যবহার ক্ষেত্র:

  • Precision মেট্রিকটি তখন উপযোগী যখন False Positive কমানো গুরুত্বপূর্ণ, যেমন, spam detection (যেখানে spam হিসেবে চিহ্নিত মেইল আসলেই স্প্যাম হতে হবে)।

৩. Recall

Recall আমাদের বলে, আসল positive instance এর মধ্যে মডেল কতগুলো সঠিকভাবে চিহ্নিত করতে পেরেছে। এটি বিশেষ করে তখন গুরুত্বপূর্ণ, যখন False Negative সংখ্যা কমাতে চাওয়া হয়।

ফর্মুলা:

ব্যবহার ক্ষেত্র:

  • Recall মেট্রিকটি গুরুত্বপূর্ণ যখন False Negative কমানো জরুরি, যেমন, রোগ নির্ণয় (যেখানে positive কেস মিস করা গুরুত্বপূর্ণ)।

Confusion Matrix এবং মেট্রিক্স গুলোর সম্পর্ক

Confusion Matrix এর সাহায্যে আমরা Accuracy, Precision এবং Recall সহ বিভিন্ন মেট্রিক্স সহজে বের করতে পারি। Confusion Matrix এ চারটি অংশ থাকে:

  • True Positive (TP): সঠিকভাবে positive প্রেডিকশন।
  • False Positive (FP): ভুলভাবে positive প্রেডিকশন।
  • True Negative (TN): সঠিকভাবে negative প্রেডিকশন।
  • False Negative (FN): ভুলভাবে negative প্রেডিকশন।

Confusion Matrix থেকে:

  • Precision = TPTP+FP\frac{TP}{TP + FP}TP+FPTP​
  • Recall = TPTP+FN\frac{TP}{TP + FN}TP+FNTP​
  • Accuracy = TP+TNTP+TN+FP+FN\frac{TP + TN}{TP + TN + FP + FN}TP+TN+FP+FNTP+TN​

সারসংক্ষেপ:

মেট্রিক্সফর্মুলাব্যবহার ক্ষেত্র
AccuracyTP+TNTP+TN+FP+FN\frac{TP + TN}{TP + TN + FP + FN}TP+TN+FP+FNTP+TN​Class imbalance না থাকলে এবং সঠিক প্রেডিকশন প্রধান লক্ষ্য হলে
PrecisionTPTP+FP\frac{TP}{TP + FP}TP+FPTP​False Positive কমানোর ক্ষেত্রে গুরুত্বপূর্ণ, যেমন spam detection
RecallTPTP+FN\frac{TP}{TP + FN}TP+FNTP​False Negative কমানোর ক্ষেত্রে গুরুত্বপূর্ণ, যেমন disease detection

এই মেট্রিক্সগুলো মডেল পারফরমেন্স বোঝার জন্য গুরুত্বপূর্ণ এবং নির্দিষ্ট মেট্রিক বেছে নেয়া হয় নির্দিষ্ট টাস্কের প্রয়োজন অনুযায়ী।

Content added By
Promotion

Are you sure to start over?

Loading...