Machine Learning Support, Confidence, এবং Lift এর ধারণা গাইড ও নোট

414

Support, Confidence, এবং Lift হল Association Rule Mining এর গুরুত্বপূর্ণ মেট্রিক্স। এগুলি সাধারণত Market Basket Analysis (মার্কেট বASKেট বিশ্লেষণ) বা অন্যান্য ধরনের অ্যাসোসিয়েশন রুলস তৈরি করতে ব্যবহৃত হয়, যেখানে বিভিন্ন আইটেমের মধ্যে সম্পর্ক খুঁজে বের করা হয়।

এগুলি মূলত একটি ডেটাসেটে আইটেমের মধ্যে সম্পর্ক এবং সম্ভাব্যতা নির্ধারণ করতে সাহায্য করে। এই মেট্রিক্সগুলির সাহায্যে আমরা জানতে পারি কিভাবে এক আইটেম বা সেট অন্য আইটেম বা সেটের সাথে সম্পর্কিত।


১. Support (সমর্থন)

Support হলো একটি নির্দিষ্ট অ্যাসোসিয়েশন রুলে উপস্থিত আইটেমগুলির সম্মিলিত ফ্রিকোয়েন্সি বা আগমন। এটি একটি নির্দিষ্ট আইটেম বা আইটেমসেটের সম্ভাব্যতা নির্ধারণ করে, কতবার একটি নির্দিষ্ট আইটেম বা আইটেমসেট পুরো ডেটাসেটে উপস্থিত হয়েছে।

Support এর গাণিতিক রূপ:

Support(A)=Number of Transactions containing ATotal Number of Transactions\text{Support(A)} = \frac{\text{Number of Transactions containing A}}{\text{Total Number of Transactions}}

এখানে,

  • A হলো কোনো নির্দিষ্ট আইটেম বা আইটেমসেট।
  • এটি 0 থেকে 1 এর মধ্যে একটি মানে পরিণত হয়। একটি উচ্চ support মান নির্দেশ করে যে আইটেমটি বা আইটেমসেটটি ডেটাসেটে বেশি উপস্থিত রয়েছে।

উদাহরণ:

ধরা যাক, একটি দোকানে 100 টি লেনদেনের মধ্যে 30 টি লেনদেনেই "ব্রেড" এবং "বাটার" একসাথে কেনা হয়েছে। তাহলে,

Support(BrBread, Butter)=30100=0.3\text{Support(BrBread, Butter)} = \frac{30}{100} = 0.3

এখানে, "ব্রেড" এবং "বাটার" এর support হলো 0.3, অর্থাৎ 30% লেনদেনেই এই দুটি আইটেম একসাথে কেনা হয়েছে।


২. Confidence (বিশ্বাস)

Confidence হলো একটি অ্যাসোসিয়েশন রুলের বিশ্বাসযোগ্যতা বা সামর্থ্য। এটি একটি নির্দিষ্ট আইটেম (X) এর উপস্থিতির ভিত্তিতে অন্য আইটেম (Y) এর উপস্থিতির সম্ভাবনা পরিমাপ করে। সহজভাবে, এটি নির্দেশ করে, যদি X ঘটবে, তবে Y ঘটার সম্ভাবনা কতটুকু।

Confidence এর গাণিতিক রূপ:

Confidence(A → B)=Support(A ∩ B)Support(A)\text{Confidence(A → B)} = \frac{\text{Support(A ∩ B)}}{\text{Support(A)}}

এখানে,

  • A → B রুলটি নির্দেশ করে যে, যদি A ঘটে তবে B ঘটবে।
  • Support(A ∩ B) হলো যে লেনদেনগুলিতে A এবং B উভয়ই উপস্থিত, তার সংখ্যা।
  • Support(A) হলো শুধুমাত্র A এর উপস্থিতির সংখ্যা।

উদাহরণ:

ধরা যাক, 100 টি লেনদেনের মধ্যে 30 টি লেনদেনে "ব্রেড" এবং "বাটার" একসাথে কেনা হয়েছে এবং 50 টি লেনদেনে "ব্রেড" কেনা হয়েছে। তাহলে,

Confidence(BrBread → Butter)=3050=0.6\text{Confidence(BrBread → Butter)} = \frac{30}{50} = 0.6

এখানে, "ব্রেড" কেনার পর "বাটার" কেনার confidence হলো 0.6 বা 60%, অর্থাৎ 60% ক্ষেত্রে "ব্রেড" কেনার পর "বাটার" কেনা হয়।


৩. Lift (লিফট)

Lift হলো দুটি আইটেমের মধ্যে সম্পর্কের শক্তি পরিমাপ করা। এটি confidence এর তুলনায় আরো শক্তিশালী এবং এটি দেখায় যে দুটি আইটেমের মধ্যে সম্পর্ক আসলে একে অপরকে প্রভাবিত করছে কিনা। Lift 1 এর উপরে হলে, এটি ইঙ্গিত দেয় যে দুটি আইটেমের মধ্যে সম্পর্ক অন্যথায় সাধারণের তুলনায় বেশি।

Lift এর গাণিতিক রূপ:

Lift(A → B)=Confidence(A → B)Support(B)\text{Lift(A → B)} = \frac{\text{Confidence(A → B)}}{\text{Support(B)}}

এখানে,

  • Confidence(A → B) হলো A এর উপস্থিতির ভিত্তিতে B এর উপস্থিতির সম্ভাবনা।
  • Support(B) হলো B এর ডেটাসেটে উপস্থিতির হার।

উদাহরণ:

ধরা যাক, "ব্রেড" এবং "বাটার" এর মধ্যে Confidence 0.6 এবং "বাটার" এর Support 0.4। তাহলে,

Lift(BrBread → Butter)=0.60.4=1.5\text{Lift(BrBread → Butter)} = \frac{0.6}{0.4} = 1.5

এখানে, "ব্রেড" কেনার পর "বাটার" কেনার lift হলো 1.5, অর্থাৎ এই দুটি আইটেমের মধ্যে সম্পর্ক অন্যান্য সম্পর্কের তুলনায় 1.5 গুণ বেশি শক্তিশালী।


Support, Confidence, এবং Lift এর ব্যবহার

  • Support আমাদের বলে যে একটি আইটেম বা আইটেমসেট কতটা জনপ্রিয় বা সাধারণ।
  • Confidence আমাদের জানায় যে, এক আইটেম (যেমন, "ব্রেড") কেনার পর অন্য আইটেম (যেমন, "বাটার") কেনার সম্ভাবনা কতটুকু।
  • Lift আমাদের জানায় যে, দুটি আইটেমের মধ্যে সম্পর্ক কী পরিমাণ শক্তিশালী, অর্থাৎ এই দুটি আইটেম একে অপরকে প্রভাবিত করছে কিনা।

এগুলি মার্কেট বASKেট বিশ্লেষণে বা অন্য অ্যাসোসিয়েশন রুল মাইনিং প্রকল্পে ব্যবহৃত হয় যা একটি দোকানে কেনাকাটা সম্পর্কিত প্যাটার্ন বা প্রবণতা খুঁজে বের করতে সাহায্য করে।

Content added By
Promotion

Are you sure to start over?

Loading...