Regression এর জন্য Metrics: R-Squared, RMSE

Model Evaluation এবং Performance Metrics - পাইথন দিয়ে মেশিন লার্নিং (Machine Learning with Python) - Machine Learning

306

রিগ্রেশন মডেলগুলি আউটপুট বা লক্ষ্য ভেরিয়েবল (target variable) হিসেবে একটি সংখ্যা (continuous value) প্রেডিক্ট করতে ব্যবহৃত হয়। রিগ্রেশন মডেলগুলির কার্যকারিতা মূল্যায়ন করার জন্য কিছু মেট্রিক্স রয়েছে, যা মডেলের প্রেডিকশনগুলির সঠিকতা এবং মডেলের পারফরম্যান্স বুঝতে সাহায্য করে। R-Squared (R²) এবং RMSE (Root Mean Squared Error) হল দুটি গুরুত্বপূর্ণ মেট্রিক্স, যেগুলি রিগ্রেশন মডেল মূল্যায়ন করার জন্য ব্যবহৃত হয়।

১. R-Squared (R²) - Coefficient of Determination

R-Squared হল একটি মেট্রিক যা রিগ্রেশন মডেলের জন্য কতটা ভ্যারিয়েশন বা পরিবর্তন (variance) আসল ডেটা থেকে ব্যাখ্যা করা হয়েছে তা পরিমাপ করে। এটি 0 এবং 1 এর মধ্যে মান থাকে এবং 1 হলে মডেলটি সম্পূর্ণরূপে ডেটার পরিবর্তন ব্যাখ্যা করতে সক্ষম বলে ধরে নেওয়া হয়।

R² এর অর্থ:

  • R² = 1: পুরো ডেটা ভ্যারিয়েশন মডেল দ্বারা ব্যাখ্যা করা হয়েছে। মডেলটি খুব ভাল কাজ করছে।
  • R² = 0: মডেলটি ডেটার কোন ভ্যারিয়েশন ব্যাখ্যা করছে না। মডেলটি কোনও ভালো ভবিষ্যদ্বাণী করছে না।
  • R² < 0: মডেলটি আসলে গড় মান ব্যবহার করে ফলাফল অর্জন করতে পারত, কিন্তু মডেলটি খারাপভাবে কাজ করছে।

R² হিসাব করার সূত্র:

R2=1i=1n(yiy^i)2i=1n(yiyˉ)2R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}

এখানে,

  • yiy_i হল আসল লক্ষ্য মান (actual target value)।
  • y^i\hat{y}_i হল প্রেডিক্টেড মান (predicted value)।
  • yˉ\bar{y} হল আসল লক্ষ্য মানের গড় (mean of actual target values)।
  • nn হল ডেটা পয়েন্টের সংখ্যা।

উদাহরণ:

ধরা যাক, আসল মান: [3,5,2.5,7][3, 5, 2.5, 7], প্রেডিক্টেড মান: [2.8,5.1,2.4,7.2][2.8, 5.1, 2.4, 7.2],

  • yiy^iy_i - \hat{y}_i এর বর্গফল (squared difference) গুণন করা এবং মোট সমষ্টি হিসাব করা হবে। এরপর আসল ডেটার ভ্যারিয়েশন ও বাকি ভ্যারিয়েশন ব্যবহার করে R² হিসাব করা হবে।

সুবিধা:

  • R² মডেলের সামগ্রিক পারফরম্যান্স পরিমাপ করতে সাহায্য করে।
  • ডেটার ভ্যারিয়েশন কতটা ব্যাখ্যা করা গেছে তা পরিমাপ করতে ব্যবহৃত হয়।

সীমাবদ্ধতা:

  • এটি মডেলের উন্নতি বা হ্রাসের সঠিক মান প্রদান নাও করতে পারে, বিশেষ করে যদি ডেটাতে অনেক বেশি আউটলাইয়ার থাকে।
  • R² মান একা ব্যাখ্যা করার জন্য যথেষ্ট নয়, কারণ এটি শুধুমাত্র সাধারণ ভ্যারিয়েশনকে হিসাব করে এবং মডেলের নির্ভুলতা বা অন্যান্য গুরুত্বপূর্ণ দিকগুলো বিবেচনা করে না।

২. RMSE (Root Mean Squared Error)

RMSE হল একটি জনপ্রিয় মেট্রিক যা রিগ্রেশন মডেলের প্রেডিকশন এবং আসল মানের মধ্যে গড় ভুল (error) পরিমাপ করে। RMSE কম হলে, এটি নির্দেশ করে যে মডেলটি আসল মানের কাছে ভালভাবে অবস্থান করছে। এটি সাধারণত মডেলের প্রেডিকশন ত্রুটি পরিমাপের জন্য ব্যবহৃত হয়।

RMSE হিসাব করার সূত্র:

RMSE=1ni=1n(yiy^i)2RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}

এখানে,

  • yiy_i হল আসল লক্ষ্য মান (actual target value)।
  • y^i\hat{y}_i হল প্রেডিক্টেড মান (predicted value)।
  • nn হল ডেটা পয়েন্টের সংখ্যা।

উদাহরণ:

ধরা যাক, আসল মান: [3,5,2.5,7][3, 5, 2.5, 7], প্রেডিক্টেড মান: [2.8,5.1,2.4,7.2][2.8, 5.1, 2.4, 7.2],

  • প্রথমে, (yiy^i)2(y_i - \hat{y}_i)^2 এর বর্গফল হিসাব করুন (যেমন: (32.8)2(3-2.8)^2)।
  • তারপর, সব বর্গফলগুলির যোগফল নিন।
  • শেষে, সমষ্টির গড় বের করে, তার বর্গমূল নিন।

সুবিধা:

  • RMSE মডেলটির ত্রুটি পরিমাপের জন্য খুবই কার্যকরী এবং এটি গড় ত্রুটির প্রাকৃতিক একক (unit) প্রদর্শন করে, তাই এটি আরও ব্যাখ্যা করা সহজ।
  • এটি আসল এবং প্রেডিক্টেড মানের মধ্যে গড় ত্রুটি পরিমাপ করে এবং তাৎক্ষণিক ভুলের (error) পরিমাণ প্রদর্শন করে।

সীমাবদ্ধতা:

  • RMSE আউটলাইয়ারের প্রভাব বেশি গ্রহণ করে, কারণ এটি বর্গফল ব্যবহার করে ত্রুটিগুলি হিসাব করে।
  • এটি স্কেলের উপর নির্ভরশীল, অর্থাৎ যদি আপনার ডেটা স্কেল পরিবর্তিত হয় তবে RMSE এর মানও পরিবর্তিত হতে পারে।

সারাংশ

  • R-Squared (R²) হল একটি মেট্রিক যা রিগ্রেশন মডেল দ্বারা ব্যাখ্যা করা ভ্যারিয়েশনের পরিমাণ পরিমাপ করে। এটি 0 থেকে 1 পর্যন্ত মান নেয়, যেখানে 1 মানে মডেল পুরোপুরি সঠিক।
  • RMSE (Root Mean Squared Error) হল একটি ত্রুটি পরিমাপ মেট্রিক, যা মডেলের প্রেডিকশন এবং আসল লক্ষ্য মানের মধ্যে গড় ত্রুটির পরিমাণ প্রদর্শন করে।

দুটি মেট্রিক্সই রিগ্রেশন মডেলের পারফরম্যান্স মূল্যায়নের জন্য অত্যন্ত গুরুত্বপূর্ণ, তবে এগুলির ব্যবহারের উদ্দেশ্য এবং প্রেক্ষাপট আলাদা। R² সাধারণত মডেলের মোট সঠিকতার সূচক, আর RMSE আসল এবং প্রেডিক্টেড মানের মধ্যে গড় ত্রুটির পরিমাণ।

Content added By
Promotion

Are you sure to start over?

Loading...