Classification এবং Regression হল মেশিন লার্নিংয়ের দুটি মৌলিক সমস্যা। প্রতিটি সমস্যা তার নিজস্ব উদ্দেশ্য এবং টেকনিকের সাথে সম্পর্কিত।
1. Classification
Classification হল একটি ধরনের সুপারভাইজড লার্নিং সমস্যা যেখানে উদ্দেশ্য হল একটি নির্দিষ্ট ক্লাস বা শ্রেণীতে ইনপুট ডেটাকে ভাগ করা। উদাহরণস্বরূপ, ইমেইল ফিল্টারিং (স্প্যাম বা নন-স্প্যাম), রোগ নির্ণয় (রোগী আছে বা নেই), এবং ছবি শনাক্তকরণ (বিক্রেতা, সাপ, গাড়ি ইত্যাদি)।
সমাধান পদ্ধতি:
ডেটা প্রস্তুতি:
- ডেটা সংগ্রহ, ক্লিনিং এবং ক্যাটাগরীক্যাল ফিচার এনকোডিং করা।
মডেল নির্বাচন:
- জনপ্রিয় ক্লাসিফিকেশন অ্যালগরিদমগুলি ব্যবহার করা, যেমন Logistic Regression, Decision Trees, Random Forest, Support Vector Machines (SVM), এবং Neural Networks।
মডেল ট্রেনিং:
- প্রশিক্ষণ ডেটাসেটে মডেলকে প্রশিক্ষিত করা।
মডেল মূল্যায়ন:
- মডেলটির কার্যকারিতা মূল্যায়নের জন্য Accuracy, Precision, Recall, F1-Score ইত্যাদি মেট্রিক্স ব্যবহার করা।
পূর্বাভাস করা:
- নতুন ডেটার জন্য শ্রেণী পূর্বাভাস করা।
উদাহরণ: Iris Dataset ব্যবহার করে Classification
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# Iris ডেটাসেট লোড করা
iris = load_iris()
X = iris.data
y = iris.target
# ডেটাসেটকে ট্রেনিং ও টেস্ট সেটে বিভাজন করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# মডেল তৈরি এবং প্রশিক্ষণ
model = RandomForestClassifier()
model.fit(X_train, y_train)
# পূর্বাভাস করা
y_pred = model.predict(X_test)
# Accuracy মূল্যায়ন
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy:.2f}')
2. Regression
Regression হল একটি ধরনের সুপারভাইজড লার্নিং সমস্যা যেখানে উদ্দেশ্য হল একটি সংখ্যা প্রিডিক্ট করা। উদাহরণস্বরূপ, বাড়ির দাম পূর্বাভাস, বিক্রয় পূর্বাভাস, এবং তাপমাত্রা প্রিডিকশন।
সমাধান পদ্ধতি:
ডেটা প্রস্তুতি:
- ডেটা সংগ্রহ, ক্লিনিং এবং বৈশিষ্ট্য তৈরি করা।
মডেল নির্বাচন:
- জনপ্রিয় রিগ্রেশন অ্যালগরিদমগুলি ব্যবহার করা, যেমন Linear Regression, Decision Trees, Random Forest Regression, এবং Support Vector Regression (SVR)।
মডেল ট্রেনিং:
- প্রশিক্ষণ ডেটাসেটে মডেলকে প্রশিক্ষিত করা।
মডেল মূল্যায়ন:
- মডেলটির কার্যকারিতা মূল্যায়নের জন্য Mean Absolute Error (MAE), Mean Squared Error (MSE), এবং R-squared (R²) ইত্যাদি মেট্রিক্স ব্যবহার করা।
পূর্বাভাস করা:
- নতুন ডেটার জন্য সংখ্যা পূর্বাভাস করা।
উদাহরণ: Boston Housing Dataset ব্যবহার করে Regression
import pandas as pd
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
# Boston Housing ডেটাসেট লোড করা
boston = load_boston()
X = boston.data
y = boston.target
# ডেটাসেটকে ট্রেনিং ও টেস্ট সেটে বিভাজন করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# মডেল তৈরি এবং প্রশিক্ষণ
model = RandomForestRegressor()
model.fit(X_train, y_train)
# পূর্বাভাস করা
y_pred = model.predict(X_test)
# Mean Squared Error মূল্যায়ন
mse = mean_squared_error(y_test, y_pred)
print(f'Mean Squared Error: {mse:.2f}')
উপসংহার
Classification এবং Regression হল মেশিন লার্নিংয়ের মূল দিক। Classification সমস্যাগুলি শ্রেণীভুক্ত করার জন্য ব্যবহৃত হয়, যেখানে Regression সংখ্যার পূর্বাভাস দেওয়ার জন্য ব্যবহৃত হয়। উভয় ক্ষেত্রে সঠিক ডেটা প্রস্তুতি, মডেল নির্বাচন, এবং মূল্যায়ন মডেলের কার্যকারিতা নির্ধারণে গুরুত্বপূর্ণ।
Read more