Classification এবং Regression প্রজেক্ট উদাহরণ

Supervised Learning - পাইব্রেইন (PyBrain) - Machine Learning

295

Classification এবং Regression হল মেশিন লার্নিংয়ের দুটি প্রধান ধরনের সমস্যা। Classification মূলত একটি নির্দিষ্ট শ্রেণীতে ডেটাকে ভাগ করার জন্য ব্যবহৃত হয়, যেখানে আউটপুটটি ক্যাটেগরিকাল হয়। অন্যদিকে, Regression একটি ধারাবাহিক আউটপুট মান প্রেডিক্ট করার জন্য ব্যবহৃত হয়। এখানে দুটি প্রজেক্ট উদাহরণ দেওয়া হলো — একটি Classification প্রজেক্ট এবং একটি Regression প্রজেক্ট।


১. Classification প্রজেক্ট উদাহরণ: Iris Dataset Classification

Problem: Iris dataset ব্যবহার করে বিভিন্ন প্রকারের ফুল (Iris-setosa, Iris-versicolor, Iris-virginica) ক্লাসিফাই করা।

Step-by-Step উদাহরণ:

  1. Dataset: Iris dataset হল একটি জনপ্রিয় মেশিন লার্নিং ডেটাসেট, যার মধ্যে ৪টি ফিচার (সেপাল লেন্থ, সেপাল উইডথ, পেটাল লেন্থ, পেটাল উইডথ) এবং ৩টি ক্লাস রয়েছে।
  2. Objective: ফুলের প্রকার নির্ধারণ করা (Classification) based on the given features.

কোড উদাহরণ:

# প্রয়োজনীয় লাইব্রেরি ইমপোর্ট করা
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Iris ডেটাসেট লোড করা
iris = load_iris()
X = iris.data
y = iris.target

# ডেটাসেটকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# ডেটা স্ট্যান্ডারাইজেশন (Standardization)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# মডেল তৈরি করা (Random Forest Classifier)
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# টেস্ট সেটের উপর প্রেডিকশন করা
y_pred = model.predict(X_test)

# Accuracy মাপা
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy * 100:.2f}%")

বিশ্লেষণ:

  • Dataset: Iris dataset ব্যবহার করা হয়েছে।
  • Model: Random Forest Classifier ব্যবহার করা হয়েছে, যা একটি শক্তিশালী ensemble method।
  • Performance Metric: Accuracy ব্যবহার করা হয়েছে, কারণ এটি একটি classification task।

এই প্রজেক্টে, আপনি দেখবেন কীভাবে একটি মডেলকে ট্রেন করা হয় এবং তার পরবর্তী পারফরম্যান্স যাচাই করা হয়। এই মডেলটি ফুলের ধরন নির্ধারণ করতে সক্ষম হবে।


২. Regression প্রজেক্ট উদাহরণ: Boston Housing Price Prediction

Problem: Boston Housing dataset ব্যবহার করে বাড়ির মূল্য প্রেডিক্ট করা।

Step-by-Step উদাহরণ:

  1. Dataset: Boston Housing dataset ডেটা পয়েন্টের মধ্যে ১৩টি ভিন্ন ভিন্ন ফিচার রয়েছে (যেমন, অপরিচিততা, সেন্ট্রাল স্কুলের রেট, অপরাধের হার ইত্যাদি), এবং আউটপুটটি বাড়ির মূল্য (ধারণাগত মান)।
  2. Objective: বিভিন্ন বৈশিষ্ট্য ব্যবহার করে বাড়ির মূল্য প্রেডিক্ট করা (Regression)।

কোড উদাহরণ:

# প্রয়োজনীয় লাইব্রেরি ইমপোর্ট করা
import pandas as pd
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Boston Housing ডেটাসেট লোড করা
boston = load_boston()
X = boston.data
y = boston.target

# ডেটাসেটকে ট্রেন এবং টেস্ট সেটে ভাগ করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# মডেল তৈরি করা (Linear Regression)
model = LinearRegression()
model.fit(X_train, y_train)

# টেস্ট সেটের উপর প্রেডিকশন করা
y_pred = model.predict(X_test)

# Performance metrics গণনা করা
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"Mean Squared Error (MSE): {mse:.2f}")
print(f"R^2 Score: {r2:.2f}")

বিশ্লেষণ:

  • Dataset: Boston Housing dataset ব্যবহৃত হয়েছে, যেখানে প্রতিটি রেকর্ডে বাড়ির বৈশিষ্ট্য রয়েছে এবং আউটপুট হল বাড়ির মূল্য।
  • Model: Linear Regression ব্যবহার করা হয়েছে, যা regression problems এর জন্য প্রচলিত।
  • Performance Metrics: MSE (Mean Squared Error) এবং R² score ব্যবহার করা হয়েছে।

এই প্রজেক্টে, Linear Regression ব্যবহার করে বাড়ির মূল্য প্রেডিক্ট করার জন্য একটি মডেল তৈরি করা হয়েছে এবং তার পারফরম্যান্স মূল্যায়ন করা হয়েছে।


সারাংশ

  • Classification প্রজেক্টের উদাহরণে Iris dataset ব্যবহার করে ফুলের প্রকারভেদ শনাক্ত করা হয়েছে। এখানে আউটপুট ক্যাটেগোরিকাল (তিনটি ফুলের ধরন)।
  • Regression প্রজেক্টের উদাহরণে Boston Housing dataset ব্যবহার করে বাড়ির মূল্য প্রেডিক্ট করা হয়েছে। এখানে আউটপুট ধারাবাহিক (মূল্য)।

এই প্রজেক্টগুলো সাধারণত মেশিন লার্নিং শিখতে ব্যবহৃত হয় এবং ডেটা হ্যান্ডলিং, মডেল ট্রেনিং, এবং মেট্রিক্সের মাধ্যমে পারফরম্যান্স যাচাই করার মৌলিক ধারণা দেয়।

Content added By
Promotion

Are you sure to start over?

Loading...