Simple এবং Multiple Linear Regression

Linear Regression - পাইথন দিয়ে মেশিন লার্নিং (Machine Learning with Python) - Machine Learning

319

Linear Regression হল একটি অ্যালগরিদম যা একটি নির্ভরশীল ভেরিয়েবলের (dependent variable) সাথে একটি (Simple Linear Regression) অথবা একাধিক (Multiple Linear Regression) স্বাধীন ভেরিয়েবলের (independent variables) সম্পর্ক নির্ধারণ করার জন্য ব্যবহৃত হয়।

১. Simple Linear Regression (SLR)

Simple Linear Regression হল একটি স্ট্যাটিস্টিক্যাল টেকনিক যা একটি নির্ভরশীল ভেরিয়েবলের (যেমন YY) সাথে একটি স্বাধীন ভেরিয়েবলের (যেমন XX) সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। এই সম্পর্কটি একটি সোজা রেখা (straight line) দ্বারা মডেল করা হয়।

ফর্মুলা:

Simple Linear Regression এর সাধারণ সমীকরণ:

Y=β0+β1X+ϵY = \beta_0 + \beta_1 X + \epsilon

  • YY হল নির্ভরশীল ভেরিয়েবল।
  • XX হল স্বাধীন ভেরিয়েবল।
  • β0\beta_0 হল ইন্টারসেপ্ট (intercept)।
  • β1\beta_1 হল স্লোপ (slope)।
  • ϵ\epsilon হল ত্রুটি (error term)।

বৈশিষ্ট্য:

  • একটি স্বাধীন ভেরিয়েবল XX এবং একটি নির্ভরশীল ভেরিয়েবল YY এর মধ্যে সম্পর্ক।
  • সোজা রেখা দ্বারা সম্পর্ক প্রদর্শন করা হয়।
  • Predictive modeling: নির্ভরশীল ভেরিয়েবলের মান অনুমান করতে ব্যবহার করা হয়।

উদাহরণ:

from sklearn.linear_model import LinearRegression
import numpy as np
import matplotlib.pyplot as plt

# ডেটা তৈরি
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)
Y = np.array([1, 2, 3, 4, 5])

# মডেল তৈরি
model = LinearRegression()
model.fit(X, Y)

# ভবিষ্যদ্বাণী করা
Y_pred = model.predict(X)

# গ্রাফ তৈরি করা
plt.scatter(X, Y, color='blue')  # ডেটা পয়েন্ট
plt.plot(X, Y_pred, color='red')  # রিগ্রেশন রেখা
plt.title('Simple Linear Regression')
plt.xlabel('X')
plt.ylabel('Y')
plt.show()

# মডেল প্যারামিটার
print("Intercept (β0):", model.intercept_)
print("Slope (β1):", model.coef_)

এটি Y=XY = X এর সাথে সম্পর্কযুক্ত একটি সোজা রেখা আঁকবে এবং মডেল প্যারামিটার (ইন্টারসেপ্ট এবং স্লোপ) প্রদর্শন করবে।


২. Multiple Linear Regression (MLR)

Multiple Linear Regression হল একটি স্ট্যাটিস্টিক্যাল টেকনিক যা একাধিক স্বাধীন ভেরিয়েবলের সাহায্যে একটি নির্ভরশীল ভেরিয়েবলের মান অনুমান করে। এতে একাধিক XX ভেরিয়েবল দ্বারা YY এর পূর্বানুমান করা হয়।

ফর্মুলা:

Multiple Linear Regression এর সাধারণ সমীকরণ:

Y=β0+β1X1+β2X2+...+βnXn+ϵY = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n + \epsilon

  • YY হল নির্ভরশীল ভেরিয়েবল।
  • X1,X2,...,XnX_1, X_2, ..., X_n হল স্বাধীন ভেরিয়েবল।
  • β0\beta_0 হল ইন্টারসেপ্ট।
  • β1,β2,...,βn\beta_1, \beta_2, ..., \beta_n হল স্লোপ/কোইফিসিয়েন্ট।
  • ϵ\epsilon হল ত্রুটি।

বৈশিষ্ট্য:

  • একাধিক স্বাধীন ভেরিয়েবল (যেমন X1,X2,...,XnX_1, X_2, ..., X_n) ব্যবহার করা হয়।
  • সম্পর্কের শক্তি এবং প্রতিটি স্বাধীন ভেরিয়েবলের প্রভাব মূল্যায়ন করা হয়।
  • এটি Prediction এবং Estimation এর জন্য ব্যবহার করা হয়।

উদাহরণ:

from sklearn.linear_model import LinearRegression
import numpy as np
import pandas as pd

# ডেটা তৈরি
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]])  # দুইটি স্বাধীন ভেরিয়েবল
Y = np.array([1, 2, 3, 4, 5])  # নির্ভরশীল ভেরিয়েবল

# মডেল তৈরি
model = LinearRegression()
model.fit(X, Y)

# ভবিষ্যদ্বাণী করা
Y_pred = model.predict(X)

# মডেল প্যারামিটার
print("Intercept (β0):", model.intercept_)
print("Coefficients (β1, β2):", model.coef_)

# ভবিষ্যদ্বাণী ফলাফল
print("Predicted Y:", Y_pred)

এটি দুইটি স্বাধীন ভেরিয়েবল (X1, X2) ব্যবহার করে নির্ভরশীল ভেরিয়েবল YY এর পূর্বানুমান করবে এবং মডেল প্যারামিটার (ইন্টারসেপ্ট এবং কোইফিসিয়েন্ট) প্রদর্শন করবে।


Simple Linear Regression এবং Multiple Linear Regression এর মধ্যে পার্থক্য

বৈশিষ্ট্যSimple Linear Regression (SLR)Multiple Linear Regression (MLR)
স্বাধীন ভেরিয়েবলএকটিই (Single Independent Variable)একাধিক (Multiple Independent Variables)
ধরনসোজা রেখা (Straight Line)সমতল বা উচ্চ মাত্রার সমীকরণ (Plane or Higher-Dimensional Equation)
ব্যবহারএকটি নির্ভরশীল ভেরিয়েবলের সঙ্গে একটি স্বাধীন ভেরিয়েবলের সম্পর্ক বিশ্লেষণএকাধিক স্বাধীন ভেরিয়েবলের সাহায্যে একটি নির্ভরশীল ভেরিয়েবলের পূর্বানুমান
সমীকরণY=β0+β1X+ϵY = \beta_0 + \beta_1 X + \epsilonY=β0+β1X1+β2X2+...+βnXn+ϵY = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n + \epsilon
সীমাবদ্ধতাকেবল একটির সঙ্গে সম্পর্ক বিশ্লেষণএকাধিক ভেরিয়েবলের মধ্যে সম্পর্ক বিশ্লেষণ করতে পারে

সারাংশ

  • Simple Linear Regression: এটি একটিমাত্র স্বাধীন ভেরিয়েবল XX ব্যবহার করে একটি নির্ভরশীল ভেরিয়েবল YY এর সম্পর্ক নির্ধারণ করে। এটি একটি সোজা রেখার সমীকরণ তৈরি করে।
  • Multiple Linear Regression: এটি একাধিক স্বাধীন ভেরিয়েবল X1,X2,...,XnX_1, X_2, ..., X_n ব্যবহার করে একটি নির্ভরশীল ভেরিয়েবল YY এর সম্পর্ক নির্ধারণ করে। এটি একটি উচ্চমাত্রার সমীকরণ তৈরি করে।

দুটি পদ্ধতিই Predictive Modeling এবং Relationship Analysis এর জন্য ব্যবহৃত হয়, তবে Multiple Linear Regression জটিল ডেটা বিশ্লেষণ করতে বেশি উপযোগী।

Content added By
Promotion

Are you sure to start over?

Loading...