Simple এবং Multiple Linear Regression

Machine Learning - সাইকিট-লার্ন (Scikit-Learn) - Linear Regression
231

Linear Regression একটি মৌলিক পরিসংখ্যানগত মডেল যা ডেটার মধ্যে সম্পর্ক খুঁজে বের করে এবং এটি সংখ্যামূলক প্রেডিকশন করার জন্য ব্যবহৃত হয়। এটি মূলত দ্বৈত ভেরিয়েবল বা বহু ভেরিয়েবল সম্পর্ক বুঝতে ব্যবহৃত হয়। Linear Regression-এর দুটি প্রধান ধরনের পদ্ধতি রয়েছে: Simple Linear Regression এবং Multiple Linear Regression


1. Simple Linear Regression (সরল রৈখিক রিগ্রেশন)

Simple Linear Regression একটি সরল রিগ্রেশন মডেল যা দুটি ভেরিয়েবলের মধ্যে সম্পর্ক প্রদর্শন করে। এই মডেলে, একটি স্বতন্ত্র ভেরিয়েবল (independent variable) এবং একটি নির্ভরশীল ভেরিয়েবল (dependent variable) থাকে। মূলত এটি একটি সরল সোজা রেখার মাধ্যমে সম্পর্ক গড়ে তোলে এবং সেই রেখার সাহায্যে ভবিষ্যতের মান পূর্বাভাস করা হয়।

মডেল ফর্মুলা:

y=β0+β1x+ϵy = \beta_0 + \beta_1 x + \epsilon

যেখানে:

  • yy হল নির্ভরশীল ভেরিয়েবল (Dependent Variable),
  • xx হল স্বাধীন ভেরিয়েবল (Independent Variable),
  • β0\beta_0 হল ইন্টারসেপ্ট (Intercept),
  • β1\beta_1 হল স্লোপ (Slope),
  • ϵ\epsilon হল ত্রুটি (Error Term)।

উদাহরণ:

ধরা যাক, আপনি একটি কোম্পানির বিজ্ঞাপন ব্যয়ের সাথে বিক্রয় (sales) এর সম্পর্ক বুঝতে চান। এখানে, বিজ্ঞাপন ব্যয় (advertising expenditure) হল স্বাধীন ভেরিয়েবল (x), এবং বিক্রয় (sales) হল নির্ভরশীল ভেরিয়েবল (y)। আপনার লক্ষ্য হলো বিজ্ঞাপন ব্যয়ের উপর ভিত্তি করে বিক্রয় পূর্বাভাস করা।

উদাহরণ কোড:

from sklearn.linear_model import LinearRegression
import numpy as np

# উদাহরণ ডেটা (advertising ব্যয় এবং বিক্রয়)
X = np.array([[1], [2], [3], [4], [5]])  # Independent variable (advertising expenditure)
y = np.array([1, 2, 2.8, 3.6, 4.5])    # Dependent variable (sales)

# মডেল প্রশিক্ষণ
model = LinearRegression()
model.fit(X, y)

# পূর্বাভাস
predictions = model.predict(X)
print("Predictions:", predictions)

ব্যাখ্যা:
এখানে, মডেলটি X (advertising expenditure) এর সাথে সম্পর্কিত y (sales) এর জন্য একটি সরল রেখা আঁকে এবং সেখান থেকে ভবিষ্যতের বিক্রয় অনুমান করে।


2. Multiple Linear Regression (বহু রৈখিক রিগ্রেশন)

Multiple Linear Regression হল একটি রিগ্রেশন মডেল যা একাধিক স্বাধীন ভেরিয়েবল ব্যবহার করে নির্ভরশীল ভেরিয়েবলের মূল্য অনুমান করে। এটি সার্বিক সম্পর্ক ব্যাখ্যা করতে ব্যবহৃত হয়, যেখানে একাধিক ফিচারের মাধ্যমে একটি আউটপুট পূর্বাভাস করা হয়।

মডেল ফর্মুলা:

y=β0+β1x1+β2x2++βnxn+ϵy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_n x_n + \epsilon

যেখানে:

  • yy হল নির্ভরশীল ভেরিয়েবল (Dependent Variable),
  • x1,x2,,xnx_1, x_2, \ldots, x_n হল স্বাধীন ভেরিয়েবল (Independent Variables),
  • β0\beta_0 হল ইন্টারসেপ্ট (Intercept),
  • β1,β2,,βn\beta_1, \beta_2, \ldots, \beta_n হল প্রতিটি স্বাধীন ভেরিয়েবলের জন্য স্লোপ (Slope),
  • ϵ\epsilon হল ত্রুটি (Error Term)।

উদাহরণ:

ধরা যাক, আপনি একটি কোম্পানির বিজ্ঞাপন ব্যয় (advertising expenditure), প্রমোশনাল ডিসকাউন্ট (promotional discount), এবং সেলস ফোর্স (sales force) এর সাথে বিক্রয়ের সম্পর্ক বুঝতে চান। এখানে তিনটি স্বাধীন ভেরিয়েবল থাকবে: বিজ্ঞাপন ব্যয়, ডিসকাউন্ট এবং সেলস ফোর্স। বিক্রয় (sales) হবে নির্ভরশীল ভেরিয়েবল।

উদাহরণ কোড:

from sklearn.linear_model import LinearRegression
import numpy as np

# উদাহরণ ডেটা (advertising ব্যয়, ডিসকাউন্ট, সেলস ফোর্স)
X = np.array([[1, 2000, 10], [2, 2500, 15], [3, 3000, 20], [4, 3500, 25], [5, 4000, 30]])  # Independent variables
y = np.array([1, 2, 3, 4, 5])  # Dependent variable (sales)

# মডেল প্রশিক্ষণ
model = LinearRegression()
model.fit(X, y)

# পূর্বাভাস
predictions = model.predict(X)
print("Predictions:", predictions)

ব্যাখ্যা:
এখানে, আমরা তিনটি স্বাধীন ভেরিয়েবল (advertising expenditure, promotional discount, sales force) ব্যবহার করে বিক্রয় (sales) পূর্বাভাস করতে চাই। মডেলটি এই ভেরিয়েবলগুলির মধ্যে সম্পর্ক তৈরি করে এবং নতুন ডেটার জন্য পূর্বাভাস দেয়।


Simple এবং Multiple Linear Regression এর মধ্যে পার্থক্য

বৈশিষ্ট্যSimple Linear RegressionMultiple Linear Regression
স্বাধীন ভেরিয়েবলএকটি (One)একাধিক (Multiple)
নির্ভরশীল ভেরিয়েবলএকটি (One)একটি (One)
মডেল ফর্মুলাy=β0+β1x+ϵy = \beta_0 + \beta_1 x + \epsilony=β0+β1x1+β2x2++βnxn+ϵy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_n x_n + \epsilon
ব্যবহারএকমাত্র স্বাধীন ভেরিয়েবলের সাথে সম্পর্ক বিশ্লেষণএকাধিক স্বাধীন ভেরিয়েবলের সাথে সম্পর্ক বিশ্লেষণ
উদাহরণবিজ্ঞাপন ব্যয় এবং বিক্রয় সম্পর্কবিজ্ঞাপন ব্যয়, ডিসকাউন্ট, সেলস ফোর্স এবং বিক্রয় সম্পর্ক

সারাংশ

  • Simple Linear Regression হল একটি সরল রিগ্রেশন মডেল যা দুটি ভেরিয়েবল (একটি স্বাধীন এবং একটি নির্ভরশীল) এর মধ্যে সম্পর্ক বিশ্লেষণ করে।
  • Multiple Linear Regression হল একটি উন্নত মডেল যা একাধিক স্বাধীন ভেরিয়েবল ব্যবহার করে একটি নির্ভরশীল ভেরিয়েবলের মান পূর্বাভাস করে।

এ দুটি রিগ্রেশন মডেলই ভবিষ্যত পূর্বাভাস বা সিদ্ধান্ত গ্রহণের জন্য কার্যকরী টুল হিসেবে ব্যবহৃত হয়, তবে Multiple Linear Regression আরও জটিল এবং বৈচিত্র্যময় ডেটার জন্য উপযুক্ত।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...