Regression analysis হল একটি পরিসংখ্যানিক পদ্ধতি যা দুই বা ততোধিক ভেরিয়েবলের মধ্যে সম্পর্ক বা সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। মূলত এটি একটি নির্দিষ্ট পরিবর্তনশীল ভেরিয়েবলের (dependent variable) পূর্বাভাস করার জন্য অন্য একটি বা তার বেশি পরিবর্তনশীল ভেরিয়েবলের (independent variables) ব্যবহার করে। Linear regression এবং Non-linear regression এই ধরনের বিশ্লেষণের দুটি প্রধান ধরন।
১. Linear Regression (লিনিয়ার রিগ্রেশন)
Linear Regression একটি পরিসংখ্যানিক পদ্ধতি যেখানে দুটি ভেরিয়েবলের মধ্যে সম্পর্ক লিনিয়ার (সরাসরি) আকারে ধরা হয়। এই পদ্ধতিতে, ডেটাকে একটি সোজা সরলরেখা (straight line) দিয়ে উপস্থাপন করা হয়, যেখানে ডিপেনডেন্ট ভেরিয়েবল (y) এবং ইন্ডিপেনডেন্ট ভেরিয়েবল (x) এর মধ্যে সম্পর্ক একটি সোজা লাইন দ্বারা ব্যাখ্যা করা হয়।
লিনিয়ার রিগ্রেশন এর সাধারণ সমীকরণ:
এখানে:
- y = ডিপেনডেন্ট ভেরিয়েবল (response variable),
- x = ইন্ডিপেনডেন্ট ভেরিয়েবল (predictor variable),
- β₀ = ইন্টারসেপ্ট (the point where the line crosses the y-axis),
- β₁ = স্লোপ (the slope of the line, which shows how y changes with respect to x),
- ε = ত্রুটি বা ভুল (error term)।
লিনিয়ার রিগ্রেশন এর বৈশিষ্ট্য:
- এটি একটি সরল রেখা তৈরির মাধ্যমে দুটি ভেরিয়েবলের মধ্যে সম্পর্ক নির্ধারণ করে।
- একটি সোজা লাইন দিয়ে ডেটাকে মডেল করা হয়, যা ডিপেনডেন্ট ভেরিয়েবলের পূর্বাভাস দেয়।
- সাধারণত least squares method ব্যবহার করা হয় এই সরল রেখাটি তৈরি করার জন্য।
উদাহরণ:
ধরা যাক, আপনি একটি দোকানের বিক্রির পরিমাণের সাথে বিজ্ঞাপন ব্যয়ের সম্পর্ক বিশ্লেষণ করতে চান। আপনি যদি বিজ্ঞাপন ব্যয়ের উপর ভিত্তি করে বিক্রির পূর্বাভাস দিতে চান, তাহলে আপনি লিনিয়ার রিগ্রেশন ব্যবহার করবেন।
২. Non-linear Regression (নন-লিনিয়ার রিগ্রেশন)
Non-linear Regression হল এমন একটি পরিসংখ্যানিক পদ্ধতি যেখানে ডিপেনডেন্ট এবং ইন্ডিপেনডেন্ট ভেরিয়েবলের মধ্যে সম্পর্ক লিনিয়ার নয়, বরং non-linear আকারে থাকে। এখানে ডেটাকে সোজা একটি রেখার মাধ্যমে মডেল করা যায় না, বরং এটি একটি কার্ভ (curve) দ্বারা মডেল করা হয়। এই পদ্ধতিতে, ডেটার আকার এবং প্রকৃতির উপর ভিত্তি করে বিভিন্ন ধরনের জটিল মডেল ব্যবহার করা হয়।
নন-লিনিয়ার রিগ্রেশন এর সাধারণ সমীকরণ:
নন-লিনিয়ার রিগ্রেশন এর সমীকরণ অনেক ধরনের হতে পারে, তবে একটি সাধারণ উদাহরণ:
এখানে:
- y = ডিপেনডেন্ট ভেরিয়েবল,
- x = ইন্ডিপেনডেন্ট ভেরিয়েবল,
- β₀, β₁, β₂ = প্যারামিটার (parameters)।
- e = ন্যাচারাল লগারিদমের ভিত্তি।
নন-লিনিয়ার রিগ্রেশন এর বৈশিষ্ট্য:
- এখানে সম্পর্ক লিনিয়ার নয়, বরং একে কোনো ধরণের কার্ভ বা জটিল ফাংশন দিয়ে মডেল করা হয়।
- এটি সাধারণত সিগময়েড, এক্সপোনেনশিয়াল, লজিস্টিক বা পাওয়ার ফাংশনের মতো মডেল ব্যবহার করে।
- প্যারামিটার অনুমান করতে, লিনিয়ার রিগ্রেশনের মত least squares method বা অন্য কোনো পদ্ধতি ব্যবহার করা হতে পারে, তবে কিছু ক্ষেত্রে এটি আরও জটিল হতে পারে।
উদাহরণ:
ধরা যাক, আপনি একটি ব্যাকটেরিয়া বৃদ্ধির মডেল তৈরি করতে চান যেখানে সময়ের সাথে সাথে ব্যাকটেরিয়ার সংখ্যা বৃদ্ধির হার প্রাথমিক অবস্থায় দ্রুত বৃদ্ধি পায় এবং পরে ধীরে ধীরে স্থির হয়ে যায়। এই ধরনের বৃদ্ধির জন্য non-linear regression ব্যবহার করা হয়, কারণ এটি এক্সপোনেনশিয়াল বা সিগময়েড আকারে হবে।
Linear Regression vs Non-linear Regression
| বৈশিষ্ট্য | Linear Regression | Non-linear Regression |
|---|---|---|
| সম্পর্কের ধরন | সরলরেখা (straight line) | কার্ভ বা জটিল সম্পর্ক (curve or complex relationship) |
| সমীকরণ | সরল (linear) | জটিল (non-linear) |
| প্রাপ্ত ফলাফল | একটি সোজা রেখা | একটি কার্ভ বা ভিন্ন ধরনের সম্পর্ক |
| ব্যবহার | সরল সম্পর্ক বিশ্লেষণ | জটিল সম্পর্ক বিশ্লেষণ |
| কম্প্লেক্সিটি | সহজ এবং দ্রুত | সাধারণত আরও জটিল এবং গণনামূলক |
| প্রকৃতি | এক্সপোনেনশিয়াল বৃদ্ধি বা সরল বৃদ্ধি | বক্রতা, সিগময়েড বা অন্যান্য জটিল বৃদ্ধি |
সারাংশ
Linear Regression এবং Non-linear Regression উভয়ই গুরুত্বপূর্ণ পরিসংখ্যানিক মডেলিং পদ্ধতি। Linear Regression সরল, সোজা সম্পর্ক নির্ধারণ করে এবং Non-linear Regression আরও জটিল এবং বক্র সম্পর্ক নির্ধারণে ব্যবহৃত হয়। যখন সম্পর্ক সরল, সোজা এবং প্রেডিকশন সহজ হয়, তখন Linear Regression ব্যবহৃত হয়, তবে যখন সম্পর্ক জটিল বা বক্র আকারে থাকে, তখন Non-linear Regression ব্যবহৃত হয়।
Read more