লিনিয়ার রিগ্রেশন (Linear Regression) হলো একটি পরিমাণগত সুপারভাইজড লার্নিং অ্যালগরিদম যা ডিপেনডেন্ট ভেরিয়েবল (dependent variable) এবং ইন্ডিপেনডেন্ট ভেরিয়েবল (independent variable) এর মধ্যে সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। এটি একটি সোজাসাপ্টা রেখা (straight line) বের করে, যা ডেটার মধ্যে সম্পর্কের বিশ্লেষণ করে এবং পরবর্তী ইনপুট ডেটার জন্য ভবিষ্যদ্বাণী (prediction) করতে সাহায্য করে।
এটি সাধারণত রিগ্রেশন সমস্যাগুলোর সমাধান করতে ব্যবহৃত হয়, যেখানে আমরা পরিমাণগত মান অনুমান করার চেষ্টা করি, যেমন, ভবিষ্যতের তাপমাত্রা, বিক্রয় পরিমাণ, বা বাড়ির দাম ইত্যাদি।
লিনিয়ার রিগ্রেশন সমীকরণ
লিনিয়ার রিগ্রেশন মডেলটি একটি সোজাসাপ্টা রেখা তৈরি করার জন্য একটি সমীকরণ ব্যবহার করে। সাধারণত এটি নিম্নরূপ দেখায়:
এখানে:
- = আউটপুট ভেরিয়েবল (Dependent Variable)
- = ইনপুট ভেরিয়েবল (Independent Variable)
- = ইন্টারসেপ্ট (Intercept), রেখার শুরু বিন্দু
- = স্লোপ (Slope), এটি ইনপুট ভেরিয়েবলের পরিবর্তনের সাথে আউটপুট ভেরিয়েবলের পরিবর্তন বর্ণনা করে
- = ত্রুটি (Error), যা মডেলটির পূর্বাভাস এবং প্রকৃত আউটপুটের মধ্যে পার্থক্য
এই সমীকরণের মাধ্যমে, মডেলটি একটি সরল রেখা (straight line) তৈরি করে যা ইনপুট এবং আউটপুটের মধ্যে সম্পর্ক প্রকাশ করে।
লিনিয়ার রিগ্রেশন কীভাবে কাজ করে?
- ডেটা সংগ্রহ: প্রথমে একটি ডেটাসেট সংগ্রহ করা হয় যেখানে একটি আউটপুট (Target) ভেরিয়েবল এবং তার সাথে সম্পর্কিত এক বা একাধিক ইনপুট ভেরিয়েবল থাকে।
- মডেল ফিটিং: মডেলটি ইনপুট ডেটার উপর ভিত্তি করে প্রশিক্ষিত হয়। এটি একটি সোজাসাপ্টা রেখা খুঁজে বের করার জন্য লস ফাংশন (Loss Function) ব্যবহার করে, যা ডেটার সাথে সবচেয়ে ভালভাবে মেলে।
- লস ফাংশন: সাধারণত, Mean Squared Error (MSE) নামক একটি ফাংশন ব্যবহার করা হয় যাতে মডেলটি প্রতিটি পূর্বাভাসের ত্রুটি কমানোর চেষ্টা করে।
- ফাইনাল মডেল: একবার মডেলটি প্রশিক্ষিত হলে, এটি নতুন ডেটার জন্য আউটপুট অনুমান করতে সক্ষম হয়।
লিনিয়ার রিগ্রেশন এর প্রকারভেদ
সিম্পল লিনিয়ার রিগ্রেশন (Simple Linear Regression): এটি একটি ইনপুট ভেরিয়েবল (একটি একক বৈশিষ্ট্য) এবং একটি আউটপুট ভেরিয়েবল এর মধ্যে সম্পর্ক বিশ্লেষণ করে। এটি একক রেখা তৈরি করে।
উদাহরণ: বাড়ির দাম অনুমান করা, যেখানে একমাত্র বৈশিষ্ট্য হতে পারে বাড়ির আয়তন (Square Footage)।
মাল্টিপল লিনিয়ার রিগ্রেশন (Multiple Linear Regression): এটি একাধিক ইনপুট ভেরিয়েবল (একাধিক বৈশিষ্ট্য) এবং একটি আউটপুট ভেরিয়েবল এর মধ্যে সম্পর্ক বিশ্লেষণ করে। এতে একাধিক ফিচার এবং একটি আউটপুটের মধ্যে সম্পর্ক নির্ধারণ করা হয়।
উদাহরণ: বাড়ির দাম অনুমান করতে একাধিক বৈশিষ্ট্য যেমন, বাড়ির আয়তন, এলাকা, কক্ষ সংখ্যা ইত্যাদি ব্যবহার করা।
লিনিয়ার রিগ্রেশন এর অ্যাপ্লিকেশন
- বাজার বিশ্লেষণ: ব্যবসায়িক সিদ্ধান্ত গ্রহণের জন্য বিভিন্ন পণ্য বা সেবার মূল্য এবং বিক্রয় বিশ্লেষণ।
- আর্থিক বাজার: স্টক মার্কেটের পূর্বাভাস এবং মুদ্রার দাম অনুমান।
- স্বাস্থ্যসেবা: রোগীর চিকিৎসা এবং অন্যান্য স্বাস্থ্যসেবা ব্যয় অনুমান করা।
- এটা আরও অনেক ক্ষেত্রে, যেখানে ইনপুট এবং আউটপুটের মধ্যে সরল সম্পর্ক প্রতিষ্ঠিত করা সম্ভব।
লিনিয়ার রিগ্রেশন এর সুবিধা এবং সীমাবদ্ধতা
সুবিধা:
- সহজ এবং দ্রুত প্রশিক্ষণ।
- সহজে ব্যাখ্যা করা যায়, কারণ এটি একটি সোজা রেখা নির্ধারণ করে।
- ডেটা বিশ্লেষণ করতে খুব কার্যকরী।
সীমাবদ্ধতা:
- শুধুমাত্র লিনিয়ার সম্পর্কের ক্ষেত্রে সঠিকভাবে কাজ করে, তাই যদি ডেটার মধ্যে সোজাসাপ্টা সম্পর্ক না থাকে তবে এটি সঠিক ফলাফল নাও দিতে পারে।
- আউটলায়ার (Outliers) এর প্রভাব অনেক বেশি হতে পারে।
সারাংশ
লিনিয়ার রিগ্রেশন হল একটি শক্তিশালী টুল যা ডেটার মধ্যে সোজাসাপ্টা সম্পর্ক খুঁজে বের করতে ব্যবহৃত হয় এবং ভবিষ্যদ্বাণী করতে সহায়ক। এটি একাধিক ক্ষেত্রে ব্যবহৃত হয় এবং ডেটার সহজ এবং দ্রুত বিশ্লেষণ করতে সহায়ক।
Read more