Random Variables এবং Probability Distributions পরিসংখ্যান এবং সম্ভাবনা তত্ত্বের গুরুত্বপূর্ণ অংশ। তারা ডেটার আচরণ বুঝতে এবং ভবিষ্যৎ পূর্বাভাস দিতে সাহায্য করে। এই দুটি ধারণা সম্পর্কে বিস্তারিত আলোচনা করা হল।
১. Random Variables (র্যান্ডম ভ্যারিয়েবল)
Random Variable (যাকে সাম্ভাব্য পরিবর্তনশীল বলা হয়) একটি ভ্যারিয়েবল যা নির্দিষ্ট ঘটনায় সম্ভাবনা অনুসারে বিভিন্ন মান গ্রহণ করতে পারে। এটি একটি সংখ্যাগত ভ্যারিয়েবল, যার মান নির্দিষ্ট না হয়ে একটি সম্ভাবনার ওপর নির্ভর করে। র্যান্ডম ভ্যারিয়েবল মূলত দুটি ধরনের হতে পারে:
ধরণ:
- Discrete Random Variable (বিচ্ছিন্ন র্যান্ডম ভ্যারিয়েবল):
- বিচ্ছিন্ন র্যান্ডম ভ্যারিয়েবল এমন ভ্যারিয়েবল যা কেবল নির্দিষ্ট সংখ্যক মান গ্রহণ করতে পারে।
- উদাহরণ: একটি তাসের প্যাকেট থেকে একটি কার্ড টানা, যেখানে সম্ভাব্য আউটপুট সংখ্যা (১ থেকে ১৩) সীমিত।
- উদাহরণ: একটি ছয়ফেসড ডাইকে নিক্ষেপ করার পর প্রাপ্ত সংখ্যা।
- Continuous Random Variable (ধারাবাহিক র্যান্ডম ভ্যারিয়েবল):
- ধারাবাহিক র্যান্ডম ভ্যারিয়েবল এমন ভ্যারিয়েবল যা নির্দিষ্ট পরিসরে যেকোনো মান গ্রহণ করতে পারে, অর্থাৎ এর মান একটি নির্দিষ্ট পরিসরের মধ্যে অবিচ্ছিন্নভাবে পরিবর্তিত হতে পারে।
- উদাহরণ: একটি ব্যক্তির উচ্চতা, যেখানে আউটপুট কোনো নির্দিষ্ট সংখ্যায় সীমাবদ্ধ নয়, বরং একটি পরিসরের মধ্যে চলতে থাকে।
- উদাহরণ: একটি গাড়ির গতি।
Random Variable এর ব্যবহার:
- Discrete Random Variable দিয়ে আমরা গাণিতিক সমস্যার সমাধান করতে পারি যেখানে সম্ভাব্য আউটপুট সংখ্যা সীমিত থাকে।
- Continuous Random Variable দিয়ে আমরা এমন ডেটার বিশ্লেষণ করতে পারি যেখানে আউটপুট একটানা পরিবর্তিত হতে পারে, যেমন তাপমাত্রা বা সময়।
২. Probability Distributions (সম্ভাবনা বন্টন)
Probability Distribution হল একটি গাণিতিক ফাংশন যা একটি র্যান্ডম ভ্যারিয়েবলের বিভিন্ন মানের জন্য সম্ভাবনা বরাদ্দ করে। এটি একটি ডেটা সেটের মধ্যে ভ্যারিয়েবলের বিভিন্ন সম্ভাব্য ফলাফল এবং তাদের সম্ভাবনা সম্পর্কিত তথ্য দেয়। Probability Distribution দুটি ধরনের হতে পারে:
ধরণ:
- Probability Mass Function (PMF) (সম্ভাবনা ভর ফাংশন):
- PMF ব্যবহৃত হয় discrete random variables এর জন্য। এটি প্রত্যেকটি নির্দিষ্ট মানের জন্য সম্ভাবনা নির্ধারণ করে।
- উদাহরণ: একটি ছয়ফেসড ডাইকে নিক্ষেপ করার পর যেকোনো একটি সংখ্যা পাওয়ার সম্ভাবনা ১/৬।
- PMF এর উদাহরণ:
- Probability Density Function (PDF) (সম্ভাবনা ঘনত্ব ফাংশন):
- PDF ব্যবহৃত হয় continuous random variables এর জন্য। এটি ধারাবাহিক ডেটা সেটের জন্য সম্ভাবনা নির্ধারণ করে। PDF এর সাহায্যে নির্দিষ্ট মানের জন্য সম্ভাবনা নির্ধারণ করা যায়, যদিও কোন নির্দিষ্ট পয়েন্টের জন্য সম্ভাবনা শূন্য হতে পারে। তবে, পরিসরের একটি নির্দিষ্ট ইন্টারভ্যালের জন্য সম্ভাবনা বের করা যায়।
- উদাহরণ: তাপমাত্রার পরিবর্তন যা একটি নির্দিষ্ট পরিসরে অবস্থিত থাকে, যেমন ২০-৩০°C।
Probability Distribution এর ব্যবহার:
- Discrete Probability Distribution ব্যবহার করে আমরা নির্দিষ্ট আউটপুটের জন্য সম্ভাবনা হিসাব করতে পারি, যেমন তাসের প্যাকেটের একটি কার্ড টানার সম্ভাবনা বা ডাই নিক্ষেপের ফলাফল।
- Continuous Probability Distribution ব্যবহার করে আমরা পরিসীমা বা ধ্রুবক মানের জন্য সম্ভাবনা বের করতে পারি, যেমন গাড়ির গতি বা তাপমাত্রার পরিবর্তন।
প্রধান Probability Distributions
১. Binomial Distribution (বাইনোমিয়াল বন্টন):
- Binomial Distribution হল একটি discrete distribution যা দুইটি সম্ভাব্য আউটকাম (যেমন সাফল্য বা ব্যর্থতা) নিয়ে গঠিত। এটি নির্দিষ্ট সংখ্যক ট্রায়াল এবং প্রতিটি ট্রায়ালে সাফল্যের সম্ভাবনা জানিয়ে ক্যালকুলেট করা হয়।
- উদাহরণ: একটি ডাই নিক্ষেপের পরে ‘১’ পাওয়ার সম্ভাবনা বার বার পরীক্ষা করা।
- ফর্মুলা:
২. Normal Distribution (নরমাল বন্টন):
- Normal Distribution হল একটি continuous distribution যা গৌসিয়ান বন্টনও নামে পরিচিত। এটি একটি সিমেট্রিক ডিস্ট্রিবিউশন এবং এর গড় এবং মানদণ্ড দ্বারা সম্পূর্ণভাবে বর্ণিত হয়।
- উদাহরণ: মানুষের উচ্চতা, পরীক্ষার নম্বর, বা তাপমাত্রা সাধারণত নরমাল বন্টনে থাকে।
- ফর্মুলা:
৩. Poisson Distribution (পোয়াসন বন্টন):
- Poisson Distribution হল একটি discrete distribution যা নির্দিষ্ট সময় বা স্থানকালে একটি নির্দিষ্ট ঘটনা ঘটে এমন সম্ভাবনা মাপার জন্য ব্যবহৃত হয়।
- উদাহরণ: প্রতি ঘণ্টায় একটি দোকানে গ্রাহক আগমন সংখ্যা।
৪. Exponential Distribution (এক্সপোনেনশিয়াল বন্টন):
- Exponential Distribution হল একটি continuous distribution যা সাধারণত ডেটা পয়েন্টের মধ্যে সময়ের ব্যবধান মাপার জন্য ব্যবহৃত হয়।
- উদাহরণ: একটি মেশিনের ব্যর্থতার পরবর্তী সময় বা সার্ভিস কল করার সময়।
সারাংশ
Random Variables এবং Probability Distributions পরিসংখ্যানের মৌলিক অংশ যা আমাদের বিভিন্ন ধরনের ডেটার সম্ভাবনা এবং আচরণ বিশ্লেষণ করতে সাহায্য করে। Random Variables দুটি ধরনের, discrete এবং continuous হতে পারে, এবং তাদের ভিত্তিতে Probability Distributions তৈরি করা হয়। এই বন্টনগুলি (যেমন Binomial, Normal, Poisson, এবং Exponential) ডেটার সম্ভাবনা, প্রবণতা এবং অন্যান্য বৈশিষ্ট্য চিহ্নিত করতে ব্যবহৃত হয়।
Random Variable (যৌক্তিক চলক) পরিসংখ্যান ও সম্ভাবনা তত্ত্বে ব্যবহৃত একটি মৌলিক ধারণা। এটি একটি সংখ্যা বা মান যা একটি র্যান্ডম বা আনপূর্বাণু ঘটনা বা প্রক্রিয়ার উপর নির্ভর করে। যেকোনো পরীক্ষার বা ঘটনা ঘটানোর পর, আমরা যে ফলাফল বা মানটি আশা করতে পারি, সেটি হলো র্যান্ডম ভ্যারিয়েবল।
Random Variable এর সংজ্ঞা
Random Variable হল একটি চলক বা ভ্যারিয়েবল যা কোনো র্যান্ডম পরীক্ষার বা ঘটনাবলীর ফলস্বরূপ কোনো নির্দিষ্ট মান গ্রহণ করে। এটি যে কোনো সম্ভাব্য মান বা মানের মধ্যে সীমাবদ্ধ থাকে এবং এগুলোর প্রত্যেকটির একটি সম্ভাবনা থাকে।
যেমন, একটি উল্টানো কয়েনের পরীক্ষা বা একটা তাস থেকে কোনো একটি কার্ড টানা, এর ফলাফলগুলো বিভিন্ন রকমের হতে পারে এবং সেগুলির উপর ভিত্তি করে একটি random variable এর মান নির্ধারিত হবে।
Random Variable এর প্রকারভেদ
র্যান্ডম ভ্যারিয়েবল দুই ধরনের হতে পারে:
- Discrete Random Variable (বৈচিত্র্যময় র্যান্ডম ভ্যারিয়েবল)
- Continuous Random Variable (অব্যাহত র্যান্ডম ভ্যারিয়েবল)
১. Discrete Random Variable (বৈচিত্র্যময় র্যান্ডম ভ্যারিয়েবল)
Discrete Random Variable হলো এমন একটি র্যান্ডম ভ্যারিয়েবল, যার সম্ভাব্য মানগুলো সুনির্দিষ্ট এবং গুনগতভাবে সীমিত। এই ধরনের র্যান্ডম ভ্যারিয়েবল শুধুমাত্র গাণিতিক বা নির্দিষ্ট সংখ্যার মান নিতে পারে এবং এর মধ্যে একক মানের মধ্যে কোনও বিরতি থাকে না।
উদাহরণ:
- একটি কাস্টম পরীক্ষা তে মোট ছাত্র সংখ্যা।
- একটি ডাইস উল্টানোর ফলাফল (১ থেকে ৬ পর্যন্ত কোনো একটি সংখ্যা)।
- একটি তাস থেকে একটি কার্ড টানার পর যে সংখ্যা আসবে (১ থেকে ১৩)।
Discrete Random Variable এর বৈশিষ্ট্য:
- এটি নির্দিষ্ট এবং গুনগত মান নেয়।
- এর মান সংখ্যায় গোনা যায় (যেমন ০, ১, ২, ৩ ইত্যাদি)।
- এর মধ্যে অদৃশ্য স্থান বা অসম্পূর্ণ মান থাকে না।
গণনার পদ্ধতি:
Discrete random variable এর জন্য Probability Mass Function (PMF) ব্যবহার করা হয়, যেখানে প্রতিটি মানের সাথে সম্পর্কিত একটি নির্দিষ্ট সম্ভাবনা নির্ধারণ করা হয়।
২. Continuous Random Variable (অব্যাহত র্যান্ডম ভ্যারিয়েবল)
Continuous Random Variable হলো এমন একটি র্যান্ডম ভ্যারিয়েবল, যার সম্ভাব্য মান একান্তই কোনো সীমা ছাড়াই ধারাবাহিক এবং যে কোনো মানের মধ্যে কোনো বিরতি থাকে না। এর মানগুলো সীমাহীন এবং কোনো নির্দিষ্ট ইন্টারভ্যালের মধ্যে যেকোনো মান হতে পারে।
উদাহরণ:
- একজন ব্যক্তির উচ্চতা (যে কোনো সেন্টিমিটারে হতে পারে)।
- একটি গাড়ির গতি (যেকোনো কিলোমিটার প্রতি ঘণ্টায় হতে পারে)।
- সময় (যেকোনো নির্দিষ্ট সময়ে ঘটে যেতে পারে, যেমন ২.৫৬ সেকেন্ড, ৩.৭৮ সেকেন্ড ইত্যাদি)।
Continuous Random Variable এর বৈশিষ্ট্য:
- এটি সংখ্যা বা মানের কোনো সীমা ছাড়া ধারাবাহিক পরিবর্তনশীল।
- এর মান নির্দিষ্ট পরিমাণে হিসাব করা সম্ভব নয় (যেমন, ৩.১৪১৬ বা ২.৭৩৭ ইত্যাদি)।
- এর মান পরিমাপযোগ্য এবং এর মধ্যে কোনো "বিরতি" বা "বাঁধা" থাকে না।
গণনার পদ্ধতি:
Continuous random variable এর জন্য Probability Density Function (PDF) ব্যবহৃত হয়, যা একটি নির্দিষ্ট ইন্টারভ্যালের মধ্যে সম্ভাবনার ঘনত্ব প্রকাশ করে।
Discrete এবং Continuous Random Variable এর মধ্যে পার্থক্য
| বৈশিষ্ট্য | Discrete Random Variable | Continuous Random Variable |
|---|---|---|
| মানের ধরন | সুনির্দিষ্ট, গুনগত সংখ্যা (যেমন ১, ২, ৩) | ধারাবাহিক, কোনো সীমা ছাড়াই (যেমন ২.৫, ৩.৭৮, ৯.১) |
| সংখ্যার পরিমাণ | সংখ্যায় গোনা যায় (অথবা গণনা করা যায়) | অগণনীয়, অসীম সংখ্যক মান হতে পারে |
| পদ্ধতি | Probability Mass Function (PMF) | Probability Density Function (PDF) |
| উদাহরণ | ডাইসের ফলাফল, ছাত্র সংখ্যা, কয়েন উল্টানো | উচ্চতা, সময়, তাপমাত্রা |
সারাংশ
Random Variables হল এমন চলক যা র্যান্ডম পরীক্ষার ফলাফল বা ডেটার উপর নির্ভর করে। এর দুটি প্রকার:
- Discrete Random Variable যা সুনির্দিষ্ট, গুনগত মান নেয়।
- Continuous Random Variable যা ধারাবাহিকভাবে পরিমাপযোগ্য মান নেয়, এবং এর মান একটি নির্দিষ্ট ইন্টারভ্যালের মধ্যে হতে পারে।
এগুলি পরিসংখ্যান ও সম্ভাবনা তত্ত্বে গুরুত্বপূর্ণ ভূমিকা পালন করে এবং বিভিন্ন রকমের ডেটা বিশ্লেষণ ও সিদ্ধান্ত গ্রহণে সাহায্য করে।
Probability Mass Function (PMF) এবং Probability Density Function (PDF) দুটি পরিসংখ্যানিক ধারণা যা প্রোবাবিলিটি থিওরি এবং সম্ভাবনা তত্ত্বে ব্যবহৃত হয়। এই দুটি ফাংশন সম্ভবনা বা প্রোবাবিলিটির বণ্টন বোঝাতে ব্যবহৃত হয়, তবে তাদের ব্যবহার এবং প্রকারে পার্থক্য রয়েছে। এখানে আমরা PMF এবং PDF এর মধ্যে পার্থক্য এবং তাদের বৈশিষ্ট্যগুলো আলোচনা করব।
১. Probability Mass Function (PMF)
Probability Mass Function (PMF) একটি ডিসক্রিট (discrete) সম্ভাবনা ফাংশন যা নির্দিষ্ট ডেটার জন্য প্রোবাবিলিটি বা সম্ভাবনা নির্ধারণ করে। এটি ডিসক্রিট র্যান্ডম ভেরিয়েবল বা বৈশিষ্ট্যের সম্ভাবনা বণ্টন প্রদান করে, যেখানে প্রতিটি সম্ভব মানের জন্য সম্ভাবনার একটি নির্দিষ্ট পরিমাণ থাকে।
PMF এর বৈশিষ্ট্য:
- PMF শুধুমাত্র discrete (ডিসক্রিট) ডেটা সেটের জন্য ব্যবহারযোগ্য, যেমন পুরো সংখ্যাগুলি বা আলাদা আলাদা মান।
- PMF সাধারণত হিসেবে চিহ্নিত করা হয়, যেখানে র্যান্ডম ভেরিয়েবল এবং সম্ভাব্য মান।
- , অর্থাৎ সব সম্ভাবনার যোগফল ১ হতে হবে।
উদাহরণ:
ধরা যাক, একটি সিক্স-ফেসড ডাইসের ফলাফল একটি ডিসক্রিট র্যান্ডম ভেরিয়েবল। যদি ডাইসের ফলাফল হয়, তবে PMF হবে:
এখানে প্রতিটি ফলাফলের জন্য সম্ভাবনা থাকবে এবং তাদের যোগফল ১ হবে।
২. Probability Density Function (PDF)
Probability Density Function (PDF) একটি কন্টিনিউয়াস (continuous) র্যান্ডম ভেরিয়েবলের সম্ভাবনা ফাংশন। এটি কন্টিনিউয়াস ডেটার জন্য ব্যবহৃত হয়, যেখানে নির্দিষ্ট একটি মানে সম্ভাবনা হিসাব করা যায় না, কিন্তু নির্দিষ্ট একটি রেঞ্জের মধ্যে সম্ভাবনা বের করা যায়।
PDF এর বৈশিষ্ট্য:
- PDF সাধারণত continuous (কন্টিনিউয়াস) ডেটা সেটের জন্য ব্যবহৃত হয়, যেমন গতি, উচ্চতা বা সময়।
- PDF ফাংশন দিয়ে চিহ্নিত করা হয়, এবং সম্ভাবনার যোগফল ১ হতে হবে, অর্থাৎ:
- PDF এর মান কখনও নেগেটিভ হতে পারে না, অর্থাৎ ।
উদাহরণ:
ধরা যাক, একটি গড় উচ্চতা বিশ্লেষণ করা হচ্ছে। যদি হয়ে থাকে উচ্চতা, তবে PDF এ নির্দেশ করবে উচ্চতার নির্দিষ্ট রেঞ্জে সম্ভাবনা। উদাহরণস্বরূপ, কোন একজন মানুষের উচ্চতা 170 সেন্টিমিটার হওয়ার সম্ভাবনা হবে, যা একটি নির্দিষ্ট রেঞ্জে PDF ফাংশনের অধীনে সন্নিবেশিত।
PMF এবং PDF এর মধ্যে পার্থক্য
| বৈশিষ্ট্য | PMF (Probability Mass Function) | PDF (Probability Density Function) |
|---|---|---|
| ডেটার ধরন | ডিসক্রিট (Discrete) ডেটা | কন্টিনিউয়াস (Continuous) ডেটা |
| ফাংশনের মান | ফাংশনটি নির্দিষ্ট মানে সম্ভাবনা প্রদান করে | ফাংশনটি সম্ভাবনা ঘনত্ব (density) প্রদান করে |
| যতটুকু সম্ভব পরিসীমা | নির্দিষ্ট মানের জন্য সম্ভাবনা | রেঞ্জ বা সন্নিবেশিত পরিসীমা |
| ফাংশন সংজ্ঞা | ||
| সম্ভাবনা | প্রতিটি সম্ভব মানের জন্য সম্ভাবনা গণনা করা হয় | নির্দিষ্ট রেঞ্জে সম্ভাবনা গণনা করা হয় |
| যোগফল |
সারাংশ
PMF এবং PDF উভয়ই সম্ভাবনা বা প্রোবাবিলিটি বণ্টন বোঝাতে ব্যবহৃত হয়, তবে তাদের মধ্যে প্রধান পার্থক্য হল: PMF ডিসক্রিট ডেটার জন্য এবং PDF কন্টিনিউয়াস ডেটার জন্য। PMF প্রতিটি নির্দিষ্ট মানের জন্য সম্ভাবনা প্রদান করে, যেখানে PDF একটি নির্দিষ্ট রেঞ্জের মধ্যে সম্ভাবনা প্রদান করে। PMF এর জন্য যোগফল ১ হয়, আর PDF এর জন্য ইন্টিগ্রেশন (integration) দ্বারা মান নির্ধারণ করা হয়।
Cumulative Distribution Function (CDF) একটি পরিসংখ্যানিক ফাংশন যা একটি র্যান্ডম ভ্যারিয়েবলের মানের চেয়ে ছোট বা সমান মানের সম্ভাবনা (probability) প্রদর্শন করে। এটি একটি ডেটাসেটের কিউমুলেটিভ (সমষ্টিগত) সম্ভাবনা বণ্টন নির্দেশ করে, অর্থাৎ এটি কতটুকু সম্ভাবনা রয়েছে যে একটি র্যান্ডম ভ্যারিয়েবলের মান একটি নির্দিষ্ট মানের নিচে বা তার সমান হবে।
CDF এর ধারণা:
যদি একটি র্যান্ডম ভ্যারিয়েবল হয়, তাহলে CDF হল:
এখানে, হল CDF ফাংশন এবং হল -এর মানের চেয়ে ছোট বা সমান হওয়ার সম্ভাবনা।
CDF এর বৈশিষ্ট্য:
- আনুপাতিক বৃদ্ধি: CDF ফাংশন কখনোই হ্রাস পায় না, এটি শুধুমাত্র বাড়ে। অর্থাৎ, CDF একটি নিরবচ্ছিন্ন বা অবিচ্ছিন্নভাবে বৃদ্ধি পায়।
- মানের সীমা: CDF এর মান সর্বদা 0 থেকে 1 এর মধ্যে থাকে:
- এর মানে হল যে এর মান কখনোই এর চেয়ে কম হবে না।
- এর মানে হল যে এর মান সর্বদা এর চেয়ে কম বা সমান।
- নিরবচ্ছিন্নতা: CDF ফাংশন একেবারে কোন গ্যাপ বা লাফিং (jumping) ছাড়াই একটি নিরবচ্ছিন্ন ফাংশন হয়। বিশেষত, এটি সাধারণত সোজা বা ঝুঁকির সাথে পরিবর্তিত হয়।
- ডিফারেন্সিয়েবল ফাংশন: CDF-এর ডেরিভেটিভ হলো Probability Density Function (PDF) (যদি একটি অবিচ্ছিন্ন র্যান্ডম ভ্যারিয়েবল হয়)। এটি মূলত দেখায় যে একটি নির্দিষ্ট পরিসরের মধ্যে কতটুকু সম্ভাবনা রয়েছে।
CDF এর ব্যবহার:
- সম্ভাবনা গণনা: CDF ব্যবহার করে, আপনি সহজেই কোনো ডেটার মানের চেয়ে কম বা সমান হওয়ার সম্ভাবনা বের করতে পারেন।
- উদাহরণ: যদি হল একজন শিক্ষার্থীর পরীক্ষার ফলাফল এবং হল ৭০, তাহলে হল , অর্থাৎ পরীক্ষায় ৭০ বা তার কম নম্বর পাওয়ার সম্ভাবনা।
- ক্যালকুলেশন এবং তুলনা: CDF ব্যবহার করে, বিভিন্ন ডেটাসেটের সম্ভাবনার তুলনা করা যায় এবং তাদের গড়, পরিবর্তনশীলতা বা আউটলায়ার মূল্যায়ন করা যায়।
- বণ্টন বিশ্লেষণ: CDF ফাংশন ডেটার বণ্টন, যেমন Normal Distribution, Uniform Distribution, বা Exponential Distribution বিশ্লেষণ করতে ব্যবহৃত হয়।
CDF এর উদাহরণ:
ধরা যাক, একটি র্যান্ডম ভ্যারিয়েবল, যা 0 থেকে 10 পর্যন্ত একটি Uniform Distribution অনুসরণ করে (অর্থাৎ, এর মান 0 থেকে 10 এর মধ্যে যেকোনো মান হতে পারে এবং সমস্ত মানের সম্ভাবনা সমান)। এর জন্য CDF ফাংশন হবে:
এখানে, যদি , তাহলে:
অর্থাৎ, এর মান 5 বা তার কম হওয়ার সম্ভাবনা হল 0.5 বা 50%।
CDF এবং PDF এর মধ্যে সম্পর্ক:
- PDF (Probability Density Function): CDF এর ডেরিভেটিভ হলো PDF। যদি হল CDF, তবে PDF হবে:
- CDF এবং PDF এর সম্পর্ক: CDF ডেটার সম্ভাবনার সমষ্টি (cumulative probability) দেয়, যেখানে PDF ডেটার নির্দিষ্ট একটি পরিসরে সম্ভাবনার ঘনত্ব বা বন্টন প্রদর্শন করে।
CDF এর আউটপুট
- CDF একটি সোজা গ্রাফের মতো হতে পারে যা নির্দিষ্ট সীমা -এর নিচে এর মানের সম্ভাবনা দেখায়। এটি 0 থেকে 1 এর মধ্যে বাড়ে।
- যখন বৃদ্ধি পায়, CDF এর মানও বাড়ে, যা একটি একধরনের শিখর সৃষ্টি করে।
সারাংশ
Cumulative Distribution Function (CDF) হল একটি পরিসংখ্যানিক ফাংশন যা র্যান্ডম ভ্যারিয়েবলের মানের চেয়ে ছোট বা সমান হওয়ার সম্ভাবনা চিহ্নিত করে। এটি ডেটার কিউমুলেটিভ সম্ভাবনা প্রদর্শন করে এবং র্যান্ডম ভ্যারিয়েবলটির বণ্টন বুঝতে সহায়ক। CDF এবং PDF একে অপরের সাথে সম্পর্কিত, যেখানে CDF হল PDF এর সমষ্টি। CDF ফাংশন বিভিন্ন ডেটাসেটের বৈশিষ্ট্য বিশ্লেষণ করতে এবং সম্ভাবনা গণনা করতে ব্যবহার করা হয়।
Expectation এবং Variance হল সম্ভাবনা তত্ত্বে ব্যবহৃত দুটি মৌলিক ধারণা, যা একটি র্যান্ডম ভ্যারিয়েবলের বৈশিষ্ট্য এবং তার আচরণ বোঝাতে সাহায্য করে। এগুলি পরিসংখ্যানিক পরিমাপ, যা আমাদেরকে ডেটার গড় এবং ছড়িয়ে পড়ার সম্পর্কে ধারণা দেয়।
১. Expectation of a Random Variable (এক্সপেকটেশন)
Expectation (অথবা গাণিতিক প্রত্যাশা) হল একটি র্যান্ডম ভ্যারিয়েবলের গড় মান, যা সম্ভাব্য মানগুলির সাথে তাদের সম্ভাবনার গুণফলের যোগফল। এটি র্যান্ডম ভ্যারিয়েবলের কেন্দ্রীয় প্রবণতা বা গড় মান প্রকাশ করে। Expectation একটি গুরুত্বপূর্ণ পরিমাপ কারণ এটি একটি র্যান্ডম ভ্যারিয়েবলের ভবিষ্যৎ মানের একটি গাণিতিক পূর্বাভাস প্রদান করে।
ফর্মুলা:
যদি একটি ডিসক্রিট র্যান্ডম ভ্যারিয়েবল হয় যার সম্ভাবনা ভর ফাংশন , তাহলে এক্সপেকটেশন বা গাণিতিক প্রত্যাশা হবে:
এছাড়া, যদি একটি কন্টিনিউয়াস র্যান্ডম ভ্যারিয়েবল হয়, তাহলে এক্সপেকটেশন হবে:
এখানে, হল র্যান্ডম ভ্যারিয়েবলের ঘনত্ব ফাংশন।
উদাহরণ:
ধরা যাক, একটি骰ি নিক্ষেপ করা হচ্ছে। হল ফলাফল, যেখানে । প্রতিটি ফলাফলের সম্ভাবনা ।
এক্ষেত্রে, এক্সপেকটেশন হবে:
এতে বোঝানো হচ্ছে যে, দীর্ঘকাল ধরে骰ি নিক্ষেপ করলে গড় ফলাফল ৩.৫ হবে।
২. Variance of a Random Variable (ভেরিয়েন্স)
Variance (ভেরিয়েন্স) হল একটি র্যান্ডম ভ্যারিয়েবলের মানের গড় থেকে কতটা বিচ্যুতি (deviation) ঘটছে তার পরিমাপ। এটি র্যান্ডম ভ্যারিয়েবলের সৃষ্ট বৈচিত্র্য বা ছড়িয়ে পড়ার মাপ। Variance কে সাধারনত দ্বারা চিহ্নিত করা হয় এবং এটি ডেটার বিস্তার বা ভিন্নতার পরিমাপ।
ফর্মুলা:
Variance একটি র্যান্ডম ভ্যারিয়েবলের প্রত্যাশা থেকে এর বিচ্যুতির স্কোয়ার গড় (বিভিন্নতা) হয়। ডিসক্রিট র্যান্ডম ভ্যারিয়েবলের জন্য:
এবং কন্টিনিউয়াস র্যান্ডম ভ্যারিয়েবলের জন্য:
এটি ডেটার ফ্লাকচুয়েশন বা ছড়িয়ে পড়ার মাত্রা দেখায়।
উদাহরণ:
ধরা যাক, আগের উদাহরণে আমরা dice-র ফলাফল নিয়ে কাজ করছি, যেখানে । এখন, ভেরিয়েন্স হবে:
এখানে, variance 2.92, যা দেখায় যে骰ির ফলাফল গড় থেকে প্রায় ২.৯২ ইউনিটের মধ্যে ছড়িয়ে পড়ছে।
Relation between Expectation and Variance
- Expectation (E(X)) একটি র্যান্ডম ভ্যারিয়েবলের গড় মান নির্ধারণ করে, যা তার কেন্দ্রীয় প্রবণতা প্রকাশ করে।
- Variance (Var(X)) র্যান্ডম ভ্যারিয়েবলের ডেটার বৈচিত্র্য বা ছড়িয়ে পড়ার পরিমাপ প্রদান করে।
এটি মনে রাখতে হবে যে Variance কখনো Expectation থেকে পৃথক এবং এর একক গড়ের একক থেকে আলাদা থাকে, তবে এটি মূলত ডেটার গতিপথ এবং তার বিস্তার বোঝাতে সহায়ক।
সারাংশ
Expectation এবং Variance হল র্যান্ডম ভ্যারিয়েবলের দুটি গুরুত্বপূর্ণ পরিমাপ। Expectation ডেটার গড় বা কেন্দ্রীক প্রবণতা এবং Variance ডেটার বিস্তার বা বৈচিত্র্য পরিমাপ করে। এগুলি সাধারণত সম্ভাবনা তত্ত্বে ব্যবহৃত হয় এবং আমাদেরকে র্যান্ডম ভ্যারিয়েবলের আচরণ এবং তার সম্ভাব্য পরিবর্তনশীলতা বুঝতে সাহায্য করে।
Read more