Parametric এবং Non-parametric টেস্টগুলি পরিসংখ্যানের গুরুত্বপূর্ণ পদ্ধতি যা ডেটার বিভিন্ন বৈশিষ্ট্য এবং গুণগত বিশ্লেষণ করতে ব্যবহৃত হয়। এই দুই ধরনের টেস্টের মধ্যে মৌলিক পার্থক্য হল যে Parametric Tests নির্দিষ্ট ডিস্ট্রিবিউশন (যেমন, Normal distribution) এবং প্যারামিটার অনুমান ব্যবহার করে, যেখানে Non-parametric Tests কোন নির্দিষ্ট ডিস্ট্রিবিউশন বা প্যারামিটার সম্পর্কে কোনো ধারণা তৈরি করে না এবং এটি সাধারণত ছোট স্যাম্পল বা ডেটার মধ্যে অস্বাভাবিক পরিস্থিতিতে ব্যবহৃত হয়।
১. Parametric Tests (প্যারামেট্রিক টেস্ট)
Parametric Tests হল এমন পরিসংখ্যানিক পরীক্ষা যা ডেটার প্যারামিটার (যেমন, গড়, ভিন্নতা) এবং নির্দিষ্ট ডিস্ট্রিবিউশন (সাধারণত Normal distribution) সম্পর্কে ধারণা ব্যবহার করে। এগুলি শুধুমাত্র তখনই কার্যকরী হয় যখন ডেটা স্বাভাবিকভাবে বিতরণ করা থাকে এবং ডেটা সম্পর্কে কিছু পূর্বধারণা বা প্যারামিটার নির্ধারণ করা যায়।
বিশেষত্ব:
- Normal Distribution অনুমান করা হয়।
- ডেটার জন্য কিছু প্যারামিটার (যেমন, গড় এবং ভিন্নতা) জানা থাকে।
- এটি বড় স্যাম্পল সাইজের জন্য কার্যকরী।
- Parametric Tests সাধারণত অধিক শক্তিশালী এবং নিখুঁত ফলাফল দেয় যদি ডেটা প্যারামিটার সম্পর্কিত ধারণা অনুসারে হয়।
উদাহরণ:
- t-test: দুই গোষ্ঠীর গড়ের মধ্যে পার্থক্য পরীক্ষা করা।
- ANOVA (Analysis of Variance): তিন বা তার বেশি গোষ্ঠীর মধ্যে গড়ের পার্থক্য পরীক্ষা করা।
- Pearson’s Correlation: দুটি চলক বা ভ্যারিয়েবলের মধ্যে সম্পর্ক পরিমাপ করা।
- Z-test: প্রাপ্ত স্যাম্পল গড়ের ভিত্তিতে জনসংখ্যার গড় অনুমান করা।
প্রয়োজনীয়তা:
- ডেটা সাধারণত Normal Distribution অনুযায়ী বিতরণ করা উচিত।
- গড় এবং ভিন্নতার মতো প্যারামিটার নির্ধারণ করা যায়।
২. Non-parametric Tests (নন-প্যারামেট্রিক টেস্ট)
Non-parametric Tests হল এমন পরিসংখ্যানিক পরীক্ষা যা ডেটার ডিস্ট্রিবিউশন বা প্যারামিটার সম্পর্কে কোনো পূর্বধারণা তৈরি না করে, এবং এটি এমন পরিস্থিতিতে ব্যবহৃত হয় যেখানে ডেটা স্বাভাবিকভাবে বিতরণ না হলেও কার্যকরী। Non-parametric টেস্ট ছোট স্যাম্পল সাইজ, অস্বাভাবিক ডেটা বিতরণ, অথবা ডেটার মধ্যে রৈখিক সম্পর্ক না থাকলে ব্যবহার করা হয়।
বিশেষত্ব:
- কোন নির্দিষ্ট ডিস্ট্রিবিউশন অনুমান করা হয় না।
- এটি ছোট স্যাম্পল সাইজের জন্য কার্যকর।
- Non-parametric tests সাধারণত rank বা ordinal ডেটা ব্যবহার করে এবং এটি আরও সাধারণ ও নমনীয়।
উদাহরণ:
- Mann-Whitney U Test: দুটি স্বাধীন গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা, যখন ডেটা স্বাভাবিকভাবে বিতরণ না হয়।
- Kruskal-Wallis Test: তিন বা তার বেশি গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা (এটি ANOVA এর নন-প্যারামেট্রিক সমকক্ষ)।
- Chi-square Test: ক্যাটেগোরিক্যাল ডেটার মধ্যে সম্পর্ক পরীক্ষা করা (যেমন, দুটি ভেরিয়েবলের মধ্যে সম্পর্ক যাচাই করা)।
- Wilcoxon Signed Rank Test: দুটি সম্পর্কিত গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা (যেমন, একাধিক পরিসংখ্যানের পূর্ববর্তী এবং পরবর্তী মানের তুলনা করা)।
প্রয়োজনীয়তা:
- ডেটার জন্য কোন নির্দিষ্ট ডিস্ট্রিবিউশন বা প্যারামিটার অনুমান করা হয় না।
- সাধারণত ordinal বা ranked ডেটা ব্যবহার করা হয়।
Parametric এবং Non-parametric Tests এর তুলনা
| বৈশিষ্ট্য | Parametric Tests | Non-parametric Tests |
|---|---|---|
| ডেটার ধরন | সাধারণত Normal Distribution তে বিশ্লেষণ | কোন নির্দিষ্ট ডিস্ট্রিবিউশন অনুমান করা হয় না |
| ডেটার পরিমাপ | গড়, ভিন্নতা এবং অন্যান্য প্যারামিটার ব্যবহৃত | র্যাঙ্ক বা অর্ডিনাল ডেটা ব্যবহৃত |
| স্যাম্পল সাইজ | বড় স্যাম্পল সাইজের জন্য কার্যকরী | ছোট স্যাম্পল সাইজের জন্য কার্যকরী |
| উদাহরণ | t-test, ANOVA, Z-test | Mann-Whitney U Test, Kruskal-Wallis Test, Chi-square Test |
| বিশ্লেষণ শক্তি | অধিক শক্তিশালী যদি ডেটা স্বাভাবিকভাবে বিতরণ হয় | সাধারণত কম শক্তিশালী, তবে বেশি নমনীয় |
| প্রয়োজনীয়তা | ডেটার জন্য প্যারামিটার নির্ধারণ করা যাবে | ডেটার জন্য কোনো পূর্বধারণা দরকার হয় না |
সারাংশ
Parametric Tests এবং Non-parametric Tests পরিসংখ্যানিক বিশ্লেষণের দুটি গুরুত্বপূর্ণ শাখা। Parametric Tests ডেটার ডিস্ট্রিবিউশন এবং প্যারামিটার সম্পর্কে নির্দিষ্ট ধারণা তৈরি করে এবং সাধারণত বড় স্যাম্পলের জন্য কার্যকরী। Non-parametric Tests ডেটার জন্য কোন নির্দিষ্ট ধারণা বা প্যারামিটার অনুমান না করেও ছোট স্যাম্পল এবং অস্বাভাবিক ডেটা বিশ্লেষণ করতে সাহায্য করে। সঠিক টেস্টের নির্বাচন ডেটার প্রকৃতি এবং গবেষণার উদ্দেশ্য অনুসারে করা উচিত।
Parametric Test পরিসংখ্যানের একটি গুরুত্বপূর্ণ শাখা যা ডেটার প্যারামিটার সম্পর্কিত অনুমান করে। এটি এমন একটি পরিসংখ্যানিক পরীক্ষা যা একটি নির্দিষ্ট ধরনের ডেটার জন্য ব্যবহৃত হয়, যেখানে ডেটার প্রকার এবং ডেটার গাণিতিক বৈশিষ্ট্যগুলি (যেমন গড়, ভ্যারিয়েন্স, এবং গঠন) পূর্বানুমান করা যায়। Parametric Test সাধারণত Normal Distribution বা অন্যান্য বিশেষ ডিস্ট্রিবিউশনের উপর ভিত্তি করে কাজ করে এবং এটি ডেটার বন্টন সম্পর্কিত কিছু নির্দিষ্ট অনুমান বা প্যারামিটার নিয়ে কাজ করে।
Parametric Test এর বৈশিষ্ট্য:
- ডেটার গঠন সম্পর্কে অনুমান:
- Parametric Test ব্যবহার করার আগে, ডেটার একটি নির্দিষ্ট গঠন বা বন্টন অনুমান করা হয় (যেমন Normal Distribution)।
- এটি অনুমান করে যে, ডেটা একটি নির্দিষ্ট প্যারামেট্রিক বন্টনে ফিট হবে, যেমন গড় এবং ভ্যারিয়েন্স জানালে ডেটা কীভাবে বিতরণ হতে পারে তা অনুমান করা যায়।
- প্যারামিটার সম্পর্কিত পরীক্ষণ:
- Parametric Test সাধারণত গড়, ভ্যারিয়েন্স, বা অন্যান্য প্যারামিটার সম্পর্কিত অনুমান বা পরীক্ষা চালায়।
- এটি অনুমান করে যে, ডেটা যে প্যারামিটার (যেমন গড় বা ভ্যারিয়েন্স) অনুসরণ করে, সেটির সাথে সম্পর্কিত প্রশ্নের উত্তর পাওয়া যাবে।
- বন্টনের ধরন:
- Parametric Test গুলি একটি নির্দিষ্ট প্যারামেট্রিক বন্টন (যেমন Normal Distribution) নির্ভরশীল হয়ে থাকে। এই বন্টন সাধারণত জানানো প্যারামিটারগুলি (গড়, স্ট্যান্ডার্ড ডেভিয়েশন) দ্বারা নির্ধারিত হয়।
Parametric Test এর প্রধান ধরন:
১. t-test (t-পরীক্ষা):
- t-test ব্যবহৃত হয় যখন আমরা দুটি গোষ্ঠীর গড় তুলনা করতে চাই এবং ডেটা ছোট নমুনা থেকে সংগৃহীত হয়।
- এটি সাধারণত Independent t-test (যখন দুটি পৃথক গোষ্ঠী থাকে) বা Paired t-test (যখন এক গোষ্ঠীর দুটি আলাদা ডেটা পয়েন্ট থাকে) হিসেবে ব্যবহৃত হয়।
২. ANOVA (Analysis of Variance):
- ANOVA ব্যবহার করা হয় যখন তিন বা তার বেশি গোষ্ঠীর গড় তুলনা করতে হয়। এটি ডেটার মধ্যে বিভিন্ন গোষ্ঠীর মধ্যে পার্থক্য নির্ধারণ করে।
- এটি One-way ANOVA (যখন একমাত্র ভেরিয়েবল থাকে) এবং Two-way ANOVA (যখন দুটি ভেরিয়েবল থাকে) হিসাবে বিভক্ত হতে পারে।
৩. Z-test:
- Z-test ব্যবহৃত হয় যখন ডেটার গড় এবং স্ট্যান্ডার্ড ডেভিয়েশন জানানো থাকে এবং নমুনার আকার বড় হয় (বিশেষ করে ৩০ বা তার বেশি)।
- এটি প্রধানত population mean এবং sample mean এর মধ্যে পার্থক্য পরীক্ষা করতে ব্যবহৃত হয়।
Parametric Test এর প্রয়োজনীয়তা:
১. ডেটার গড় এবং ভ্যারিয়েন্স জানানো:
- Parametric Test প্রাথমিকভাবে গড় এবং ভ্যারিয়েন্সের উপর ভিত্তি করে, তাই যখন ডেটার গড় বা ভ্যারিয়েন্স সম্পর্কে তথ্য জানা থাকে, তখন এটি খুব কার্যকরী হয়।
২. শক্তিশালী ফলাফল:
- Parametric Test এর ফলাফল সাধারণত অত্যন্ত শক্তিশালী এবং নির্ভরযোগ্য। কারণ এটি একটি নির্দিষ্ট প্যারামেট্রিক বন্টন এবং প্যারামিটার ব্যবহার করে পরীক্ষা চালায়।
৩. ডেটার প্যারামেট্রিক বৈশিষ্ট্য বোঝা:
- এই পরীক্ষাগুলি সাধারণত ডেটার অস্থিরতা বা বৈচিত্র্য (variation) এবং গড়ের মধ্যে সম্পর্ক বোঝাতে সহায়ক হয়। ফলে, এটি গুণগত বিশ্লেষণ করতে উপকারী।
Parametric Test এর সুবিধা:
১. নির্ভুলতা এবং বিশ্বস্ততা:
- Parametric Test গুলি অনেক ক্ষেত্রেই অধিক নির্ভুল ফলাফল দেয় কারণ তারা কিছু নির্দিষ্ট প্যারামিটার (যেমন গড় এবং ভ্যারিয়েন্স) জানায় এবং এই প্যারামিটারগুলির উপর ভিত্তি করে হিসাব করা হয়।
২. বড় নমুনা এবং প্রযোজ্যতা:
- এই পরীক্ষাগুলি বিশেষ করে বড় নমুনার জন্য উপযোগী এবং সাধারণত বড় ডেটা সেটে কার্যকর।
৩. শক্তিশালী পরীক্ষণ ক্ষমতা:
- Parametric Test গুলির পরীক্ষণ ক্ষমতা বেশি, কারণ তারা কিছু নির্দিষ্ট প্যারামেট্রিক ফর্মে কাজ করে, ফলে ফলাফল বেশি নির্ভরযোগ্য হয়।
Parametric Test এর সীমাবদ্ধতা:
১. বন্টনের ধরন নির্ভরশীলতা:
- Parametric Test এর জন্য একটি নির্দিষ্ট বন্টন বা প্যারামেট্রিক গঠন থাকতে হবে। যদি ডেটা একটি নির্দিষ্ট প্যারামেট্রিক বন্টনে না থাকে, তবে এই পরীক্ষা সঠিক ফলাফল দিতে সক্ষম হবে না।
২. নমুনার আকারের প্রয়োজনীয়তা:
- অনেক parametric tests বড় নমুনার উপর নির্ভর করে কাজ করে এবং ছোট নমুনা নিয়ে সঠিক ফলাফল দেওয়া কঠিন হতে পারে।
সারাংশ
Parametric Test পরিসংখ্যানের একটি শক্তিশালী পদ্ধতি যা গড়, ভ্যারিয়েন্স এবং অন্যান্য প্যারামেট্রিক প্যারামিটারগুলির ভিত্তিতে সম্ভাবনা এবং ফলাফল বিশ্লেষণ করে। এই পরীক্ষাগুলি বিশেষত শক্তিশালী ফলাফল প্রদান করে যখন ডেটা একটি নির্দিষ্ট বন্টনের অধীনে থাকে এবং যথেষ্ট নমুনা তথ্য থাকে। তবে, এটি কিছু নির্দিষ্ট শর্তাবলীর উপর নির্ভরশীল এবং যখন ডেটা সেই শর্তগুলো পূর্ণ করে না, তখন Non-Parametric Tests ব্যবহার করা হয়।
Z-test এবং T-test হল পরিসংখ্যানের দুইটি গুরুত্বপূর্ণ টেস্ট, যা সাধারণত শর্তাধীন অনুমান পরীক্ষা (hypothesis testing) এর জন্য ব্যবহৃত হয়। এই দুটি টেস্টের মাধ্যমে আমরা কোন নির্দিষ্ট প্যারামিটার সম্পর্কে অনুমান করি এবং সেটি পরীক্ষা করি যে, তা জনসংখ্যার প্যারামিটারের সাথে মানানসই কিনা। এই দুটি টেস্টে মূল পার্থক্য হলো জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন এর সাথে সম্পর্ক এবং নমুনার আকার।
১. Z-test (Z-টেস্ট)
Z-test একটি পরিসংখ্যানিক পরীক্ষা যা নমুনার গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়, যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে এবং নমুনা আকার যথেষ্ট বড় (স্বাভাবিকভাবে )।
ব্যবহার:
Z-test সাধারণত নিম্নলিখিত ক্ষেত্রে ব্যবহৃত হয়:
- জনসংখ্যার গড় সম্পর্কে অনুমান করা, যেখানে জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে।
- নমুনা গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করা।
- প্রত্যাশিত গড় এবং নমুনার গড় এর মধ্যে তুলনা করা।
গণনা:
Z-test এর জন্য ব্যবহৃত ফর্মুলা হল:
এখানে:
- = নমুনার গড়
- = জনসংখ্যার গড়
- = জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন
- = নমুনা আকার
উদাহরণ:
ধরা যাক, একটি বিদ্যালয়ের গড় পরীক্ষার স্কোর ৭০। একজন শিক্ষক পরীক্ষার ফলাফল পর্যালোচনা করছেন এবং জানতে চান, একটি নতুন ক্লাসের গড় স্কোর কি ৭০ এর সমান? যদি জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন ১০ হয় এবং নমুনার আকার ৫০ হয়, তবে আমরা Z-test ব্যবহার করতে পারি।
২. T-test (T-টেস্ট)
T-test একটি পরিসংখ্যানিক পরীক্ষা যা নমুনার গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়, তবে এর মধ্যে মূল পার্থক্য হল, T-test ব্যবহার করা হয় যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে না এবং নমুনার আকার ছোট (স্বাভাবিকভাবে )।
ব্যবহার:
T-test সাধারণত নিম্নলিখিত ক্ষেত্রে ব্যবহৃত হয়:
- জনসংখ্যার গড় সম্পর্কে অনুমান করা, যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা নেই।
- নমুনা গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করা যখন নমুনার আকার ছোট হয়।
- দুটি আলাদা গোষ্ঠীর মধ্যে গড় পার্থক্য পরীক্ষা করা (independent T-test)।
গণনা:
T-test এর জন্য ব্যবহৃত ফর্মুলা হল:
এখানে:
- = নমুনার গড়
- = জনসংখ্যার গড়
- = নমুনার স্ট্যান্ডার্ড ডেভিয়েশন
- = নমুনা আকার
উদাহরণ:
ধরা যাক, একটি শহরের গড় বেকারি বিক্রির পরিমাণ ১০০ পিস। কিন্তু, একটি নতুন বেকারির বিক্রির গড় কত তা পরীক্ষা করতে চান, যেখানে সারা শহরের বেকারির গড় বিক্রি পিস, কিন্তু নতুন বেকারির স্ট্যান্ডার্ড ডেভিয়েশন জানা নেই এবং নমুনার আকার ২৫। এই পরিস্থিতিতে, T-test ব্যবহার করা হবে।
Z-test এবং T-test এর মধ্যে পার্থক্য:
| বৈশিষ্ট্য | Z-test | T-test |
|---|---|---|
| জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন | জানানো থাকে | জানা থাকে না |
| নমুনার আকার | বড় নমুনা (সাধারণত ) | ছোট নমুনা (সাধারণত ) |
| বণ্টন | সাধারণত নরমাল বণ্টন ব্যবহৃত হয় | t-বণ্টন ব্যবহৃত হয়, বিশেষ করে ছোট নমুনার জন্য |
| ফর্মুলা |
কখন Z-test এবং T-test ব্যবহার করবেন:
- Z-test ব্যবহার করা উচিত যদি:
- জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে।
- নমুনার আকার বড় হয় (যেমন )।
- T-test ব্যবহার করা উচিত যদি:
- জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা না থাকে।
- নমুনার আকার ছোট হয় (যেমন )।
সারাংশ
Z-test এবং T-test উভয়ই গড়ের তুলনা করতে ব্যবহৃত হয়, তবে তাদের মধ্যে মূল পার্থক্য হলো জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা এবং নমুনার আকার। Z-test বড় নমুনা এবং স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকলে ব্যবহৃত হয়, যেখানে T-test ছোট নমুনা এবং স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকলে ব্যবহৃত হয়।
Non-parametric tests হল পরিসংখ্যানিক পরীক্ষা যা ডেটার জন্য কোনো নির্দিষ্ট ডিস্ট্রিবিউশন (যেমন, নরমাল ডিস্ট্রিবিউশন) এর উপর নির্ভর করে না। এই পরীক্ষা গুলি প্রধানত তখন ব্যবহৃত হয় যখন ডেটার সাধারণ বণ্টন সম্পর্কে কোনো তথ্য নেই বা ডেটা নরমাল বণ্টনের অনুসরণ করে না। নন-প্যারামেট্রিক টেস্টগুলো সাধারণত ছোট নমুনা বা অসম্পূর্ণ বা র্যাঙ্ক ডেটার জন্য ব্যবহৃত হয়।
এখানে তিনটি সাধারণ non-parametric test এর বিস্তারিত আলোচনা করা হলো: Mann-Whitney U Test, Wilcoxon Signed-Rank Test, এবং Kruskal-Wallis Test।
১. Mann-Whitney U Test
Mann-Whitney U Test (যে একে Mann-Whitney-Wilcoxon Test বা Wilcoxon rank-sum test বলেও পরিচিত) একটি পরিসংখ্যানিক পরীক্ষা যা দুইটি স্বাধীন গ্রুপের মধ্যে পার্থক্য নির্ধারণ করে। এটি সাধারণত ব্যবহৃত হয় যখন ডেটা দুটি গ্রুপের মধ্যে তুলনা করতে হয়, এবং ডেটা নরমাল ডিস্ট্রিবিউশনের অনুসরণ না করে।
ব্যবহার:
- দুইটি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য, যেখানে গ্রুপগুলির মধ্যে ডেটার পারস্পরিক সম্পর্ক পরীক্ষা করা হয়।
- Mann-Whitney গ্রুপগুলির মধ্যে ভিন্নতার পরিমাপ করতে ব্যবহৃত হয় যখন ডেটা সাপেক্ষভাবে নরমাল বণ্টন নয়।
ফর্মুলা:
Mann-Whitney U এর জন্য পরীক্ষা করতে হলে, দুইটি গ্রুপের ডেটার র্যাঙ্ক তৈরি করে তারপরে তার উপর ভিত্তি করে U-স্ট্যাটিস্টিক্স হিসাব করা হয়।
উদাহরণ:
যদি দুটি স্কুলের ছাত্রদের পরীক্ষার ফলাফল তুলনা করতে হয় এবং আমরা জানি যে, পরীক্ষার ফলাফল নরমাল ডিস্ট্রিবিউশনের অনুসরণ করছে না, তবে Mann-Whitney U Test ব্যবহার করা হবে।
২. Wilcoxon Signed-Rank Test
Wilcoxon Signed-Rank Test একটি paired sample বা dependent sample এর মধ্যে ডেটার পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত একটি নন-প্যারামেট্রিক পরীক্ষা। এটি সাধারণত তখন ব্যবহৃত হয় যখন দুটি সম্পর্কিত বা যুক্ত গ্রুপের মধ্যে পার্থক্য পরীক্ষা করতে হয়, যেমন একগুচ্ছ সদস্যের পরীক্ষার আগে এবং পরে ফলাফল।
ব্যবহার:
- এক বা দুই গ্রুপের জন্য পরীক্ষা, যেখানে একে অপরের উপর নির্ভরশীল দুটি পর্যবেক্ষণ আছে।
- উদাহরণস্বরূপ, একই ব্যক্তির আগে এবং পরে কিছু মাপকাঠি (যেমন, ট্রিটমেন্ট আগে এবং পরে) তুলনা করার জন্য।
ফর্মুলা:
Wilcoxon Signed-Rank Test তে, ডেটার র্যাঙ্ক করা হয় এবং তারপর তার র্যাঙ্কগুলির মধ্যে পার্থক্য হিসাব করা হয়। এই পরীক্ষাটি দুটি সম্পর্কিত গ্রুপের মধ্যে গড় পার্থক্য পরীক্ষা করে।
উদাহরণ:
ধরা যাক, একটি স্বাস্থ্য পরীক্ষা পর, আপনি একটি নির্দিষ্ট চিকিৎসার পরে রোগীর উচ্চতা পরিবর্তন পরিমাপ করতে চান। Wilcoxon Signed-Rank Test ব্যবহার করা যেতে পারে।
৩. Kruskal-Wallis Test
Kruskal-Wallis Test একটি non-parametric পরীক্ষা যা তিনটি বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়। এটি ANOVA এর নন-প্যারামেট্রিক বিকল্প, যা তিনটি বা তার বেশি গ্রুপের মধ্যে গড়ের পার্থক্য পরীক্ষা করে।
ব্যবহার:
- তিনটি বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য, যখন ডেটা নরমাল ডিস্ট্রিবিউশনের অনুসরণ করে না।
- Kruskal-Wallis সাধারণত একাধিক গ্রুপের মধ্যে র্যাঙ্কের পার্থক্য চিহ্নিত করতে ব্যবহৃত হয়।
ফর্মুলা:
Kruskal-Wallis Test এর জন্য, প্রথমে প্রত্যেক গ্রুপের ডেটার র্যাঙ্ক তৈরি করা হয় এবং তারপর তার পরিসংখ্যানিক মান হিসাব করা হয়। H-স্ট্যাটিস্টিক্স হিসাব করে তার মাধ্যমে পরীক্ষার সিদ্ধান্ত নেওয়া হয়।
উদাহরণ:
ধরা যাক, তিনটি আলাদা ডিপার্টমেন্টের কর্মীদের সেলফ রিপোর্টেড স্ট্রেস লেভেল তুলনা করতে হয়। Kruskal-Wallis Test ব্যবহার করা হবে যদি আমরা জানি যে ডেটা নরমাল ডিস্ট্রিবিউশন অনুসরণ করছে না।
Mann-Whitney U, Wilcoxon, এবং Kruskal-Wallis এর মধ্যে পার্থক্য:
| বৈশিষ্ট্য | Mann-Whitney U Test | Wilcoxon Signed-Rank Test | Kruskal-Wallis Test |
|---|---|---|---|
| গ্রুপের সংখ্যা | দুটি স্বাধীন গ্রুপ | দুটি সম্পর্কিত বা জোড়া গ্রুপ | তিন বা তার বেশি স্বাধীন গ্রুপ |
| ডেটার ধরন | নন-প্যারামেট্রিক, স্বাধীন গ্রুপ | নন-প্যারামেট্রিক, সম্পর্কিত গ্রুপ | নন-প্যারামেট্রিক, স্বাধীন গ্রুপ |
| ব্যবহার | দুটি গ্রুপের মধ্যে পার্থক্য পরীক্ষা | সম্পর্কিত ডেটার মধ্যে পার্থক্য পরীক্ষা | তিন বা তার বেশি গ্রুপের মধ্যে পার্থক্য |
| বিশ্লেষণ | র্যাঙ্কের তুলনা | র্যাঙ্কের তুলনা এবং পার্থক্য | গ্রুপের মধ্যে র্যাঙ্কের তুলনা |
সারাংশ
Mann-Whitney U Test, Wilcoxon Signed-Rank Test, এবং Kruskal-Wallis Test হল নন-প্যারামেট্রিক টেস্ট যা ডেটার জন্য কোনো নির্দিষ্ট বণ্টন সম্পর্কিত প্রয়োজনীয়তা ছাড়া ব্যবহৃত হয়।
- Mann-Whitney U Test দুটি স্বাধীন গ্রুপের তুলনা করতে ব্যবহৃত হয়।
- Wilcoxon Signed-Rank Test দুটি সম্পর্কিত বা জোড়া গ্রুপের মধ্যে পার্থক্য পরীক্ষার জন্য ব্যবহৃত হয়।
- Kruskal-Wallis Test তিন বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য চিহ্নিত করতে ব্যবহৃত হয়। এই পরীক্ষাগুলি সাধারণত যখন ডেটা নরমাল বণ্টন অনুসরণ করে না বা ডেটা র্যাঙ্ক করা থাকে তখন ব্যবহৃত হয়।
Chi-square Test হল একটি পরিসংখ্যানিক পদ্ধতি যা ব্যবহৃত হয় দুটি বা ততোধিক ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করতে, অথবা জনসংখ্যার প্রকৃত বণ্টন এবং একটি অনুমানকৃত বা প্রত্যাশিত বণ্টনের মধ্যে পার্থক্য নির্ধারণ করতে। এটি সাধারণত Nominal বা Ordinal ডেটার জন্য ব্যবহৃত হয় এবং এটি Categorical Data এর উপর ভিত্তি করে কাজ করে।
Hypothesis Testing এর অংশ হিসেবে, Chi-square Test ব্যবহৃত হয় যখন আমাদের একটি হাইপোথিসিস তৈরি করতে হয় এবং সেটি প্রমাণ বা অস্বীকার করতে হয়। এই পরীক্ষাটি মূলত দুটি ধরনের হাইপোথিসিস পরীক্ষা করতে ব্যবহৃত হয়:
- Goodness of Fit Test (ফিটনেস পরীক্ষা)
- Test of Independence (স্বাধীনতার পরীক্ষা)
১. Chi-square Goodness of Fit Test (ফিটনেস পরীক্ষা)
এই পরীক্ষাটি ব্যবহৃত হয় একটি ক্যাটেগোরির observed (প্রাপ্ত) ফ্রিকোয়েন্সি এবং expected (অনুমানকৃত) ফ্রিকোয়েন্সির মধ্যে পার্থক্য পরীক্ষা করতে। এটি নির্ধারণ করে যে, প্রাপ্ত ডেটা একটি নির্দিষ্ট তত্ত্ব বা পূর্বাভাসের সাথে সামঞ্জস্যপূর্ণ কিনা।
ফর্মুলা:
এখানে:
- = প্রত্যাশিত ফ্রিকোয়েন্সি
- = পর্যবেক্ষিত (Observed) ফ্রিকোয়েন্সি
- = Chi-square মান
ধাপসমূহ:
- Null Hypothesis (H₀): "ডেটার মধ্যে কোন পার্থক্য নেই, প্রত্যাশিত বণ্টন সঠিক।"
- Alternative Hypothesis (H₁): "ডেটার মধ্যে পার্থক্য রয়েছে, প্রত্যাশিত বণ্টন সঠিক নয়।"
- Chi-square Statistic গণনা করুন: উপরের ফর্মুলা অনুসারে χ² হিসাব করুন।
- Degree of Freedom (df): , যেখানে হল শ্রেণীর সংখ্যা।
- Critical Value নির্বাচন করুন: নির্ধারিত সিগনিফিকেন্স লেভেল () এবং এর উপর ভিত্তি করে Chi-square টেবিল থেকে critical value বের করুন।
- χ² এর মান তুলনা করুন: যদি গণনা করা χ² টেবিল থেকে পাওয়া critical value-এর চেয়ে বেশি হয়, তবে null hypothesis অস্বীকার করুন।
উদাহরণ:
একটি পণ্যকে তিনটি ভিন্ন রঙে বাজারজাত করা হয়েছে: লাল, নীল, এবং সবুজ। আপনি 100টি পণ্য বিক্রি করেছেন এবং জানতে চান যে, রঙের বণ্টন সমানভাবে হয়েছে কিনা (যেমন প্রত্যাশিত 33.33% রঙের প্রতি)। এখন আপনি রঙগুলির প্রাপ্ত ফ্রিকোয়েন্সি ব্যবহার করে Chi-square Goodness of Fit Test ব্যবহার করবেন।
২. Chi-square Test of Independence (স্বাধীনতার পরীক্ষা)
Chi-square Test of Independence ব্যবহৃত হয় দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বা নির্ভরতা পরীক্ষা করতে। এটি পরীক্ষা করে যে, দুটি ক্যাটেগোরিকাল ভেরিয়েবল একে অপরের উপর নির্ভরশীল কিনা।
ফর্মুলা:
এখানে:
- = পর্যবেক্ষিত ফ্রিকোয়েন্সি
- = প্রত্যাশিত ফ্রিকোয়েন্সি
- = Chi-square মান
ধাপসমূহ:
- Null Hypothesis (H₀): "দুটি ভেরিয়েবল একে অপরের উপর নির্ভরশীল নয় (স্বাধীন)।"
- Alternative Hypothesis (H₁): "দুটি ভেরিয়েবল একে অপরের উপর নির্ভরশীল।"
- Chi-square Statistic গণনা করুন: উপরের ফর্মুলা অনুসারে χ² হিসাব করুন।
- Degree of Freedom (df): , যেখানে হল সারির সংখ্যা এবং হল কলামের সংখ্যা।
- Critical Value নির্বাচন করুন: নির্ধারিত সিগনিফিকেন্স লেভেল () এবং এর উপর ভিত্তি করে critical value বের করুন।
- χ² এর মান তুলনা করুন: যদি গণনা করা χ² critical value এর চেয়ে বেশি হয়, তবে null hypothesis অস্বীকার করুন।
উদাহরণ:
একটি দোকানে দুটি ভিন্ন ধরনের পণ্য বিক্রি হচ্ছে: পণ্য A এবং পণ্য B। আপনি জানতে চান যে, পণ্য কেনার জন্য পুরুষ এবং মহিলাদের মধ্যে কোনো পার্থক্য রয়েছে কিনা। এখানে, পুরুষ এবং মহিলার মধ্যে পণ্য নির্বাচন স্বাধীন কিনা তা যাচাই করতে Chi-square Test of Independence ব্যবহার করবেন।
Chi-square Test এর মাধ্যমে Hypothesis Testing এর উদাহরণ
ধরুন, আপনি একটি পরীক্ষায় তিনটি শ্রেণী: A, B, এবং C এর মধ্যে ছাত্রদের শ্রেণি ভাগের উপর একটি পরিসংখ্যান পরিচালনা করছেন।
- Null Hypothesis (H₀): শ্রেণীভাগ সমানভাবে বিতরণ হয়েছে (অর্থাৎ, ছাত্রদের মধ্যে শ্রেণী A, B, এবং C এর মধ্যে সমানভাবে ভাগ হয়েছে)।
- Alternative Hypothesis (H₁): শ্রেণীভাগ সমানভাবে বিতরণ হয়নি (অর্থাৎ, ছাত্রদের মধ্যে শ্রেণী A, B, এবং C এর মধ্যে সমানভাবে ভাগ হয়নি)।
আপনি পর্যবেক্ষিত ডেটা অনুযায়ী Chi-square Test প্রয়োগ করবেন। এখানে:
- Expected Frequency (প্রত্যাশিত ফ্রিকোয়েন্সি) এর জন্য, আপনি Total Students / Number of Categories ব্যবহার করবেন।
- তারপর Chi-square statistic ব্যবহার করে পরীক্ষা করবেন যে, পর্যবেক্ষিত ফ্রিকোয়েন্সি এবং প্রত্যাশিত ফ্রিকোয়েন্সির মধ্যে পার্থক্য উল্লেখযোগ্য কিনা।
সারাংশ
Chi-square Test একটি শক্তিশালী পরিসংখ্যানিক পদ্ধতি যা বিভিন্ন ধরনের হাইপোথিসিস পরীক্ষা করার জন্য ব্যবহৃত হয়, বিশেষ করে ক্যাটেগোরিকাল ডেটার ক্ষেত্রে। এটি Goodness of Fit Test (ফিটনেস পরীক্ষা) এবং Test of Independence (স্বাধীনতার পরীক্ষা) হিসেবে দুটি প্রধানভাবে ব্যবহৃত হয়। Chi-square Test এর মাধ্যমে আমরা দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বা একটি বণ্টনের সঠিকতা পরীক্ষা করতে পারি। Chi-square statistic নির্ধারণ করে, আমরা একটি নির্দিষ্ট critical value এর সাথে তুলনা করে হাইপোথিসিস গ্রহণ বা অস্বীকার করতে পারি।
Read more