Parametric এবং Non-parametric Tests

পরিসংখ্যান (Statistics) - Big Data and Analytics

1.5k

Parametric এবং Non-parametric টেস্টগুলি পরিসংখ্যানের গুরুত্বপূর্ণ পদ্ধতি যা ডেটার বিভিন্ন বৈশিষ্ট্য এবং গুণগত বিশ্লেষণ করতে ব্যবহৃত হয়। এই দুই ধরনের টেস্টের মধ্যে মৌলিক পার্থক্য হল যে Parametric Tests নির্দিষ্ট ডিস্ট্রিবিউশন (যেমন, Normal distribution) এবং প্যারামিটার অনুমান ব্যবহার করে, যেখানে Non-parametric Tests কোন নির্দিষ্ট ডিস্ট্রিবিউশন বা প্যারামিটার সম্পর্কে কোনো ধারণা তৈরি করে না এবং এটি সাধারণত ছোট স্যাম্পল বা ডেটার মধ্যে অস্বাভাবিক পরিস্থিতিতে ব্যবহৃত হয়।

১. Parametric Tests (প্যারামেট্রিক টেস্ট)

Parametric Tests হল এমন পরিসংখ্যানিক পরীক্ষা যা ডেটার প্যারামিটার (যেমন, গড়, ভিন্নতা) এবং নির্দিষ্ট ডিস্ট্রিবিউশন (সাধারণত Normal distribution) সম্পর্কে ধারণা ব্যবহার করে। এগুলি শুধুমাত্র তখনই কার্যকরী হয় যখন ডেটা স্বাভাবিকভাবে বিতরণ করা থাকে এবং ডেটা সম্পর্কে কিছু পূর্বধারণা বা প্যারামিটার নির্ধারণ করা যায়।

বিশেষত্ব:

Normal Distribution অনুমান করা হয়।
ডেটার জন্য কিছু প্যারামিটার (যেমন, গড় এবং ভিন্নতা) জানা থাকে।
এটি বড় স্যাম্পল সাইজের জন্য কার্যকরী।
Parametric Tests সাধারণত অধিক শক্তিশালী এবং নিখুঁত ফলাফল দেয় যদি ডেটা প্যারামিটার সম্পর্কিত ধারণা অনুসারে হয়।

উদাহরণ:

t-test: দুই গোষ্ঠীর গড়ের মধ্যে পার্থক্য পরীক্ষা করা।
ANOVA (Analysis of Variance): তিন বা তার বেশি গোষ্ঠীর মধ্যে গড়ের পার্থক্য পরীক্ষা করা।
Pearson’s Correlation: দুটি চলক বা ভ্যারিয়েবলের মধ্যে সম্পর্ক পরিমাপ করা।
Z-test: প্রাপ্ত স্যাম্পল গড়ের ভিত্তিতে জনসংখ্যার গড় অনুমান করা।

প্রয়োজনীয়তা:

ডেটা সাধারণত Normal Distribution অনুযায়ী বিতরণ করা উচিত।
গড় এবং ভিন্নতার মতো প্যারামিটার নির্ধারণ করা যায়।

২. Non-parametric Tests (নন-প্যারামেট্রিক টেস্ট)

Non-parametric Tests হল এমন পরিসংখ্যানিক পরীক্ষা যা ডেটার ডিস্ট্রিবিউশন বা প্যারামিটার সম্পর্কে কোনো পূর্বধারণা তৈরি না করে, এবং এটি এমন পরিস্থিতিতে ব্যবহৃত হয় যেখানে ডেটা স্বাভাবিকভাবে বিতরণ না হলেও কার্যকরী। Non-parametric টেস্ট ছোট স্যাম্পল সাইজ, অস্বাভাবিক ডেটা বিতরণ, অথবা ডেটার মধ্যে রৈখিক সম্পর্ক না থাকলে ব্যবহার করা হয়।

বিশেষত্ব:

কোন নির্দিষ্ট ডিস্ট্রিবিউশন অনুমান করা হয় না।
এটি ছোট স্যাম্পল সাইজের জন্য কার্যকর।
Non-parametric tests সাধারণত rank বা ordinal ডেটা ব্যবহার করে এবং এটি আরও সাধারণ ও নমনীয়।

উদাহরণ:

Mann-Whitney U Test: দুটি স্বাধীন গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা, যখন ডেটা স্বাভাবিকভাবে বিতরণ না হয়।
Kruskal-Wallis Test: তিন বা তার বেশি গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা (এটি ANOVA এর নন-প্যারামেট্রিক সমকক্ষ)।
Chi-square Test: ক্যাটেগোরিক্যাল ডেটার মধ্যে সম্পর্ক পরীক্ষা করা (যেমন, দুটি ভেরিয়েবলের মধ্যে সম্পর্ক যাচাই করা)।
Wilcoxon Signed Rank Test: দুটি সম্পর্কিত গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা (যেমন, একাধিক পরিসংখ্যানের পূর্ববর্তী এবং পরবর্তী মানের তুলনা করা)।

প্রয়োজনীয়তা:

ডেটার জন্য কোন নির্দিষ্ট ডিস্ট্রিবিউশন বা প্যারামিটার অনুমান করা হয় না।
সাধারণত ordinal বা ranked ডেটা ব্যবহার করা হয়।

Parametric এবং Non-parametric Tests এর তুলনা

বৈশিষ্ট্য	Parametric Tests	Non-parametric Tests
ডেটার ধরন	সাধারণত Normal Distribution তে বিশ্লেষণ	কোন নির্দিষ্ট ডিস্ট্রিবিউশন অনুমান করা হয় না
ডেটার পরিমাপ	গড়, ভিন্নতা এবং অন্যান্য প্যারামিটার ব্যবহৃত	র‌্যাঙ্ক বা অর্ডিনাল ডেটা ব্যবহৃত
স্যাম্পল সাইজ	বড় স্যাম্পল সাইজের জন্য কার্যকরী	ছোট স্যাম্পল সাইজের জন্য কার্যকরী
উদাহরণ	t-test, ANOVA, Z-test	Mann-Whitney U Test, Kruskal-Wallis Test, Chi-square Test
বিশ্লেষণ শক্তি	অধিক শক্তিশালী যদি ডেটা স্বাভাবিকভাবে বিতরণ হয়	সাধারণত কম শক্তিশালী, তবে বেশি নমনীয়
প্রয়োজনীয়তা	ডেটার জন্য প্যারামিটার নির্ধারণ করা যাবে	ডেটার জন্য কোনো পূর্বধারণা দরকার হয় না

সারাংশ

Parametric Tests এবং Non-parametric Tests পরিসংখ্যানিক বিশ্লেষণের দুটি গুরুত্বপূর্ণ শাখা। Parametric Tests ডেটার ডিস্ট্রিবিউশন এবং প্যারামিটার সম্পর্কে নির্দিষ্ট ধারণা তৈরি করে এবং সাধারণত বড় স্যাম্পলের জন্য কার্যকরী। Non-parametric Tests ডেটার জন্য কোন নির্দিষ্ট ধারণা বা প্যারামিটার অনুমান না করেও ছোট স্যাম্পল এবং অস্বাভাবিক ডেটা বিশ্লেষণ করতে সাহায্য করে। সঠিক টেস্টের নির্বাচন ডেটার প্রকৃতি এবং গবেষণার উদ্দেশ্য অনুসারে করা উচিত।

Content added By

Azizar Rahman Aziz

Parametric Test এর মৌলিক ধারণা

613

Parametric Test পরিসংখ্যানের একটি গুরুত্বপূর্ণ শাখা যা ডেটার প্যারামিটার সম্পর্কিত অনুমান করে। এটি এমন একটি পরিসংখ্যানিক পরীক্ষা যা একটি নির্দিষ্ট ধরনের ডেটার জন্য ব্যবহৃত হয়, যেখানে ডেটার প্রকার এবং ডেটার গাণিতিক বৈশিষ্ট্যগুলি (যেমন গড়, ভ্যারিয়েন্স, এবং গঠন) পূর্বানুমান করা যায়। Parametric Test সাধারণত Normal Distribution বা অন্যান্য বিশেষ ডিস্ট্রিবিউশনের উপর ভিত্তি করে কাজ করে এবং এটি ডেটার বন্টন সম্পর্কিত কিছু নির্দিষ্ট অনুমান বা প্যারামিটার নিয়ে কাজ করে।

Parametric Test এর বৈশিষ্ট্য:

ডেটার গঠন সম্পর্কে অনুমান:
- Parametric Test ব্যবহার করার আগে, ডেটার একটি নির্দিষ্ট গঠন বা বন্টন অনুমান করা হয় (যেমন Normal Distribution)।
- এটি অনুমান করে যে, ডেটা একটি নির্দিষ্ট প্যারামেট্রিক বন্টনে ফিট হবে, যেমন গড় এবং ভ্যারিয়েন্স জানালে ডেটা কীভাবে বিতরণ হতে পারে তা অনুমান করা যায়।
প্যারামিটার সম্পর্কিত পরীক্ষণ:
- Parametric Test সাধারণত গড়, ভ্যারিয়েন্স, বা অন্যান্য প্যারামিটার সম্পর্কিত অনুমান বা পরীক্ষা চালায়।
- এটি অনুমান করে যে, ডেটা যে প্যারামিটার (যেমন গড় বা ভ্যারিয়েন্স) অনুসরণ করে, সেটির সাথে সম্পর্কিত প্রশ্নের উত্তর পাওয়া যাবে।
বন্টনের ধরন:
- Parametric Test গুলি একটি নির্দিষ্ট প্যারামেট্রিক বন্টন (যেমন Normal Distribution) নির্ভরশীল হয়ে থাকে। এই বন্টন সাধারণত জানানো প্যারামিটারগুলি (গড়, স্ট্যান্ডার্ড ডেভিয়েশন) দ্বারা নির্ধারিত হয়।

Parametric Test এর প্রধান ধরন:

১. t-test (t-পরীক্ষা):

t-test ব্যবহৃত হয় যখন আমরা দুটি গোষ্ঠীর গড় তুলনা করতে চাই এবং ডেটা ছোট নমুনা থেকে সংগৃহীত হয়।
এটি সাধারণত Independent t-test (যখন দুটি পৃথক গোষ্ঠী থাকে) বা Paired t-test (যখন এক গোষ্ঠীর দুটি আলাদা ডেটা পয়েন্ট থাকে) হিসেবে ব্যবহৃত হয়।

২. ANOVA (Analysis of Variance):

ANOVA ব্যবহার করা হয় যখন তিন বা তার বেশি গোষ্ঠীর গড় তুলনা করতে হয়। এটি ডেটার মধ্যে বিভিন্ন গোষ্ঠীর মধ্যে পার্থক্য নির্ধারণ করে।
এটি One-way ANOVA (যখন একমাত্র ভেরিয়েবল থাকে) এবং Two-way ANOVA (যখন দুটি ভেরিয়েবল থাকে) হিসাবে বিভক্ত হতে পারে।

৩. Z-test:

Z-test ব্যবহৃত হয় যখন ডেটার গড় এবং স্ট্যান্ডার্ড ডেভিয়েশন জানানো থাকে এবং নমুনার আকার বড় হয় (বিশেষ করে ৩০ বা তার বেশি)।
এটি প্রধানত population mean এবং sample mean এর মধ্যে পার্থক্য পরীক্ষা করতে ব্যবহৃত হয়।

Parametric Test এর প্রয়োজনীয়তা:

১. ডেটার গড় এবং ভ্যারিয়েন্স জানানো:

Parametric Test প্রাথমিকভাবে গড় এবং ভ্যারিয়েন্সের উপর ভিত্তি করে, তাই যখন ডেটার গড় বা ভ্যারিয়েন্স সম্পর্কে তথ্য জানা থাকে, তখন এটি খুব কার্যকরী হয়।

২. শক্তিশালী ফলাফল:

Parametric Test এর ফলাফল সাধারণত অত্যন্ত শক্তিশালী এবং নির্ভরযোগ্য। কারণ এটি একটি নির্দিষ্ট প্যারামেট্রিক বন্টন এবং প্যারামিটার ব্যবহার করে পরীক্ষা চালায়।

৩. ডেটার প্যারামেট্রিক বৈশিষ্ট্য বোঝা:

এই পরীক্ষাগুলি সাধারণত ডেটার অস্থিরতা বা বৈচিত্র্য (variation) এবং গড়ের মধ্যে সম্পর্ক বোঝাতে সহায়ক হয়। ফলে, এটি গুণগত বিশ্লেষণ করতে উপকারী।

Parametric Test এর সুবিধা:

১. নির্ভুলতা এবং বিশ্বস্ততা:

Parametric Test গুলি অনেক ক্ষেত্রেই অধিক নির্ভুল ফলাফল দেয় কারণ তারা কিছু নির্দিষ্ট প্যারামিটার (যেমন গড় এবং ভ্যারিয়েন্স) জানায় এবং এই প্যারামিটারগুলির উপর ভিত্তি করে হিসাব করা হয়।

২. বড় নমুনা এবং প্রযোজ্যতা:

এই পরীক্ষাগুলি বিশেষ করে বড় নমুনার জন্য উপযোগী এবং সাধারণত বড় ডেটা সেটে কার্যকর।

৩. শক্তিশালী পরীক্ষণ ক্ষমতা:

Parametric Test গুলির পরীক্ষণ ক্ষমতা বেশি, কারণ তারা কিছু নির্দিষ্ট প্যারামেট্রিক ফর্মে কাজ করে, ফলে ফলাফল বেশি নির্ভরযোগ্য হয়।

Parametric Test এর সীমাবদ্ধতা:

১. বন্টনের ধরন নির্ভরশীলতা:

Parametric Test এর জন্য একটি নির্দিষ্ট বন্টন বা প্যারামেট্রিক গঠন থাকতে হবে। যদি ডেটা একটি নির্দিষ্ট প্যারামেট্রিক বন্টনে না থাকে, তবে এই পরীক্ষা সঠিক ফলাফল দিতে সক্ষম হবে না।

২. নমুনার আকারের প্রয়োজনীয়তা:

অনেক parametric tests বড় নমুনার উপর নির্ভর করে কাজ করে এবং ছোট নমুনা নিয়ে সঠিক ফলাফল দেওয়া কঠিন হতে পারে।

সারাংশ

Parametric Test পরিসংখ্যানের একটি শক্তিশালী পদ্ধতি যা গড়, ভ্যারিয়েন্স এবং অন্যান্য প্যারামেট্রিক প্যারামিটারগুলির ভিত্তিতে সম্ভাবনা এবং ফলাফল বিশ্লেষণ করে। এই পরীক্ষাগুলি বিশেষত শক্তিশালী ফলাফল প্রদান করে যখন ডেটা একটি নির্দিষ্ট বন্টনের অধীনে থাকে এবং যথেষ্ট নমুনা তথ্য থাকে। তবে, এটি কিছু নির্দিষ্ট শর্তাবলীর উপর নির্ভরশীল এবং যখন ডেটা সেই শর্তগুলো পূর্ণ করে না, তখন Non-Parametric Tests ব্যবহার করা হয়।

Content added By

Azizar Rahman Aziz

Z-test এবং T-test এর ব্যবহার

3.4k

Z-test এবং T-test হল পরিসংখ্যানের দুইটি গুরুত্বপূর্ণ টেস্ট, যা সাধারণত শর্তাধীন অনুমান পরীক্ষা (hypothesis testing) এর জন্য ব্যবহৃত হয়। এই দুটি টেস্টের মাধ্যমে আমরা কোন নির্দিষ্ট প্যারামিটার সম্পর্কে অনুমান করি এবং সেটি পরীক্ষা করি যে, তা জনসংখ্যার প্যারামিটারের সাথে মানানসই কিনা। এই দুটি টেস্টে মূল পার্থক্য হলো জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন এর সাথে সম্পর্ক এবং নমুনার আকার।

১. Z-test (Z-টেস্ট)

Z-test একটি পরিসংখ্যানিক পরীক্ষা যা নমুনার গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়, যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে এবং নমুনা আকার যথেষ্ট বড় (স্বাভাবিকভাবে $n > 30$ )।

ব্যবহার:

Z-test সাধারণত নিম্নলিখিত ক্ষেত্রে ব্যবহৃত হয়:

জনসংখ্যার গড় সম্পর্কে অনুমান করা, যেখানে জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে।
নমুনা গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করা।
প্রত্যাশিত গড় এবং নমুনার গড় এর মধ্যে তুলনা করা।

গণনা:

Z-test এর জন্য ব্যবহৃত ফর্মুলা হল:

$Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}$

এখানে:

$\bar{x}$ = নমুনার গড়
$\mu$ = জনসংখ্যার গড়
$\sigma$ = জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন
$n$ = নমুনা আকার

উদাহরণ:

ধরা যাক, একটি বিদ্যালয়ের গড় পরীক্ষার স্কোর ৭০। একজন শিক্ষক পরীক্ষার ফলাফল পর্যালোচনা করছেন এবং জানতে চান, একটি নতুন ক্লাসের গড় স্কোর কি ৭০ এর সমান? যদি জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন ১০ হয় এবং নমুনার আকার ৫০ হয়, তবে আমরা Z-test ব্যবহার করতে পারি।

২. T-test (T-টেস্ট)

T-test একটি পরিসংখ্যানিক পরীক্ষা যা নমুনার গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়, তবে এর মধ্যে মূল পার্থক্য হল, T-test ব্যবহার করা হয় যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে না এবং নমুনার আকার ছোট (স্বাভাবিকভাবে $n \leq 30$ )।

ব্যবহার:

T-test সাধারণত নিম্নলিখিত ক্ষেত্রে ব্যবহৃত হয়:

জনসংখ্যার গড় সম্পর্কে অনুমান করা, যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা নেই।
নমুনা গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করা যখন নমুনার আকার ছোট হয়।
দুটি আলাদা গোষ্ঠীর মধ্যে গড় পার্থক্য পরীক্ষা করা (independent T-test)।

গণনা:

T-test এর জন্য ব্যবহৃত ফর্মুলা হল:

$T = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}$

এখানে:

$\bar{x}$ = নমুনার গড়
$\mu$ = জনসংখ্যার গড়
$s$ = নমুনার স্ট্যান্ডার্ড ডেভিয়েশন
$n$ = নমুনা আকার

উদাহরণ:

ধরা যাক, একটি শহরের গড় বেকারি বিক্রির পরিমাণ ১০০ পিস। কিন্তু, একটি নতুন বেকারির বিক্রির গড় কত তা পরীক্ষা করতে চান, যেখানে সারা শহরের বেকারির গড় বিক্রি $\mu = 100$ পিস, কিন্তু নতুন বেকারির স্ট্যান্ডার্ড ডেভিয়েশন জানা নেই এবং নমুনার আকার ২৫। এই পরিস্থিতিতে, T-test ব্যবহার করা হবে।

Z-test এবং T-test এর মধ্যে পার্থক্য:

বৈশিষ্ট্য	Z-test	T-test
জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন	জানানো থাকে	জানা থাকে না
নমুনার আকার	বড় নমুনা (সাধারণত $n > 30$ )	ছোট নমুনা (সাধারণত $n \leq 30$ )
বণ্টন	সাধারণত নরমাল বণ্টন ব্যবহৃত হয়	t-বণ্টন ব্যবহৃত হয়, বিশেষ করে ছোট নমুনার জন্য
ফর্মুলা	$Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}$	$T = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}$

কখন Z-test এবং T-test ব্যবহার করবেন:

Z-test ব্যবহার করা উচিত যদি:
- জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে।
- নমুনার আকার বড় হয় (যেমন $n > 30$ )।
T-test ব্যবহার করা উচিত যদি:
- জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা না থাকে।
- নমুনার আকার ছোট হয় (যেমন $n \leq 30$ )।

সারাংশ

Z-test এবং T-test উভয়ই গড়ের তুলনা করতে ব্যবহৃত হয়, তবে তাদের মধ্যে মূল পার্থক্য হলো জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা এবং নমুনার আকার। Z-test বড় নমুনা এবং স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকলে ব্যবহৃত হয়, যেখানে T-test ছোট নমুনা এবং স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকলে ব্যবহৃত হয়।

Content added By

Azizar Rahman Aziz

Non-parametric Test: Mann-Whitney, Wilcoxon, Kruskal-Wallis

535

Non-parametric tests হল পরিসংখ্যানিক পরীক্ষা যা ডেটার জন্য কোনো নির্দিষ্ট ডিস্ট্রিবিউশন (যেমন, নরমাল ডিস্ট্রিবিউশন) এর উপর নির্ভর করে না। এই পরীক্ষা গুলি প্রধানত তখন ব্যবহৃত হয় যখন ডেটার সাধারণ বণ্টন সম্পর্কে কোনো তথ্য নেই বা ডেটা নরমাল বণ্টনের অনুসরণ করে না। নন-প্যারামেট্রিক টেস্টগুলো সাধারণত ছোট নমুনা বা অসম্পূর্ণ বা র‍্যাঙ্ক ডেটার জন্য ব্যবহৃত হয়।

এখানে তিনটি সাধারণ non-parametric test এর বিস্তারিত আলোচনা করা হলো: Mann-Whitney U Test, Wilcoxon Signed-Rank Test, এবং Kruskal-Wallis Test।

১. Mann-Whitney U Test

Mann-Whitney U Test (যে একে Mann-Whitney-Wilcoxon Test বা Wilcoxon rank-sum test বলেও পরিচিত) একটি পরিসংখ্যানিক পরীক্ষা যা দুইটি স্বাধীন গ্রুপের মধ্যে পার্থক্য নির্ধারণ করে। এটি সাধারণত ব্যবহৃত হয় যখন ডেটা দুটি গ্রুপের মধ্যে তুলনা করতে হয়, এবং ডেটা নরমাল ডিস্ট্রিবিউশনের অনুসরণ না করে।

ব্যবহার:

দুইটি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য, যেখানে গ্রুপগুলির মধ্যে ডেটার পারস্পরিক সম্পর্ক পরীক্ষা করা হয়।
Mann-Whitney গ্রুপগুলির মধ্যে ভিন্নতার পরিমাপ করতে ব্যবহৃত হয় যখন ডেটা সাপেক্ষভাবে নরমাল বণ্টন নয়।

ফর্মুলা:

Mann-Whitney U এর জন্য পরীক্ষা করতে হলে, দুইটি গ্রুপের ডেটার র‍্যাঙ্ক তৈরি করে তারপরে তার উপর ভিত্তি করে U-স্ট্যাটিস্টিক্স হিসাব করা হয়।

উদাহরণ:

যদি দুটি স্কুলের ছাত্রদের পরীক্ষার ফলাফল তুলনা করতে হয় এবং আমরা জানি যে, পরীক্ষার ফলাফল নরমাল ডিস্ট্রিবিউশনের অনুসরণ করছে না, তবে Mann-Whitney U Test ব্যবহার করা হবে।

২. Wilcoxon Signed-Rank Test

Wilcoxon Signed-Rank Test একটি paired sample বা dependent sample এর মধ্যে ডেটার পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত একটি নন-প্যারামেট্রিক পরীক্ষা। এটি সাধারণত তখন ব্যবহৃত হয় যখন দুটি সম্পর্কিত বা যুক্ত গ্রুপের মধ্যে পার্থক্য পরীক্ষা করতে হয়, যেমন একগুচ্ছ সদস্যের পরীক্ষার আগে এবং পরে ফলাফল।

ব্যবহার:

এক বা দুই গ্রুপের জন্য পরীক্ষা, যেখানে একে অপরের উপর নির্ভরশীল দুটি পর্যবেক্ষণ আছে।
উদাহরণস্বরূপ, একই ব্যক্তির আগে এবং পরে কিছু মাপকাঠি (যেমন, ট্রিটমেন্ট আগে এবং পরে) তুলনা করার জন্য।

ফর্মুলা:

Wilcoxon Signed-Rank Test তে, ডেটার র‍্যাঙ্ক করা হয় এবং তারপর তার র‍্যাঙ্কগুলির মধ্যে পার্থক্য হিসাব করা হয়। এই পরীক্ষাটি দুটি সম্পর্কিত গ্রুপের মধ্যে গড় পার্থক্য পরীক্ষা করে।

উদাহরণ:

ধরা যাক, একটি স্বাস্থ্য পরীক্ষা পর, আপনি একটি নির্দিষ্ট চিকিৎসার পরে রোগীর উচ্চতা পরিবর্তন পরিমাপ করতে চান। Wilcoxon Signed-Rank Test ব্যবহার করা যেতে পারে।

৩. Kruskal-Wallis Test

Kruskal-Wallis Test একটি non-parametric পরীক্ষা যা তিনটি বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়। এটি ANOVA এর নন-প্যারামেট্রিক বিকল্প, যা তিনটি বা তার বেশি গ্রুপের মধ্যে গড়ের পার্থক্য পরীক্ষা করে।

ব্যবহার:

তিনটি বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য, যখন ডেটা নরমাল ডিস্ট্রিবিউশনের অনুসরণ করে না।
Kruskal-Wallis সাধারণত একাধিক গ্রুপের মধ্যে র‍্যাঙ্কের পার্থক্য চিহ্নিত করতে ব্যবহৃত হয়।

ফর্মুলা:

Kruskal-Wallis Test এর জন্য, প্রথমে প্রত্যেক গ্রুপের ডেটার র‍্যাঙ্ক তৈরি করা হয় এবং তারপর তার পরিসংখ্যানিক মান হিসাব করা হয়। H-স্ট্যাটিস্টিক্স হিসাব করে তার মাধ্যমে পরীক্ষার সিদ্ধান্ত নেওয়া হয়।

উদাহরণ:

ধরা যাক, তিনটি আলাদা ডিপার্টমেন্টের কর্মীদের সেলফ রিপোর্টেড স্ট্রেস লেভেল তুলনা করতে হয়। Kruskal-Wallis Test ব্যবহার করা হবে যদি আমরা জানি যে ডেটা নরমাল ডিস্ট্রিবিউশন অনুসরণ করছে না।

Mann-Whitney U, Wilcoxon, এবং Kruskal-Wallis এর মধ্যে পার্থক্য:

বৈশিষ্ট্য	Mann-Whitney U Test	Wilcoxon Signed-Rank Test	Kruskal-Wallis Test
গ্রুপের সংখ্যা	দুটি স্বাধীন গ্রুপ	দুটি সম্পর্কিত বা জোড়া গ্রুপ	তিন বা তার বেশি স্বাধীন গ্রুপ
ডেটার ধরন	নন-প্যারামেট্রিক, স্বাধীন গ্রুপ	নন-প্যারামেট্রিক, সম্পর্কিত গ্রুপ	নন-প্যারামেট্রিক, স্বাধীন গ্রুপ
ব্যবহার	দুটি গ্রুপের মধ্যে পার্থক্য পরীক্ষা	সম্পর্কিত ডেটার মধ্যে পার্থক্য পরীক্ষা	তিন বা তার বেশি গ্রুপের মধ্যে পার্থক্য
বিশ্লেষণ	র‍্যাঙ্কের তুলনা	র‍্যাঙ্কের তুলনা এবং পার্থক্য	গ্রুপের মধ্যে র‍্যাঙ্কের তুলনা

সারাংশ

Mann-Whitney U Test, Wilcoxon Signed-Rank Test, এবং Kruskal-Wallis Test হল নন-প্যারামেট্রিক টেস্ট যা ডেটার জন্য কোনো নির্দিষ্ট বণ্টন সম্পর্কিত প্রয়োজনীয়তা ছাড়া ব্যবহৃত হয়।

Mann-Whitney U Test দুটি স্বাধীন গ্রুপের তুলনা করতে ব্যবহৃত হয়।
Wilcoxon Signed-Rank Test দুটি সম্পর্কিত বা জোড়া গ্রুপের মধ্যে পার্থক্য পরীক্ষার জন্য ব্যবহৃত হয়।
Kruskal-Wallis Test তিন বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য চিহ্নিত করতে ব্যবহৃত হয়। এই পরীক্ষাগুলি সাধারণত যখন ডেটা নরমাল বণ্টন অনুসরণ করে না বা ডেটা র‍্যাঙ্ক করা থাকে তখন ব্যবহৃত হয়।

Content added By

Azizar Rahman Aziz

Chi-square Test এর মাধ্যমে Hypothesis Testing

821

Chi-square Test হল একটি পরিসংখ্যানিক পদ্ধতি যা ব্যবহৃত হয় দুটি বা ততোধিক ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করতে, অথবা জনসংখ্যার প্রকৃত বণ্টন এবং একটি অনুমানকৃত বা প্রত্যাশিত বণ্টনের মধ্যে পার্থক্য নির্ধারণ করতে। এটি সাধারণত Nominal বা Ordinal ডেটার জন্য ব্যবহৃত হয় এবং এটি Categorical Data এর উপর ভিত্তি করে কাজ করে।

Hypothesis Testing এর অংশ হিসেবে, Chi-square Test ব্যবহৃত হয় যখন আমাদের একটি হাইপোথিসিস তৈরি করতে হয় এবং সেটি প্রমাণ বা অস্বীকার করতে হয়। এই পরীক্ষাটি মূলত দুটি ধরনের হাইপোথিসিস পরীক্ষা করতে ব্যবহৃত হয়:

Goodness of Fit Test (ফিটনেস পরীক্ষা)
Test of Independence (স্বাধীনতার পরীক্ষা)

১. Chi-square Goodness of Fit Test (ফিটনেস পরীক্ষা)

এই পরীক্ষাটি ব্যবহৃত হয় একটি ক্যাটেগোরির observed (প্রাপ্ত) ফ্রিকোয়েন্সি এবং expected (অনুমানকৃত) ফ্রিকোয়েন্সির মধ্যে পার্থক্য পরীক্ষা করতে। এটি নির্ধারণ করে যে, প্রাপ্ত ডেটা একটি নির্দিষ্ট তত্ত্ব বা পূর্বাভাসের সাথে সামঞ্জস্যপূর্ণ কিনা।

ফর্মুলা:

$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$

এখানে:

$O_i$ = প্রত্যাশিত ফ্রিকোয়েন্সি
$E_i$ = পর্যবেক্ষিত (Observed) ফ্রিকোয়েন্সি
$\chi^2$ = Chi-square মান

ধাপসমূহ:

Null Hypothesis (H₀): "ডেটার মধ্যে কোন পার্থক্য নেই, প্রত্যাশিত বণ্টন সঠিক।"
Alternative Hypothesis (H₁): "ডেটার মধ্যে পার্থক্য রয়েছে, প্রত্যাশিত বণ্টন সঠিক নয়।"
Chi-square Statistic গণনা করুন: উপরের ফর্মুলা অনুসারে χ² হিসাব করুন।
Degree of Freedom (df): $df = k - 1$ , যেখানে $k$ হল শ্রেণীর সংখ্যা।
Critical Value নির্বাচন করুন: নির্ধারিত সিগনিফিকেন্স লেভেল ( $\alpha$ ) এবং $df$ এর উপর ভিত্তি করে Chi-square টেবিল থেকে critical value বের করুন।
χ² এর মান তুলনা করুন: যদি গণনা করা χ² টেবিল থেকে পাওয়া critical value-এর চেয়ে বেশি হয়, তবে null hypothesis অস্বীকার করুন।

উদাহরণ:

একটি পণ্যকে তিনটি ভিন্ন রঙে বাজারজাত করা হয়েছে: লাল, নীল, এবং সবুজ। আপনি 100টি পণ্য বিক্রি করেছেন এবং জানতে চান যে, রঙের বণ্টন সমানভাবে হয়েছে কিনা (যেমন প্রত্যাশিত 33.33% রঙের প্রতি)। এখন আপনি রঙগুলির প্রাপ্ত ফ্রিকোয়েন্সি ব্যবহার করে Chi-square Goodness of Fit Test ব্যবহার করবেন।

২. Chi-square Test of Independence (স্বাধীনতার পরীক্ষা)

Chi-square Test of Independence ব্যবহৃত হয় দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বা নির্ভরতা পরীক্ষা করতে। এটি পরীক্ষা করে যে, দুটি ক্যাটেগোরিকাল ভেরিয়েবল একে অপরের উপর নির্ভরশীল কিনা।

ফর্মুলা:

$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$

এখানে:

$O_i$ = পর্যবেক্ষিত ফ্রিকোয়েন্সি
$E_i$ = প্রত্যাশিত ফ্রিকোয়েন্সি
$\chi^2$ = Chi-square মান

ধাপসমূহ:

Null Hypothesis (H₀): "দুটি ভেরিয়েবল একে অপরের উপর নির্ভরশীল নয় (স্বাধীন)।"
Alternative Hypothesis (H₁): "দুটি ভেরিয়েবল একে অপরের উপর নির্ভরশীল।"
Chi-square Statistic গণনা করুন: উপরের ফর্মুলা অনুসারে χ² হিসাব করুন।
Degree of Freedom (df): $df = (r - 1)(c - 1)$ , যেখানে $r$ হল সারির সংখ্যা এবং $c$ হল কলামের সংখ্যা।
Critical Value নির্বাচন করুন: নির্ধারিত সিগনিফিকেন্স লেভেল ( $\alpha$ ) এবং $df$ এর উপর ভিত্তি করে critical value বের করুন।
χ² এর মান তুলনা করুন: যদি গণনা করা χ² critical value এর চেয়ে বেশি হয়, তবে null hypothesis অস্বীকার করুন।

উদাহরণ:

একটি দোকানে দুটি ভিন্ন ধরনের পণ্য বিক্রি হচ্ছে: পণ্য A এবং পণ্য B। আপনি জানতে চান যে, পণ্য কেনার জন্য পুরুষ এবং মহিলাদের মধ্যে কোনো পার্থক্য রয়েছে কিনা। এখানে, পুরুষ এবং মহিলার মধ্যে পণ্য নির্বাচন স্বাধীন কিনা তা যাচাই করতে Chi-square Test of Independence ব্যবহার করবেন।

Chi-square Test এর মাধ্যমে Hypothesis Testing এর উদাহরণ

ধরুন, আপনি একটি পরীক্ষায় তিনটি শ্রেণী: A, B, এবং C এর মধ্যে ছাত্রদের শ্রেণি ভাগের উপর একটি পরিসংখ্যান পরিচালনা করছেন।

Null Hypothesis (H₀): শ্রেণীভাগ সমানভাবে বিতরণ হয়েছে (অর্থাৎ, ছাত্রদের মধ্যে শ্রেণী A, B, এবং C এর মধ্যে সমানভাবে ভাগ হয়েছে)।
Alternative Hypothesis (H₁): শ্রেণীভাগ সমানভাবে বিতরণ হয়নি (অর্থাৎ, ছাত্রদের মধ্যে শ্রেণী A, B, এবং C এর মধ্যে সমানভাবে ভাগ হয়নি)।

আপনি পর্যবেক্ষিত ডেটা অনুযায়ী Chi-square Test প্রয়োগ করবেন। এখানে:

Expected Frequency (প্রত্যাশিত ফ্রিকোয়েন্সি) এর জন্য, আপনি Total Students / Number of Categories ব্যবহার করবেন।
তারপর Chi-square statistic ব্যবহার করে পরীক্ষা করবেন যে, পর্যবেক্ষিত ফ্রিকোয়েন্সি এবং প্রত্যাশিত ফ্রিকোয়েন্সির মধ্যে পার্থক্য উল্লেখযোগ্য কিনা।

সারাংশ

Chi-square Test একটি শক্তিশালী পরিসংখ্যানিক পদ্ধতি যা বিভিন্ন ধরনের হাইপোথিসিস পরীক্ষা করার জন্য ব্যবহৃত হয়, বিশেষ করে ক্যাটেগোরিকাল ডেটার ক্ষেত্রে। এটি Goodness of Fit Test (ফিটনেস পরীক্ষা) এবং Test of Independence (স্বাধীনতার পরীক্ষা) হিসেবে দুটি প্রধানভাবে ব্যবহৃত হয়। Chi-square Test এর মাধ্যমে আমরা দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বা একটি বণ্টনের সঠিকতা পরীক্ষা করতে পারি। Chi-square statistic নির্ধারণ করে, আমরা একটি নির্দিষ্ট critical value এর সাথে তুলনা করে হাইপোথিসিস গ্রহণ বা অস্বীকার করতে পারি।

Content added By

Azizar Rahman Aziz

পরিসংখ্যানের মৌলিক ধারণা এবং প্রয়োজনীয়তা ভর ডেটার পরিমাপ (Measures of Mass Data) Graphical Presentation of Data Measures of Central Tendency Measures of Dispersion

Parametric এবং Non-parametric Tests

১. Parametric Tests (প্যারামেট্রিক টেস্ট)

বিশেষত্ব:

উদাহরণ:

প্রয়োজনীয়তা:

২. Non-parametric Tests (নন-প্যারামেট্রিক টেস্ট)

বিশেষত্ব:

উদাহরণ:

প্রয়োজনীয়তা:

Parametric এবং Non-parametric Tests এর তুলনা

সারাংশ

Parametric Test এর মৌলিক ধারণা

Parametric Test এর বৈশিষ্ট্য:

Parametric Test এর প্রধান ধরন:

Parametric Test এর প্রয়োজনীয়তা:

Parametric Test এর সুবিধা:

Parametric Test এর সীমাবদ্ধতা:

সারাংশ

Z-test এবং T-test এর ব্যবহার

১. Z-test (Z-টেস্ট)

ব্যবহার:

গণনা:

উদাহরণ:

২. T-test (T-টেস্ট)

ব্যবহার:

গণনা:

উদাহরণ:

Z-test এবং T-test এর মধ্যে পার্থক্য:

কখন Z-test এবং T-test ব্যবহার করবেন:

সারাংশ

Non-parametric Test: Mann-Whitney, Wilcoxon, Kruskal-Wallis

১. Mann-Whitney U Test

ব্যবহার:

ফর্মুলা:

উদাহরণ:

২. Wilcoxon Signed-Rank Test

ব্যবহার:

ফর্মুলা:

উদাহরণ:

৩. Kruskal-Wallis Test

ব্যবহার:

ফর্মুলা:

উদাহরণ:

Mann-Whitney U, Wilcoxon, এবং Kruskal-Wallis এর মধ্যে পার্থক্য:

সারাংশ

Chi-square Test এর মাধ্যমে Hypothesis Testing

১. Chi-square Goodness of Fit Test (ফিটনেস পরীক্ষা)

ফর্মুলা:

ধাপসমূহ:

উদাহরণ:

২. Chi-square Test of Independence (স্বাধীনতার পরীক্ষা)

ফর্মুলা:

ধাপসমূহ:

উদাহরণ:

Chi-square Test এর মাধ্যমে Hypothesis Testing এর উদাহরণ

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!