Parametric এবং Non-parametric Tests

Big Data and Analytics - পরিসংখ্যান (Statistics)
1.4k

Parametric এবং Non-parametric টেস্টগুলি পরিসংখ্যানের গুরুত্বপূর্ণ পদ্ধতি যা ডেটার বিভিন্ন বৈশিষ্ট্য এবং গুণগত বিশ্লেষণ করতে ব্যবহৃত হয়। এই দুই ধরনের টেস্টের মধ্যে মৌলিক পার্থক্য হল যে Parametric Tests নির্দিষ্ট ডিস্ট্রিবিউশন (যেমন, Normal distribution) এবং প্যারামিটার অনুমান ব্যবহার করে, যেখানে Non-parametric Tests কোন নির্দিষ্ট ডিস্ট্রিবিউশন বা প্যারামিটার সম্পর্কে কোনো ধারণা তৈরি করে না এবং এটি সাধারণত ছোট স্যাম্পল বা ডেটার মধ্যে অস্বাভাবিক পরিস্থিতিতে ব্যবহৃত হয়।


১. Parametric Tests (প্যারামেট্রিক টেস্ট)

Parametric Tests হল এমন পরিসংখ্যানিক পরীক্ষা যা ডেটার প্যারামিটার (যেমন, গড়, ভিন্নতা) এবং নির্দিষ্ট ডিস্ট্রিবিউশন (সাধারণত Normal distribution) সম্পর্কে ধারণা ব্যবহার করে। এগুলি শুধুমাত্র তখনই কার্যকরী হয় যখন ডেটা স্বাভাবিকভাবে বিতরণ করা থাকে এবং ডেটা সম্পর্কে কিছু পূর্বধারণা বা প্যারামিটার নির্ধারণ করা যায়।

বিশেষত্ব:

  • Normal Distribution অনুমান করা হয়।
  • ডেটার জন্য কিছু প্যারামিটার (যেমন, গড় এবং ভিন্নতা) জানা থাকে।
  • এটি বড় স্যাম্পল সাইজের জন্য কার্যকরী।
  • Parametric Tests সাধারণত অধিক শক্তিশালী এবং নিখুঁত ফলাফল দেয় যদি ডেটা প্যারামিটার সম্পর্কিত ধারণা অনুসারে হয়।

উদাহরণ:

  • t-test: দুই গোষ্ঠীর গড়ের মধ্যে পার্থক্য পরীক্ষা করা।
  • ANOVA (Analysis of Variance): তিন বা তার বেশি গোষ্ঠীর মধ্যে গড়ের পার্থক্য পরীক্ষা করা।
  • Pearson’s Correlation: দুটি চলক বা ভ্যারিয়েবলের মধ্যে সম্পর্ক পরিমাপ করা।
  • Z-test: প্রাপ্ত স্যাম্পল গড়ের ভিত্তিতে জনসংখ্যার গড় অনুমান করা।

প্রয়োজনীয়তা:

  • ডেটা সাধারণত Normal Distribution অনুযায়ী বিতরণ করা উচিত।
  • গড় এবং ভিন্নতার মতো প্যারামিটার নির্ধারণ করা যায়।

২. Non-parametric Tests (নন-প্যারামেট্রিক টেস্ট)

Non-parametric Tests হল এমন পরিসংখ্যানিক পরীক্ষা যা ডেটার ডিস্ট্রিবিউশন বা প্যারামিটার সম্পর্কে কোনো পূর্বধারণা তৈরি না করে, এবং এটি এমন পরিস্থিতিতে ব্যবহৃত হয় যেখানে ডেটা স্বাভাবিকভাবে বিতরণ না হলেও কার্যকরী। Non-parametric টেস্ট ছোট স্যাম্পল সাইজ, অস্বাভাবিক ডেটা বিতরণ, অথবা ডেটার মধ্যে রৈখিক সম্পর্ক না থাকলে ব্যবহার করা হয়।

বিশেষত্ব:

  • কোন নির্দিষ্ট ডিস্ট্রিবিউশন অনুমান করা হয় না।
  • এটি ছোট স্যাম্পল সাইজের জন্য কার্যকর।
  • Non-parametric tests সাধারণত rank বা ordinal ডেটা ব্যবহার করে এবং এটি আরও সাধারণ ও নমনীয়।

উদাহরণ:

  • Mann-Whitney U Test: দুটি স্বাধীন গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা, যখন ডেটা স্বাভাবিকভাবে বিতরণ না হয়।
  • Kruskal-Wallis Test: তিন বা তার বেশি গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা (এটি ANOVA এর নন-প্যারামেট্রিক সমকক্ষ)।
  • Chi-square Test: ক্যাটেগোরিক্যাল ডেটার মধ্যে সম্পর্ক পরীক্ষা করা (যেমন, দুটি ভেরিয়েবলের মধ্যে সম্পর্ক যাচাই করা)।
  • Wilcoxon Signed Rank Test: দুটি সম্পর্কিত গোষ্ঠীর মধ্যে পার্থক্য পরীক্ষা করা (যেমন, একাধিক পরিসংখ্যানের পূর্ববর্তী এবং পরবর্তী মানের তুলনা করা)।

প্রয়োজনীয়তা:

  • ডেটার জন্য কোন নির্দিষ্ট ডিস্ট্রিবিউশন বা প্যারামিটার অনুমান করা হয় না।
  • সাধারণত ordinal বা ranked ডেটা ব্যবহার করা হয়।

Parametric এবং Non-parametric Tests এর তুলনা

বৈশিষ্ট্যParametric TestsNon-parametric Tests
ডেটার ধরনসাধারণত Normal Distribution তে বিশ্লেষণকোন নির্দিষ্ট ডিস্ট্রিবিউশন অনুমান করা হয় না
ডেটার পরিমাপগড়, ভিন্নতা এবং অন্যান্য প্যারামিটার ব্যবহৃতর‌্যাঙ্ক বা অর্ডিনাল ডেটা ব্যবহৃত
স্যাম্পল সাইজবড় স্যাম্পল সাইজের জন্য কার্যকরীছোট স্যাম্পল সাইজের জন্য কার্যকরী
উদাহরণt-test, ANOVA, Z-testMann-Whitney U Test, Kruskal-Wallis Test, Chi-square Test
বিশ্লেষণ শক্তিঅধিক শক্তিশালী যদি ডেটা স্বাভাবিকভাবে বিতরণ হয়সাধারণত কম শক্তিশালী, তবে বেশি নমনীয়
প্রয়োজনীয়তাডেটার জন্য প্যারামিটার নির্ধারণ করা যাবেডেটার জন্য কোনো পূর্বধারণা দরকার হয় না

সারাংশ

Parametric Tests এবং Non-parametric Tests পরিসংখ্যানিক বিশ্লেষণের দুটি গুরুত্বপূর্ণ শাখা। Parametric Tests ডেটার ডিস্ট্রিবিউশন এবং প্যারামিটার সম্পর্কে নির্দিষ্ট ধারণা তৈরি করে এবং সাধারণত বড় স্যাম্পলের জন্য কার্যকরী। Non-parametric Tests ডেটার জন্য কোন নির্দিষ্ট ধারণা বা প্যারামিটার অনুমান না করেও ছোট স্যাম্পল এবং অস্বাভাবিক ডেটা বিশ্লেষণ করতে সাহায্য করে। সঠিক টেস্টের নির্বাচন ডেটার প্রকৃতি এবং গবেষণার উদ্দেশ্য অনুসারে করা উচিত।

Content added By

Parametric Test এর মৌলিক ধারণা

568

Parametric Test পরিসংখ্যানের একটি গুরুত্বপূর্ণ শাখা যা ডেটার প্যারামিটার সম্পর্কিত অনুমান করে। এটি এমন একটি পরিসংখ্যানিক পরীক্ষা যা একটি নির্দিষ্ট ধরনের ডেটার জন্য ব্যবহৃত হয়, যেখানে ডেটার প্রকার এবং ডেটার গাণিতিক বৈশিষ্ট্যগুলি (যেমন গড়, ভ্যারিয়েন্স, এবং গঠন) পূর্বানুমান করা যায়। Parametric Test সাধারণত Normal Distribution বা অন্যান্য বিশেষ ডিস্ট্রিবিউশনের উপর ভিত্তি করে কাজ করে এবং এটি ডেটার বন্টন সম্পর্কিত কিছু নির্দিষ্ট অনুমান বা প্যারামিটার নিয়ে কাজ করে।


Parametric Test এর বৈশিষ্ট্য:

  1. ডেটার গঠন সম্পর্কে অনুমান:
    • Parametric Test ব্যবহার করার আগে, ডেটার একটি নির্দিষ্ট গঠন বা বন্টন অনুমান করা হয় (যেমন Normal Distribution)।
    • এটি অনুমান করে যে, ডেটা একটি নির্দিষ্ট প্যারামেট্রিক বন্টনে ফিট হবে, যেমন গড় এবং ভ্যারিয়েন্স জানালে ডেটা কীভাবে বিতরণ হতে পারে তা অনুমান করা যায়।
  2. প্যারামিটার সম্পর্কিত পরীক্ষণ:
    • Parametric Test সাধারণত গড়, ভ্যারিয়েন্স, বা অন্যান্য প্যারামিটার সম্পর্কিত অনুমান বা পরীক্ষা চালায়।
    • এটি অনুমান করে যে, ডেটা যে প্যারামিটার (যেমন গড় বা ভ্যারিয়েন্স) অনুসরণ করে, সেটির সাথে সম্পর্কিত প্রশ্নের উত্তর পাওয়া যাবে।
  3. বন্টনের ধরন:
    • Parametric Test গুলি একটি নির্দিষ্ট প্যারামেট্রিক বন্টন (যেমন Normal Distribution) নির্ভরশীল হয়ে থাকে। এই বন্টন সাধারণত জানানো প্যারামিটারগুলি (গড়, স্ট্যান্ডার্ড ডেভিয়েশন) দ্বারা নির্ধারিত হয়।

Parametric Test এর প্রধান ধরন:

১. t-test (t-পরীক্ষা):

  • t-test ব্যবহৃত হয় যখন আমরা দুটি গোষ্ঠীর গড় তুলনা করতে চাই এবং ডেটা ছোট নমুনা থেকে সংগৃহীত হয়।
  • এটি সাধারণত Independent t-test (যখন দুটি পৃথক গোষ্ঠী থাকে) বা Paired t-test (যখন এক গোষ্ঠীর দুটি আলাদা ডেটা পয়েন্ট থাকে) হিসেবে ব্যবহৃত হয়।

২. ANOVA (Analysis of Variance):

  • ANOVA ব্যবহার করা হয় যখন তিন বা তার বেশি গোষ্ঠীর গড় তুলনা করতে হয়। এটি ডেটার মধ্যে বিভিন্ন গোষ্ঠীর মধ্যে পার্থক্য নির্ধারণ করে।
  • এটি One-way ANOVA (যখন একমাত্র ভেরিয়েবল থাকে) এবং Two-way ANOVA (যখন দুটি ভেরিয়েবল থাকে) হিসাবে বিভক্ত হতে পারে।

৩. Z-test:

  • Z-test ব্যবহৃত হয় যখন ডেটার গড় এবং স্ট্যান্ডার্ড ডেভিয়েশন জানানো থাকে এবং নমুনার আকার বড় হয় (বিশেষ করে ৩০ বা তার বেশি)।
  • এটি প্রধানত population mean এবং sample mean এর মধ্যে পার্থক্য পরীক্ষা করতে ব্যবহৃত হয়।

Parametric Test এর প্রয়োজনীয়তা:

১. ডেটার গড় এবং ভ্যারিয়েন্স জানানো:

  • Parametric Test প্রাথমিকভাবে গড় এবং ভ্যারিয়েন্সের উপর ভিত্তি করে, তাই যখন ডেটার গড় বা ভ্যারিয়েন্স সম্পর্কে তথ্য জানা থাকে, তখন এটি খুব কার্যকরী হয়।

২. শক্তিশালী ফলাফল:

  • Parametric Test এর ফলাফল সাধারণত অত্যন্ত শক্তিশালী এবং নির্ভরযোগ্য। কারণ এটি একটি নির্দিষ্ট প্যারামেট্রিক বন্টন এবং প্যারামিটার ব্যবহার করে পরীক্ষা চালায়।

৩. ডেটার প্যারামেট্রিক বৈশিষ্ট্য বোঝা:

  • এই পরীক্ষাগুলি সাধারণত ডেটার অস্থিরতা বা বৈচিত্র্য (variation) এবং গড়ের মধ্যে সম্পর্ক বোঝাতে সহায়ক হয়। ফলে, এটি গুণগত বিশ্লেষণ করতে উপকারী।

Parametric Test এর সুবিধা:

১. নির্ভুলতা এবং বিশ্বস্ততা:

  • Parametric Test গুলি অনেক ক্ষেত্রেই অধিক নির্ভুল ফলাফল দেয় কারণ তারা কিছু নির্দিষ্ট প্যারামিটার (যেমন গড় এবং ভ্যারিয়েন্স) জানায় এবং এই প্যারামিটারগুলির উপর ভিত্তি করে হিসাব করা হয়।

২. বড় নমুনা এবং প্রযোজ্যতা:

  • এই পরীক্ষাগুলি বিশেষ করে বড় নমুনার জন্য উপযোগী এবং সাধারণত বড় ডেটা সেটে কার্যকর।

৩. শক্তিশালী পরীক্ষণ ক্ষমতা:

  • Parametric Test গুলির পরীক্ষণ ক্ষমতা বেশি, কারণ তারা কিছু নির্দিষ্ট প্যারামেট্রিক ফর্মে কাজ করে, ফলে ফলাফল বেশি নির্ভরযোগ্য হয়।

Parametric Test এর সীমাবদ্ধতা:

১. বন্টনের ধরন নির্ভরশীলতা:

  • Parametric Test এর জন্য একটি নির্দিষ্ট বন্টন বা প্যারামেট্রিক গঠন থাকতে হবে। যদি ডেটা একটি নির্দিষ্ট প্যারামেট্রিক বন্টনে না থাকে, তবে এই পরীক্ষা সঠিক ফলাফল দিতে সক্ষম হবে না।

২. নমুনার আকারের প্রয়োজনীয়তা:

  • অনেক parametric tests বড় নমুনার উপর নির্ভর করে কাজ করে এবং ছোট নমুনা নিয়ে সঠিক ফলাফল দেওয়া কঠিন হতে পারে।

সারাংশ

Parametric Test পরিসংখ্যানের একটি শক্তিশালী পদ্ধতি যা গড়, ভ্যারিয়েন্স এবং অন্যান্য প্যারামেট্রিক প্যারামিটারগুলির ভিত্তিতে সম্ভাবনা এবং ফলাফল বিশ্লেষণ করে। এই পরীক্ষাগুলি বিশেষত শক্তিশালী ফলাফল প্রদান করে যখন ডেটা একটি নির্দিষ্ট বন্টনের অধীনে থাকে এবং যথেষ্ট নমুনা তথ্য থাকে। তবে, এটি কিছু নির্দিষ্ট শর্তাবলীর উপর নির্ভরশীল এবং যখন ডেটা সেই শর্তগুলো পূর্ণ করে না, তখন Non-Parametric Tests ব্যবহার করা হয়।

Content added By

Z-test এবং T-test এর ব্যবহার

3.2k

Z-test এবং T-test হল পরিসংখ্যানের দুইটি গুরুত্বপূর্ণ টেস্ট, যা সাধারণত শর্তাধীন অনুমান পরীক্ষা (hypothesis testing) এর জন্য ব্যবহৃত হয়। এই দুটি টেস্টের মাধ্যমে আমরা কোন নির্দিষ্ট প্যারামিটার সম্পর্কে অনুমান করি এবং সেটি পরীক্ষা করি যে, তা জনসংখ্যার প্যারামিটারের সাথে মানানসই কিনা। এই দুটি টেস্টে মূল পার্থক্য হলো জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন এর সাথে সম্পর্ক এবং নমুনার আকার


১. Z-test (Z-টেস্ট)

Z-test একটি পরিসংখ্যানিক পরীক্ষা যা নমুনার গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়, যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে এবং নমুনা আকার যথেষ্ট বড় (স্বাভাবিকভাবে n>30n > 30)।

ব্যবহার:

Z-test সাধারণত নিম্নলিখিত ক্ষেত্রে ব্যবহৃত হয়:

  • জনসংখ্যার গড় সম্পর্কে অনুমান করা, যেখানে জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে।
  • নমুনা গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করা।
  • প্রত্যাশিত গড় এবং নমুনার গড় এর মধ্যে তুলনা করা।

গণনা:

Z-test এর জন্য ব্যবহৃত ফর্মুলা হল:

Z=xˉμσnZ = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}

এখানে:

  • xˉ\bar{x} = নমুনার গড়
  • μ\mu = জনসংখ্যার গড়
  • σ\sigma = জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন
  • nn = নমুনা আকার

উদাহরণ:

ধরা যাক, একটি বিদ্যালয়ের গড় পরীক্ষার স্কোর ৭০। একজন শিক্ষক পরীক্ষার ফলাফল পর্যালোচনা করছেন এবং জানতে চান, একটি নতুন ক্লাসের গড় স্কোর কি ৭০ এর সমান? যদি জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন ১০ হয় এবং নমুনার আকার ৫০ হয়, তবে আমরা Z-test ব্যবহার করতে পারি।


২. T-test (T-টেস্ট)

T-test একটি পরিসংখ্যানিক পরীক্ষা যা নমুনার গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়, তবে এর মধ্যে মূল পার্থক্য হল, T-test ব্যবহার করা হয় যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে না এবং নমুনার আকার ছোট (স্বাভাবিকভাবে n30n \leq 30)।

ব্যবহার:

T-test সাধারণত নিম্নলিখিত ক্ষেত্রে ব্যবহৃত হয়:

  • জনসংখ্যার গড় সম্পর্কে অনুমান করা, যখন জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা নেই।
  • নমুনা গড় এবং জনসংখ্যার গড় এর মধ্যে পার্থক্য পরীক্ষা করা যখন নমুনার আকার ছোট হয়।
  • দুটি আলাদা গোষ্ঠীর মধ্যে গড় পার্থক্য পরীক্ষা করা (independent T-test)।

গণনা:

T-test এর জন্য ব্যবহৃত ফর্মুলা হল:

T=xˉμsnT = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}

এখানে:

  • xˉ\bar{x} = নমুনার গড়
  • μ\mu = জনসংখ্যার গড়
  • ss = নমুনার স্ট্যান্ডার্ড ডেভিয়েশন
  • nn = নমুনা আকার

উদাহরণ:

ধরা যাক, একটি শহরের গড় বেকারি বিক্রির পরিমাণ ১০০ পিস। কিন্তু, একটি নতুন বেকারির বিক্রির গড় কত তা পরীক্ষা করতে চান, যেখানে সারা শহরের বেকারির গড় বিক্রি μ=100\mu = 100 পিস, কিন্তু নতুন বেকারির স্ট্যান্ডার্ড ডেভিয়েশন জানা নেই এবং নমুনার আকার ২৫। এই পরিস্থিতিতে, T-test ব্যবহার করা হবে।


Z-test এবং T-test এর মধ্যে পার্থক্য:

বৈশিষ্ট্যZ-testT-test
জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশনজানানো থাকেজানা থাকে না
নমুনার আকারবড় নমুনা (সাধারণত n>30n > 30)ছোট নমুনা (সাধারণত n30n \leq 30)
বণ্টনসাধারণত নরমাল বণ্টন ব্যবহৃত হয়t-বণ্টন ব্যবহৃত হয়, বিশেষ করে ছোট নমুনার জন্য
ফর্মুলাZ=xˉμσnZ = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}T=xˉμsnT = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}

কখন Z-test এবং T-test ব্যবহার করবেন:

  • Z-test ব্যবহার করা উচিত যদি:
    • জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে।
    • নমুনার আকার বড় হয় (যেমন n>30n > 30)।
  • T-test ব্যবহার করা উচিত যদি:
    • জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা না থাকে।
    • নমুনার আকার ছোট হয় (যেমন n30n \leq 30)।

সারাংশ

Z-test এবং T-test উভয়ই গড়ের তুলনা করতে ব্যবহৃত হয়, তবে তাদের মধ্যে মূল পার্থক্য হলো জনসংখ্যার স্ট্যান্ডার্ড ডেভিয়েশন জানা এবং নমুনার আকারZ-test বড় নমুনা এবং স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকলে ব্যবহৃত হয়, যেখানে T-test ছোট নমুনা এবং স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকলে ব্যবহৃত হয়।

Content added By

Non-parametric Test: Mann-Whitney, Wilcoxon, Kruskal-Wallis

454

Non-parametric tests হল পরিসংখ্যানিক পরীক্ষা যা ডেটার জন্য কোনো নির্দিষ্ট ডিস্ট্রিবিউশন (যেমন, নরমাল ডিস্ট্রিবিউশন) এর উপর নির্ভর করে না। এই পরীক্ষা গুলি প্রধানত তখন ব্যবহৃত হয় যখন ডেটার সাধারণ বণ্টন সম্পর্কে কোনো তথ্য নেই বা ডেটা নরমাল বণ্টনের অনুসরণ করে না। নন-প্যারামেট্রিক টেস্টগুলো সাধারণত ছোট নমুনা বা অসম্পূর্ণ বা র‍্যাঙ্ক ডেটার জন্য ব্যবহৃত হয়।

এখানে তিনটি সাধারণ non-parametric test এর বিস্তারিত আলোচনা করা হলো: Mann-Whitney U Test, Wilcoxon Signed-Rank Test, এবং Kruskal-Wallis Test


১. Mann-Whitney U Test

Mann-Whitney U Test (যে একে Mann-Whitney-Wilcoxon Test বা Wilcoxon rank-sum test বলেও পরিচিত) একটি পরিসংখ্যানিক পরীক্ষা যা দুইটি স্বাধীন গ্রুপের মধ্যে পার্থক্য নির্ধারণ করে। এটি সাধারণত ব্যবহৃত হয় যখন ডেটা দুটি গ্রুপের মধ্যে তুলনা করতে হয়, এবং ডেটা নরমাল ডিস্ট্রিবিউশনের অনুসরণ না করে।

ব্যবহার:

  • দুইটি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য, যেখানে গ্রুপগুলির মধ্যে ডেটার পারস্পরিক সম্পর্ক পরীক্ষা করা হয়।
  • Mann-Whitney গ্রুপগুলির মধ্যে ভিন্নতার পরিমাপ করতে ব্যবহৃত হয় যখন ডেটা সাপেক্ষভাবে নরমাল বণ্টন নয়।

ফর্মুলা:

Mann-Whitney U এর জন্য পরীক্ষা করতে হলে, দুইটি গ্রুপের ডেটার র‍্যাঙ্ক তৈরি করে তারপরে তার উপর ভিত্তি করে U-স্ট্যাটিস্টিক্স হিসাব করা হয়।

উদাহরণ:

যদি দুটি স্কুলের ছাত্রদের পরীক্ষার ফলাফল তুলনা করতে হয় এবং আমরা জানি যে, পরীক্ষার ফলাফল নরমাল ডিস্ট্রিবিউশনের অনুসরণ করছে না, তবে Mann-Whitney U Test ব্যবহার করা হবে।


২. Wilcoxon Signed-Rank Test

Wilcoxon Signed-Rank Test একটি paired sample বা dependent sample এর মধ্যে ডেটার পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত একটি নন-প্যারামেট্রিক পরীক্ষা। এটি সাধারণত তখন ব্যবহৃত হয় যখন দুটি সম্পর্কিত বা যুক্ত গ্রুপের মধ্যে পার্থক্য পরীক্ষা করতে হয়, যেমন একগুচ্ছ সদস্যের পরীক্ষার আগে এবং পরে ফলাফল।

ব্যবহার:

  • এক বা দুই গ্রুপের জন্য পরীক্ষা, যেখানে একে অপরের উপর নির্ভরশীল দুটি পর্যবেক্ষণ আছে।
  • উদাহরণস্বরূপ, একই ব্যক্তির আগে এবং পরে কিছু মাপকাঠি (যেমন, ট্রিটমেন্ট আগে এবং পরে) তুলনা করার জন্য।

ফর্মুলা:

Wilcoxon Signed-Rank Test তে, ডেটার র‍্যাঙ্ক করা হয় এবং তারপর তার র‍্যাঙ্কগুলির মধ্যে পার্থক্য হিসাব করা হয়। এই পরীক্ষাটি দুটি সম্পর্কিত গ্রুপের মধ্যে গড় পার্থক্য পরীক্ষা করে।

উদাহরণ:

ধরা যাক, একটি স্বাস্থ্য পরীক্ষা পর, আপনি একটি নির্দিষ্ট চিকিৎসার পরে রোগীর উচ্চতা পরিবর্তন পরিমাপ করতে চান। Wilcoxon Signed-Rank Test ব্যবহার করা যেতে পারে।


৩. Kruskal-Wallis Test

Kruskal-Wallis Test একটি non-parametric পরীক্ষা যা তিনটি বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়। এটি ANOVA এর নন-প্যারামেট্রিক বিকল্প, যা তিনটি বা তার বেশি গ্রুপের মধ্যে গড়ের পার্থক্য পরীক্ষা করে।

ব্যবহার:

  • তিনটি বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য পরীক্ষা করার জন্য, যখন ডেটা নরমাল ডিস্ট্রিবিউশনের অনুসরণ করে না।
  • Kruskal-Wallis সাধারণত একাধিক গ্রুপের মধ্যে র‍্যাঙ্কের পার্থক্য চিহ্নিত করতে ব্যবহৃত হয়।

ফর্মুলা:

Kruskal-Wallis Test এর জন্য, প্রথমে প্রত্যেক গ্রুপের ডেটার র‍্যাঙ্ক তৈরি করা হয় এবং তারপর তার পরিসংখ্যানিক মান হিসাব করা হয়। H-স্ট্যাটিস্টিক্স হিসাব করে তার মাধ্যমে পরীক্ষার সিদ্ধান্ত নেওয়া হয়।

উদাহরণ:

ধরা যাক, তিনটি আলাদা ডিপার্টমেন্টের কর্মীদের সেলফ রিপোর্টেড স্ট্রেস লেভেল তুলনা করতে হয়। Kruskal-Wallis Test ব্যবহার করা হবে যদি আমরা জানি যে ডেটা নরমাল ডিস্ট্রিবিউশন অনুসরণ করছে না।


Mann-Whitney U, Wilcoxon, এবং Kruskal-Wallis এর মধ্যে পার্থক্য:

বৈশিষ্ট্যMann-Whitney U TestWilcoxon Signed-Rank TestKruskal-Wallis Test
গ্রুপের সংখ্যাদুটি স্বাধীন গ্রুপদুটি সম্পর্কিত বা জোড়া গ্রুপতিন বা তার বেশি স্বাধীন গ্রুপ
ডেটার ধরননন-প্যারামেট্রিক, স্বাধীন গ্রুপনন-প্যারামেট্রিক, সম্পর্কিত গ্রুপনন-প্যারামেট্রিক, স্বাধীন গ্রুপ
ব্যবহারদুটি গ্রুপের মধ্যে পার্থক্য পরীক্ষাসম্পর্কিত ডেটার মধ্যে পার্থক্য পরীক্ষাতিন বা তার বেশি গ্রুপের মধ্যে পার্থক্য
বিশ্লেষণর‍্যাঙ্কের তুলনার‍্যাঙ্কের তুলনা এবং পার্থক্যগ্রুপের মধ্যে র‍্যাঙ্কের তুলনা

সারাংশ

Mann-Whitney U Test, Wilcoxon Signed-Rank Test, এবং Kruskal-Wallis Test হল নন-প্যারামেট্রিক টেস্ট যা ডেটার জন্য কোনো নির্দিষ্ট বণ্টন সম্পর্কিত প্রয়োজনীয়তা ছাড়া ব্যবহৃত হয়।

  • Mann-Whitney U Test দুটি স্বাধীন গ্রুপের তুলনা করতে ব্যবহৃত হয়।
  • Wilcoxon Signed-Rank Test দুটি সম্পর্কিত বা জোড়া গ্রুপের মধ্যে পার্থক্য পরীক্ষার জন্য ব্যবহৃত হয়।
  • Kruskal-Wallis Test তিন বা তার বেশি স্বাধীন গ্রুপের মধ্যে পার্থক্য চিহ্নিত করতে ব্যবহৃত হয়। এই পরীক্ষাগুলি সাধারণত যখন ডেটা নরমাল বণ্টন অনুসরণ করে না বা ডেটা র‍্যাঙ্ক করা থাকে তখন ব্যবহৃত হয়।
Content added By

Chi-square Test এর মাধ্যমে Hypothesis Testing

738

Chi-square Test হল একটি পরিসংখ্যানিক পদ্ধতি যা ব্যবহৃত হয় দুটি বা ততোধিক ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করতে, অথবা জনসংখ্যার প্রকৃত বণ্টন এবং একটি অনুমানকৃত বা প্রত্যাশিত বণ্টনের মধ্যে পার্থক্য নির্ধারণ করতে। এটি সাধারণত Nominal বা Ordinal ডেটার জন্য ব্যবহৃত হয় এবং এটি Categorical Data এর উপর ভিত্তি করে কাজ করে।

Hypothesis Testing এর অংশ হিসেবে, Chi-square Test ব্যবহৃত হয় যখন আমাদের একটি হাইপোথিসিস তৈরি করতে হয় এবং সেটি প্রমাণ বা অস্বীকার করতে হয়। এই পরীক্ষাটি মূলত দুটি ধরনের হাইপোথিসিস পরীক্ষা করতে ব্যবহৃত হয়:

  1. Goodness of Fit Test (ফিটনেস পরীক্ষা)
  2. Test of Independence (স্বাধীনতার পরীক্ষা)

১. Chi-square Goodness of Fit Test (ফিটনেস পরীক্ষা)

এই পরীক্ষাটি ব্যবহৃত হয় একটি ক্যাটেগোরির observed (প্রাপ্ত) ফ্রিকোয়েন্সি এবং expected (অনুমানকৃত) ফ্রিকোয়েন্সির মধ্যে পার্থক্য পরীক্ষা করতে। এটি নির্ধারণ করে যে, প্রাপ্ত ডেটা একটি নির্দিষ্ট তত্ত্ব বা পূর্বাভাসের সাথে সামঞ্জস্যপূর্ণ কিনা।

ফর্মুলা:

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

এখানে:

  • OiO_i = প্রত্যাশিত ফ্রিকোয়েন্সি
  • EiE_i = পর্যবেক্ষিত (Observed) ফ্রিকোয়েন্সি
  • χ2\chi^2 = Chi-square মান

ধাপসমূহ:

  1. Null Hypothesis (H₀): "ডেটার মধ্যে কোন পার্থক্য নেই, প্রত্যাশিত বণ্টন সঠিক।"
  2. Alternative Hypothesis (H₁): "ডেটার মধ্যে পার্থক্য রয়েছে, প্রত্যাশিত বণ্টন সঠিক নয়।"
  3. Chi-square Statistic গণনা করুন: উপরের ফর্মুলা অনুসারে χ² হিসাব করুন।
  4. Degree of Freedom (df): df=k1df = k - 1, যেখানে kk হল শ্রেণীর সংখ্যা।
  5. Critical Value নির্বাচন করুন: নির্ধারিত সিগনিফিকেন্স লেভেল (α\alpha) এবং dfdf এর উপর ভিত্তি করে Chi-square টেবিল থেকে critical value বের করুন।
  6. χ² এর মান তুলনা করুন: যদি গণনা করা χ² টেবিল থেকে পাওয়া critical value-এর চেয়ে বেশি হয়, তবে null hypothesis অস্বীকার করুন।

উদাহরণ:

একটি পণ্যকে তিনটি ভিন্ন রঙে বাজারজাত করা হয়েছে: লাল, নীল, এবং সবুজ। আপনি 100টি পণ্য বিক্রি করেছেন এবং জানতে চান যে, রঙের বণ্টন সমানভাবে হয়েছে কিনা (যেমন প্রত্যাশিত 33.33% রঙের প্রতি)। এখন আপনি রঙগুলির প্রাপ্ত ফ্রিকোয়েন্সি ব্যবহার করে Chi-square Goodness of Fit Test ব্যবহার করবেন।


২. Chi-square Test of Independence (স্বাধীনতার পরীক্ষা)

Chi-square Test of Independence ব্যবহৃত হয় দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বা নির্ভরতা পরীক্ষা করতে। এটি পরীক্ষা করে যে, দুটি ক্যাটেগোরিকাল ভেরিয়েবল একে অপরের উপর নির্ভরশীল কিনা।

ফর্মুলা:

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

এখানে:

  • OiO_i = পর্যবেক্ষিত ফ্রিকোয়েন্সি
  • EiE_i = প্রত্যাশিত ফ্রিকোয়েন্সি
  • χ2\chi^2 = Chi-square মান

ধাপসমূহ:

  1. Null Hypothesis (H₀): "দুটি ভেরিয়েবল একে অপরের উপর নির্ভরশীল নয় (স্বাধীন)।"
  2. Alternative Hypothesis (H₁): "দুটি ভেরিয়েবল একে অপরের উপর নির্ভরশীল।"
  3. Chi-square Statistic গণনা করুন: উপরের ফর্মুলা অনুসারে χ² হিসাব করুন।
  4. Degree of Freedom (df): df=(r1)(c1)df = (r - 1)(c - 1), যেখানে rr হল সারির সংখ্যা এবং cc হল কলামের সংখ্যা।
  5. Critical Value নির্বাচন করুন: নির্ধারিত সিগনিফিকেন্স লেভেল (α\alpha) এবং dfdf এর উপর ভিত্তি করে critical value বের করুন।
  6. χ² এর মান তুলনা করুন: যদি গণনা করা χ² critical value এর চেয়ে বেশি হয়, তবে null hypothesis অস্বীকার করুন।

উদাহরণ:

একটি দোকানে দুটি ভিন্ন ধরনের পণ্য বিক্রি হচ্ছে: পণ্য A এবং পণ্য B। আপনি জানতে চান যে, পণ্য কেনার জন্য পুরুষ এবং মহিলাদের মধ্যে কোনো পার্থক্য রয়েছে কিনা। এখানে, পুরুষ এবং মহিলার মধ্যে পণ্য নির্বাচন স্বাধীন কিনা তা যাচাই করতে Chi-square Test of Independence ব্যবহার করবেন।


Chi-square Test এর মাধ্যমে Hypothesis Testing এর উদাহরণ

ধরুন, আপনি একটি পরীক্ষায় তিনটি শ্রেণী: A, B, এবং C এর মধ্যে ছাত্রদের শ্রেণি ভাগের উপর একটি পরিসংখ্যান পরিচালনা করছেন।

  • Null Hypothesis (H₀): শ্রেণীভাগ সমানভাবে বিতরণ হয়েছে (অর্থাৎ, ছাত্রদের মধ্যে শ্রেণী A, B, এবং C এর মধ্যে সমানভাবে ভাগ হয়েছে)।
  • Alternative Hypothesis (H₁): শ্রেণীভাগ সমানভাবে বিতরণ হয়নি (অর্থাৎ, ছাত্রদের মধ্যে শ্রেণী A, B, এবং C এর মধ্যে সমানভাবে ভাগ হয়নি)।

আপনি পর্যবেক্ষিত ডেটা অনুযায়ী Chi-square Test প্রয়োগ করবেন। এখানে:

  • Expected Frequency (প্রত্যাশিত ফ্রিকোয়েন্সি) এর জন্য, আপনি Total Students / Number of Categories ব্যবহার করবেন।
  • তারপর Chi-square statistic ব্যবহার করে পরীক্ষা করবেন যে, পর্যবেক্ষিত ফ্রিকোয়েন্সি এবং প্রত্যাশিত ফ্রিকোয়েন্সির মধ্যে পার্থক্য উল্লেখযোগ্য কিনা।

সারাংশ

Chi-square Test একটি শক্তিশালী পরিসংখ্যানিক পদ্ধতি যা বিভিন্ন ধরনের হাইপোথিসিস পরীক্ষা করার জন্য ব্যবহৃত হয়, বিশেষ করে ক্যাটেগোরিকাল ডেটার ক্ষেত্রে। এটি Goodness of Fit Test (ফিটনেস পরীক্ষা) এবং Test of Independence (স্বাধীনতার পরীক্ষা) হিসেবে দুটি প্রধানভাবে ব্যবহৃত হয়। Chi-square Test এর মাধ্যমে আমরা দুটি ভেরিয়েবলের মধ্যে সম্পর্ক বা একটি বণ্টনের সঠিকতা পরীক্ষা করতে পারি। Chi-square statistic নির্ধারণ করে, আমরা একটি নির্দিষ্ট critical value এর সাথে তুলনা করে হাইপোথিসিস গ্রহণ বা অস্বীকার করতে পারি।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...