Analysis of Variance (ANOVA) হল একটি পরিসংখ্যানগত পদ্ধতি যা একাধিক গ্রুপের মধ্যে গড়ের পার্থক্য পরীক্ষা করতে ব্যবহৃত হয়। ANOVA পরীক্ষার মাধ্যমে আপনি নির্ধারণ করতে পারেন যে বিভিন্ন গ্রুপের মধ্যে গড়ের পার্থক্য পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ কিনা। SAS-এ PROC ANOVA এই পরিসংখ্যানগত পরীক্ষাটি সম্পাদন করার জন্য ব্যবহৃত হয়।
PROC ANOVA সাধারণত একটি একক ভেরিয়েবলের (one-way ANOVA) এবং একাধিক ভেরিয়েবলের (two-way ANOVA) মধ্যে গড়ের পার্থক্য পরীক্ষা করার জন্য ব্যবহৃত হয়।
PROC ANOVA এর গঠন
PROC ANOVA এর সাধারণ সিনট্যাক্স:
PROC ANOVA DATA=dataset;
CLASS categorical_variable;
MODEL dependent_variable = categorical_variable;
MEANS categorical_variable / TUKEY;
RUN;
এখানে:
- DATA=dataset: ডেটাসেট যা আপনি বিশ্লেষণ করতে চান।
- CLASS categorical_variable: যে ক্যাটাগরিক্যাল ভেরিয়েবলটি আপনি গ্রুপ হিসেবে ব্যবহার করবেন।
- MODEL dependent_variable = categorical_variable: নির্ভরশীল ভেরিয়েবল এবং ক্যাটাগরিক্যাল ভেরিয়েবলের মধ্যে সম্পর্ক নির্ধারণ করা।
- MEANS categorical_variable: গড়ের তুলনা এবং বিভিন্ন গ্রুপের মধ্যে গড়ের পার্থক্য পরীক্ষা করা।
- TUKEY: গ্রুপগুলির মধ্যে গড়ের তুলনা করতে Tukey's HSD (Honestly Significant Difference) টেস্ট চালানো।
১. One-Way ANOVA Example (একক ভেরিয়েবলের মাধ্যমে ANOVA)
ধরা যাক, আমরা জানি কিছু ভিন্ন ধরনের প্রশিক্ষণ পদ্ধতির (Training Method) পারফরম্যান্স (Exam Scores) উপর কী ধরনের প্রভাব পড়েছে। এখানে, Training Method একটি ক্যাটাগরিক্যাল ভেরিয়েবল এবং Exam Score একটি নির্ভরশীল ভেরিয়েবল হিসেবে কাজ করবে।
উদাহরণ: One-Way ANOVA
data exam_scores;
input Method $ Score;
datalines;
A 80
A 85
A 88
B 90
B 92
B 95
C 78
C 81
C 85
;
run;
PROC ANOVA DATA=exam_scores;
CLASS Method;
MODEL Score = Method;
MEANS Method / TUKEY;
RUN;
এখানে:
Methodহল ক্যাটাগরিক্যাল ভেরিয়েবল (Training Method) যা তিনটি গ্রুপ (A, B, C) এ বিভক্ত।Scoreহল নির্ভরশীল ভেরিয়েবল (Exam Scores) যা ANOVA পরীক্ষা করা হবে।MEANS Method / TUKEY;কমান্ডটি গ্রুপগুলির মধ্যে গড়ের পার্থক্য নির্ধারণ করার জন্য Tukey's HSD টেস্ট ব্যবহার করবে।
আউটপুট:
- ANOVA Table: গড়ের পার্থক্য পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ কিনা তা জানাবে।
- Tukey's HSD: গড়ের তুলনা করে দেখাবে কোন দুটি গ্রুপের মধ্যে পার্থক্য রয়েছে।
২. Two-Way ANOVA Example (দ্বৈত ভেরিয়েবলের মাধ্যমে ANOVA)
Two-way ANOVA দুটি স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ক এবং তাদের পারস্পরিক প্রভাব পরীক্ষা করে। ধরুন, একটি ডেটাসেটে প্রশিক্ষণ পদ্ধতি (Training Method) এবং ছাত্রদের লিঙ্গ (Gender) দুটি ভেরিয়েবল আছে, এবং আমরা জানতে চাই, এই দুটি ভেরিয়েবল একে অপরের সাথে মিলিতভাবে পরীক্ষার ফলাফলে (Exam Score) কী প্রভাব ফেলছে।
উদাহরণ: Two-Way ANOVA
data exam_scores;
input Method $ Gender $ Score;
datalines;
A M 80
A F 85
A M 88
B M 90
B F 92
B M 95
C F 78
C M 81
C F 85
;
run;
PROC ANOVA DATA=exam_scores;
CLASS Method Gender;
MODEL Score = Method|Gender;
MEANS Method Gender / TUKEY;
RUN;
এখানে:
MethodএবংGenderদুটি ক্যাটাগরিক্যাল ভেরিয়েবল হিসেবে কাজ করছে।Scoreহল নির্ভরশীল ভেরিয়েবল (Exam Scores) যা আমরা পরীক্ষা করছি।MODEL Score = Method|Gender;দ্বারা আমরা দুটি ভেরিয়েবল এবং তাদের মধ্যে ইন্টারঅ্যাকশন পরীক্ষা করছি।MEANS Method Gender / TUKEY;কমান্ডটি দুইটি ভেরিয়েবলের গড়ের তুলনা করবে।
আউটপুট:
- Main Effects:
MethodএবংGenderএর আলাদা আলাদা প্রভাব দেখাবে। - Interaction Effects:
MethodএবংGenderএর মধ্যে পারস্পরিক প্রভাব পর্যালোচনা করবে। - Tukey's HSD: গ্রুপগুলোর মধ্যে গড়ের পার্থক্য দেখাবে।
৩. Post-Hoc Test
Post-hoc পরীক্ষা (যেমন Tukey, Bonferroni) ANOVA এর পরে ব্যবহৃত হয়, যেখানে একাধিক গ্রুপের মধ্যে গড়ের তুলনা করা হয়। SAS-এ Tukey's HSD একটি জনপ্রিয় post-hoc পরীক্ষা যা একে অপরের মধ্যে গড়ের পার্থক্য পরিমাপ করতে সাহায্য করে।
উদাহরণ: Post-Hoc Test (Tukey)
PROC ANOVA DATA=exam_scores;
CLASS Method;
MODEL Score = Method;
MEANS Method / TUKEY; /* Tukey's HSD Test */
RUN;
এখানে:
- Tukey's HSD Test ব্যবহার করা হচ্ছে গ্রুপগুলোর মধ্যে গড়ের পার্থক্য যাচাই করার জন্য।
সারাংশ
PROC ANOVA ব্যবহার করে আপনি Analysis of Variance (ANOVA) পরীক্ষা করতে পারেন, যা গ্রুপগুলির মধ্যে গড়ের পার্থক্য পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ কিনা তা যাচাই করে। SAS-এ ANOVA পরীক্ষার মাধ্যমে আপনি একক ভেরিয়েবল (One-Way ANOVA) এবং একাধিক ভেরিয়েবলের (Two-Way ANOVA) মধ্যে সম্পর্ক এবং তাদের পারস্পরিক প্রভাব পরীক্ষা করতে পারেন। Tukey's HSD সহ post-hoc টেস্টের মাধ্যমে আপনি গ্রুপগুলির মধ্যে গড়ের তুলনা করতে পারেন। ANOVA একটি অত্যন্ত গুরুত্বপূর্ণ পরিসংখ্যানগত টেস্ট যা বিভিন্ন বৈজ্ঞানিক গবেষণা, ব্যবসায়িক বিশ্লেষণ, এবং অন্যান্য ক্ষেত্রগুলিতে ব্যাপকভাবে ব্যবহৃত হয়।
Read more