PROC MEANS এবং PROC UNIVARIATE এর মাধ্যমে Basic Statistics

SAS Statistical Procedures - স্যাস (SAS) - Big Data and Analytics

368

SAS-এ PROC MEANS এবং PROC UNIVARIATE দুটি অত্যন্ত জনপ্রিয় প্রোসিডিউর (procedure) যা ডেটার মৌলিক পরিসংখ্যান (Basic Statistics) হিসাব করতে ব্যবহৃত হয়। এগুলি পরিসংখ্যানগত বিশ্লেষণ করতে সহায়তা করে যেমন গড়, স্ট্যান্ডার্ড ডেভিয়েশন, মিনিমাম, ম্যাক্সিমাম, মিডিয়ান, শার্পল প্রমাণীকরণ এবং অন্যান্য পরিসংখ্যান।

এই প্রসিডিউরগুলির মাধ্যমে ডেটার বৈশিষ্ট্যগুলি বের করা সহজ এবং দ্রুত হয়ে যায়।


১. PROC MEANS: মৌলিক পরিসংখ্যান হিসাব করা

PROC MEANS ফাংশনটি একাধিক পরিসংখ্যান বের করতে ব্যবহৃত হয়, যেমন গড় (Mean), সর্বনিম্ন (Min), সর্বাধিক (Max), স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation), কুইন্টাইল (Quantiles) ইত্যাদি।

গঠন:

PROC MEANS DATA=dataset_name <options>;
   VAR variable_name;
RUN;

এখানে:

  • DATA=dataset_name: ডেটাসেটের নাম, যেটি থেকে পরিসংখ্যান বের করতে হবে।
  • VAR variable_name: যেই ভেরিয়েবলটির পরিসংখ্যান বের করতে হবে, সেটি।

উদাহরণ: PROC MEANS ব্যবহার

PROC MEANS DATA=work.sales;
   VAR revenue age salary;
RUN;

এখানে:

  • revenue, age, এবং salary ভেরিয়েবলের গড়, স্ট্যান্ডার্ড ডেভিয়েশন, মিনিমাম, ম্যাক্সিমাম, এবং অন্যান্য পরিসংখ্যান বের করা হবে।

অপশন: PROC MEANS এর অপশন ব্যবহার

PROC MEANS বিভিন্ন অপশন দিয়ে আরো বিশেষভাবে পরিসংখ্যান বের করতে সহায়তা করে।

১. N - রেকর্ডের সংখ্যা বের করা

PROC MEANS DATA=work.sales N;
   VAR salary;
RUN;

এখানে, N অপশনটি salary ভেরিয়েবলের রেকর্ডের সংখ্যা (যতটি পরিসংখ্যান আছে) বের করবে।

২. MIN, MAX, MEAN, STD - নির্দিষ্ট পরিসংখ্যান বের করা

PROC MEANS DATA=work.sales MIN MAX MEAN STD;
   VAR salary;
RUN;

এখানে:

  • MIN: সর্বনিম্ন মান।
  • MAX: সর্বোচ্চ মান।
  • MEAN: গড়।
  • STD: স্ট্যান্ডার্ড ডেভিয়েশন।

২. PROC UNIVARIATE: আরও গভীর পরিসংখ্যান বিশ্লেষণ

PROC UNIVARIATE ফাংশনটি আরো গভীর পরিসংখ্যান বিশ্লেষণের জন্য ব্যবহৃত হয়। এটি ডেটার স্বাভাবিকতা (Normality), মিডিয়ান, কিউটাইল, শার্পল টেস্ট এবং আরও অনেক পরিসংখ্যান বের করতে ব্যবহৃত হয়।

গঠন:

PROC UNIVARIATE DATA=dataset_name;
   VAR variable_name;
RUN;

এখানে:

  • DATA=dataset_name: ডেটাসেটের নাম।
  • VAR variable_name: যেই ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে।

উদাহরণ: PROC UNIVARIATE ব্যবহার

PROC UNIVARIATE DATA=work.sales;
   VAR revenue;
RUN;

এখানে:

  • revenue ভেরিয়েবলের জন্য বিভিন্ন পরিসংখ্যান যেমন গড়, মিডিয়ান, কুইন্টাইল, এবং স্বাভাবিকতা টেস্ট (Normality Test) বের করা হবে।

PROC UNIVARIATE এর বিশ্লেষণ

PROC UNIVARIATE এর মাধ্যমে আপনি বিভিন্ন পরিসংখ্যান এবং টেস্ট বের করতে পারেন:

১. স্বাভাবিকতা টেস্ট (Normality Test)

PROC UNIVARIATE DATA=work.sales NORMAL;
   VAR revenue;
RUN;

এখানে:

  • NORMAL অপশনটি ডেটার স্বাভাবিকতা পরীক্ষা করবে (যেমন শার্পল-ভিলকসন টেস্ট, Anderson-Darling Test)।

২. কিউটাইল এবং মিডিয়ান

PROC UNIVARIATE DATA=work.sales;
   VAR revenue;
   OUTPUT OUT=stats PCTLPTS=25 50 75 PCTLPRE=Q;
RUN;

এখানে:

  • PCTLPTS=25 50 75: ২৫%, ৫০%, এবং ৭৫% কিউটাইল (Quintiles) বের করা হচ্ছে।
  • PCTLPRE=Q: কিউটাইলের জন্য পূর্বনির্ধারিত মান (Q25, Q50, Q75) আউটপুট ফাইলে সংরক্ষণ করা হবে।

সারাংশ

SAS-এ PROC MEANS এবং PROC UNIVARIATE দুটি অত্যন্ত গুরুত্বপূর্ণ প্রসিডিউর যা মৌলিক পরিসংখ্যান বের করতে ব্যবহৃত হয়:

  • PROC MEANS সাধারণত গড়, স্ট্যান্ডার্ড ডেভিয়েশন, মিনিমাম, ম্যাক্সিমাম, ইত্যাদি পরিসংখ্যান বের করার জন্য ব্যবহৃত হয়।
  • PROC UNIVARIATE আরও গভীর পরিসংখ্যান বিশ্লেষণ করতে ব্যবহৃত হয়, যেমন স্বাভাবিকতা টেস্ট, মিডিয়ান, কিউটাইল, এবং আরও অনেক পরিসংখ্যান।

এই দুটি প্রসিডিউর ব্যবহার করে আপনি ডেটার বৈশিষ্ট্যগুলি সহজে বিশ্লেষণ করতে পারবেন এবং পরবর্তী বিশ্লেষণের জন্য উপযোগী তথ্য পেতে সহায়তা করবে।

Content added By
Promotion

Are you sure to start over?

Loading...