SAS-এ PROC SORT, PROC MEANS, এবং PROC FREQ তিনটি অত্যন্ত গুরুত্বপূর্ণ প্রসিডিউর (procedure) যা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণে ব্যাপকভাবে ব্যবহৃত হয়। এগুলো ডেটার অর্ডারিং, পরিসংখ্যানগত বিশ্লেষণ এবং ফ্রিকোয়েন্সি টেবিল তৈরি করার জন্য ব্যবহৃত হয়।
PROC SORT: ডেটা সাজানো
PROC SORT ব্যবহার করে আপনি একটি ডেটাসেটের রেকর্ডগুলো নির্দিষ্ট ভেরিয়েবলের ভিত্তিতে সাজাতে পারেন। এটি একটি শক্তিশালী টুল, যার মাধ্যমে ডেটা সাজানো সহজ এবং দ্রুত হয়।
ব্যবহার:
- SORT: ডেটাসেটের ভেরিয়েবল(s) অনুযায়ী সাজানো হয়।
- BY: কোন ভেরিয়েবল(s) দ্বারা ডেটা সাজানো হবে তা নির্দিষ্ট করা হয়।
উদাহরণ: ডেটা সাজানো
PROC SORT DATA=work.sales;
BY Revenue; /* Revenue ভেরিয়েবল অনুযায়ী ডেটা সাজানো */
RUN;
এখানে:
work.salesডেটাসেটটিRevenueভেরিয়েবলের ভিত্তিতে সোর্ট করা হয়েছে।BYক্লজ ব্যবহার করে সজ্জার নির্দেশনা দেওয়া হয়।
DESCENDING ব্যবহার:
ডেটা সাজানোর জন্য আপনি DESCENDING কিওয়ার্ড ব্যবহার করে সোজা থেকে উল্টো বা উল্টো থেকে সোজা সাজাতে পারেন।
PROC SORT DATA=work.sales;
BY DESCENDING Revenue; /* Revenue অনুযায়ী উল্টো সাজানো */
RUN;
এখানে:
DESCENDINGদ্বারা ডেটা উল্টো অর্ডারে সাজানো হবে (সবচেয়ে বড় মান আগে আসবে)।
PROC MEANS: পরিসংখ্যানগত বিশ্লেষণ
PROC MEANS একটি পরিসংখ্যানগত প্রসিডিউর যা ডেটাসেটের নির্দিষ্ট ভেরিয়েবলের জন্য গড়, স্ট্যান্ডার্ড ডিভিয়েশন, মিনিমাম, ম্যাক্সিমাম, মিডিয়ান, ইত্যাদি পরিসংখ্যান প্রদান করে।
ব্যবহার:
- VAR: কোন ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে তা নির্দিষ্ট করা হয়।
- N, MEAN, STD, MIN, MAX: পরিসংখ্যানের ধরন নির্দিষ্ট করা হয়।
উদাহরণ: পরিসংখ্যান বিশ্লেষণ
PROC MEANS DATA=work.sales N MEAN STD MIN MAX;
VAR Revenue Age; /* Revenue এবং Age ভেরিয়েবলের জন্য পরিসংখ্যান */
RUN;
এখানে:
Nদ্বারা মোট রেকর্ডের সংখ্যা,MEANদ্বারা গড়,STDদ্বারা স্ট্যান্ডার্ড ডিভিয়েশন,MINএবংMAXদ্বারা সর্বনিম্ন এবং সর্বাধিক মান বের করা হবে।VARস্টেটমেন্টে যেসব ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে তা উল্লেখ করা হয়েছে।
এক্সট্রা অপশন:
- CLASS: ক্যাটাগরিক্যাল ভেরিয়েবলের জন্য পরিসংখ্যান।
PROC MEANS DATA=work.sales N MEAN;
VAR Revenue;
CLASS Region; /* Region অনুযায়ী পরিসংখ্যান */
RUN;
এখানে:
CLASS Regionব্যবহার করা হয়েছে, যার মাধ্যমেRegionভেরিয়েবলের জন্য আলাদা আলাদা পরিসংখ্যান বের করা হবে।
PROC FREQ: ফ্রিকোয়েন্সি টেবিল তৈরি
PROC FREQ একটি পরিসংখ্যানগত প্রসিডিউর যা একটি ডেটাসেটের ক্যাটাগোরিক্যাল ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করে। এটি ডেটার মধ্যে প্রতিটি মানের কতবার ঘটেছে তা প্রদর্শন করে।
ব্যবহার:
- TABLES: কোন ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করা হবে তা নির্দিষ্ট করা হয়।
- ORDER: ফ্রিকোয়েন্সি টেবিল সাজানোর পদ্ধতি নির্দিষ্ট করা হয়।
উদাহরণ: ফ্রিকোয়েন্সি টেবিল তৈরি
PROC FREQ DATA=work.sales;
TABLES Region Gender; /* Region এবং Gender ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি */
RUN;
এখানে:
TABLESস্টেটমেন্ট ব্যবহার করেRegionএবংGenderভেরিয়েবলগুলোর ফ্রিকোয়েন্সি টেবিল তৈরি করা হয়েছে।
অপশন: ফ্রিকোয়েন্সি প্রিন্ট করতে
- ORDER=FREQ: ফ্রিকোয়েন্সি অনুসারে সাজানোর জন্য।
PROC FREQ DATA=work.sales ORDER=FREQ;
TABLES Region;
RUN;
এখানে:
ORDER=FREQফ্রিকোয়েন্সির ভিত্তিতে ভেরিয়েবলটি সাজাবে।
সারাংশ
- PROC SORT: ডেটাসেট সজ্জার জন্য ব্যবহৃত হয়, যা ভেরিয়েবলের ভিত্তিতে ডেটাকে সাজায় (আলফাবেটিক বা ন্যূনতম থেকে সর্বাধিক বা তার উল্টোও হতে পারে)।
- PROC MEANS: পরিসংখ্যানগত বিশ্লেষণের জন্য ব্যবহৃত হয়, যেমন গড়, স্ট্যান্ডার্ড ডিভিয়েশন, সর্বনিম্ন এবং সর্বাধিক মান।
- PROC FREQ: ক্যাটাগরিক্যাল ডেটার জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করে, যা দেখায় কতবার একটি নির্দিষ্ট মান ঘটেছে।
এই তিনটি প্রসিডিউর ডেটা বিশ্লেষণে অত্যন্ত গুরুত্বপূর্ণ ভূমিকা পালন করে এবং ডেটার উপর বিভিন্ন ধরনের পরিসংখ্যানগত ও বিশ্লেষণাত্মক কাজ করতে সহায়তা করে।
Read more