SAS-এ PROC SUMMARY এবং PROC TABULATE দুটি গুরুত্বপূর্ণ প্রক্রিয়া (procedure) যা ডেটার সারাংশ এবং পরিসংখ্যানিক বিশ্লেষণ তৈরি করার জন্য ব্যবহৃত হয়। এই দুটি প্রক্রিয়া মূলত summary statistics তৈরির জন্য ব্যবহৃত হয়, যেমন গড় (mean), স্ট্যান্ডার্ড ডেভিয়েশন (standard deviation), সর্বোচ্চ (maximum), সর্বনিম্ন (minimum) এবং অন্যান্য পরিসংখ্যানিক মান।
PROC SUMMARY
PROC SUMMARY একটি শক্তিশালী প্রক্রিয়া যা ডেটার বিভিন্ন পরিসংখ্যানিক সারাংশ তৈরি করে। এটি মূলত গ্রুপিং এবং অ্যাগ্রিগেটিং (aggregating) তথ্যের জন্য ব্যবহৃত হয়, যেমন গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন বের করা।
PROC SUMMARY এর ব্যবহার
PROC SUMMARY সাধারণত ডেটা সেটকে গ্রুপ করে, তারপর বিভিন্ন পরিসংখ্যান বের করার জন্য ব্যবহার হয়। এটি OUTPUT স্টেটমেন্টের মাধ্যমে আউটপুট ডেটাসেট তৈরি করতে পারে।
উদাহরণ:
proc summary data=work.sales nway;
class region;
var sales_amount;
output out=work.sales_summary mean= mean_sales min= min_sales max= max_sales std= std_sales;
run;
proc print data=work.sales_summary;
run;
এখানে:
class region;: এখানেregionভেরিয়েবলটি ব্যবহার করে ডেটাকে গ্রুপ করা হয়েছে।var sales_amount;: এখানেsales_amountভেরিয়েবলটি উপর বিভিন্ন পরিসংখ্যান বের করা হচ্ছে।output out=work.sales_summary;: এখানে আউটপুট ডেটাসেটwork.sales_summaryতৈরি করা হচ্ছে, যা গড়, সর্বনিম্ন, সর্বোচ্চ, এবং স্ট্যান্ডার্ড ডেভিয়েশন ধারণ করবে।nway:nwayঅপশনটি শুধুমাত্র সেই রেকর্ডগুলো রাখে যেগুলোর সমস্ত শ্রেণী (class) পরিপূর্ণ।
এটি আউটপুটে একটি সারণী তৈরি করবে যার মধ্যে প্রতিটি অঞ্চলের জন্য গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন থাকবে।
PROC SUMMARY এর অন্যান্য অপশন:
mean=: গড় বের করতে।min=: সর্বনিম্ন মান বের করতে।max=: সর্বোচ্চ মান বের করতে।std=: স্ট্যান্ডার্ড ডেভিয়েশন বের করতে।
PROC TABULATE
PROC TABULATE একটি উন্নত পদ্ধতি যা সুন্দর এবং সংগঠিত টেবিল তৈরি করার জন্য ব্যবহৃত হয়। এটি পরিসংখ্যানের পাশাপাশি বিভিন্ন কাস্টমাইজড টেবিল তৈরি করতে সাহায্য করে। PROC TABULATE সাধারণত ডেটার সামগ্রিক সারাংশ তৈরি করতে ব্যবহৃত হয় এবং এটি একটি বিশদ এবং পরিষ্কার রিপোর্ট তৈরি করতে সক্ষম।
PROC TABULATE এর ব্যবহার
PROC TABULATE আপনাকে ডেটার মধ্যে শ্রেণীভুক্ত (classified) তথ্য দেখাতে সহায়তা করে। এটি ডেটার পরিসংখ্যানিক সারাংশ একটি টেবিল আকারে প্রদান করে।
উদাহরণ:
proc tabulate data=work.sales;
class region;
var sales_amount;
table region, sales_amount*(mean min max std);
run;
এখানে:
class region;:regionভেরিয়েবলটি ব্যবহার করে ডেটাকে শ্রেণীভুক্ত করা হচ্ছে।var sales_amount;:sales_amountভেরিয়েবলটির গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন বের করা হচ্ছে।table region, sales_amount*(mean min max std);: এটি একটি টেবিল তৈরি করবে যেখানেregionএর জন্য গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন প্রদর্শিত হবে।
এটি একটি টেবিল তৈরি করবে যেখানে প্রতিটি অঞ্চলের জন্য বিভিন্ন পরিসংখ্যান যেমন গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন থাকবে।
PROC TABULATE এর অন্যান্য অপশন:
table: এই অপশনে আপনি কীভাবে টেবিল সাজাতে চান তা উল্লেখ করতে পারেন।mean,min,max,std: এই অপশনগুলো ডেটার বিভিন্ন পরিসংখ্যান নির্ধারণ করতে ব্যবহৃত হয়।
PROC SUMMARY এবং PROC TABULATE এর তুলনা
| বৈশিষ্ট্য | PROC SUMMARY | PROC TABULATE |
|---|---|---|
| মূল উদ্দেশ্য | পরিসংখ্যানগত সারাংশ তৈরি, গ্রুপিং এবং অ্যাগ্রিগেটিং | সুন্দর টেবিল আকারে সারাংশ তৈরি, ডেটার বিশ্লেষণ |
| প্রকাশিত আউটপুট | ডেটাসেট আউটপুট | টেবিল আউটপুট |
| ব্যবহার | সাধারণ পরিসংখ্যান যেমন গড়, স্ট্যান্ডার্ড ডেভিয়েশন বের করা | কাস্টমাইজড রিপোর্ট তৈরি, পরিসংখ্যান টেবিল তৈরি |
| প্রধান বৈশিষ্ট্য | গ্রুপিং, আউটপুট ডেটাসেট তৈরি, নেস্টেড ফলাফল | স্পষ্ট এবং বিশদ টেবিল, সহজে পাঠযোগ্য আউটপুট |
উপসংহার
PROC SUMMARY এবং PROC TABULATE উভয়ই ডেটা বিশ্লেষণের জন্য গুরুত্বপূর্ণ প্রক্রিয়া। PROC SUMMARY সাধারণত পরিসংখ্যানগত সারাংশ তৈরি করতে ব্যবহৃত হয়, যেখানে আপনি ডেটাসেটের গড়, সর্বনিম্ন, সর্বোচ্চ, এবং স্ট্যান্ডার্ড ডেভিয়েশন বের করতে পারেন। অন্যদিকে, PROC TABULATE ডেটার উপর সুন্দর টেবিল তৈরি করতে ব্যবহৃত হয় যা পরিসংখ্যানিক বিশ্লেষণ এবং অন্যান্য তথ্য প্রদান করে। উভয় প্রক্রিয়া নির্দিষ্ট কাজের জন্য অত্যন্ত কার্যকরী, এবং এগুলো আপনার ডেটা বিশ্লেষণকে আরও প্রাঞ্জল এবং সহজবোধ্য করতে সাহায্য করে।
Read more