SAS (Statistical Analysis System) প্রোগ্রামিংয়ে PROC Step একটি অত্যন্ত গুরুত্বপূর্ণ অংশ। PROC (Procedure) স্টেপ ব্যবহার করে ডেটা বিশ্লেষণ, পরিসংখ্যানগত বিশ্লেষণ, রিপোর্টিং এবং ডেটা ভিজ্যুয়ালাইজেশন করা হয়। প্রতিটি PROC স্টেপ একটি নির্দিষ্ট ধরনের কার্যক্রম সম্পাদন করে এবং SAS প্রোগ্রামের কার্যকারিতা বাড়ায়।
এখানে আমরা PROC Step এবং কিছু Basic Procedures নিয়ে আলোচনা করব।
PROC Step (Procedure Step)
SAS-এ PROC Step ব্যবহার করা হয় বিভিন্ন প্রক্রিয়া সম্পাদন করার জন্য, যেমন ডেটা বিশ্লেষণ, গ্রাফ তৈরি, পরিসংখ্যানগত বিশ্লেষণ করা এবং রিপোর্ট তৈরি করা। সাধারণত একটি PROC Step শুরু হয় PROC শব্দ দিয়ে এবং এর পরবর্তী অংশে সংশ্লিষ্ট প্রক্রিয়ার নাম থাকে।
PROC Step এর গঠন
PROC <procedure_name> <options>;
<statement>;
RUN;
এখানে:
<procedure_name>: এটি সেই বিশেষ PROC এর নাম যা আপনি ব্যবহার করতে চান, যেমনPROC PRINT,PROC MEANS,PROC FREQইত্যাদি।<options>: বিভিন্ন অপশন যেগুলি প্রক্রিয়ার জন্য নির্দিষ্ট সেটিংস নির্ধারণ করে।<statement>: প্রক্রিয়াতে ব্যবহৃত স্টেটমেন্টগুলি, যেমন কোন ভেরিয়েবল বিশ্লেষণ করতে হবে বা রিপোর্ট তৈরি করতে হবে।
Basic Procedures (মৌলিক প্রক্রিয়া)
SAS-এ বেশ কিছু সাধারণ PROC স্টেপ রয়েছে যা ব্যবহারকারীদের ডেটা বিশ্লেষণ এবং প্রতিবেদন তৈরি করতে সহায়তা করে। নিচে কিছু Basic Procedures সম্পর্কে আলোচনা করা হলো:
১. PROC PRINT
PROC PRINT একটি খুব সাধারণ এবং ব্যবহারযোগ্য PROC, যা একটি ডেটাসেটের সমস্ত বা নির্দিষ্ট অংশ প্রদর্শন করতে ব্যবহৃত হয়।
উদাহরণ:
PROC PRINT DATA=work.student_data;
RUN;
এখানে:
work.student_dataডেটাসেটের সমস্ত রেকর্ড প্রদর্শন করবে।
ব্যবহার:
- ডেটা প্রদর্শন: এটি ডেটাসেটের সারাংশ বা সমস্ত রেকর্ড প্রদর্শন করতে ব্যবহৃত হয়।
২. PROC MEANS
PROC MEANS ব্যবহার করে আপনি ডেটার পরিসংখ্যানগত বিশ্লেষণ করতে পারেন, যেমন গড় (mean), স্ট্যান্ডার্ড ডেভিয়েশন (standard deviation), সর্বনিম্ন (minimum), সর্বোচ্চ (maximum) ইত্যাদি।
উদাহরণ:
PROC MEANS DATA=work.student_data;
VAR age height;
RUN;
এখানে:
VARস্টেটমেন্টটি নির্ধারণ করে যে কোন ভেরিয়েবলগুলোর পরিসংখ্যান বের করতে হবে (যেমনageএবংheightএখানে ব্যবহৃত হয়েছে)।
ব্যবহার:
- গড়, স্ট্যান্ডার্ড ডেভিয়েশন, সর্বনিম্ন, সর্বোচ্চ: ডেটার বৈশিষ্ট্য বের করা।
৩. PROC FREQ
PROC FREQ ব্যবহার করে ক্যাটাগোরিক্যাল ডেটার ফ্রিকোয়েন্সি টেবিল তৈরি করা হয়, যা প্রতিটি ক্যাটাগোরির সংখ্যা এবং শতকরা পরিমাণ প্রদর্শন করে।
উদাহরণ:
PROC FREQ DATA=work.student_data;
TABLES gender;
RUN;
এখানে:
TABLES genderদ্বারাgenderভেরিয়েবলের ফ্রিকোয়েন্সি টেবিল তৈরি করা হবে।
ব্যবহার:
- ফ্রিকোয়েন্সি টেবিল তৈরি: ক্যাটাগোরিক্যাল ডেটার মধ্যে কতগুলি ভিন্ন মান আছে এবং তাদের কতবার পয়েন্ট হয়েছে তা বিশ্লেষণ করতে।
৪. PROC SORT
PROC SORT ব্যবহার করে ডেটা একটি নির্দিষ্ট ভেরিয়েবলের ভিত্তিতে সাজানো হয়। এটি সাধারণত ডেটাকে সাজানোর জন্য ব্যবহৃত হয়।
উদাহরণ:
PROC SORT DATA=work.student_data;
BY age;
RUN;
এখানে:
BY ageদ্বারা ডেটাসেটটিageভেরিয়েবলের ওপর ভিত্তি করে সাজানো হবে।
ব্যবহার:
- ডেটা সাজানো: ডেটাকে নির্দিষ্ট ভেরিয়েবলের উপর ভিত্তি করে উঠানো বা সাজানো।
৫. PROC UNIVARIATE
PROC UNIVARIATE ব্যবহার করা হয় একটি ভেরিয়েবলের পরিসংখ্যানগত বিশ্লেষণ করতে, যেমন স্বাভাবিকতা পরীক্ষা, কিউটাইল, মিডিয়ান ইত্যাদি।
উদাহরণ:
PROC UNIVARIATE DATA=work.student_data;
VAR age height;
RUN;
এখানে:
VARস্টেটমেন্ট ব্যবহার করেageএবংheightভেরিয়েবলের বিশ্লেষণ করা হচ্ছে।
ব্যবহার:
- ডেটার স্বাভাবিকতা পরীক্ষা: কোন ভেরিয়েবলটি স্বাভাবিকভাবে বিতরণ হচ্ছে তা পরীক্ষা করতে।
সারাংশ
SAS-এ PROC Step ব্যবহার করে বিভিন্ন ধরনের বিশ্লেষণ এবং কার্যক্রম সম্পাদন করা হয়। এই PROC স্টেপগুলো ব্যবহার করে ডেটা প্রদর্শন, পরিসংখ্যানগত বিশ্লেষণ, ফ্রিকোয়েন্সি টেবিল তৈরি, ডেটা সাজানো, এবং স্বাভাবিকতা পরীক্ষা করা যেতে পারে। মৌলিক PROC স্টেপগুলো যেমন PROC PRINT, PROC MEANS, PROC FREQ, এবং PROC SORT অত্যন্ত ব্যবহারিক এবং SAS প্রোগ্রামিং-এ কার্যকরীভাবে ব্যবহৃত হয়।
SAS-এ PROC PRINT একটি সাধারণ এবং কার্যকরী প্রক্রিয়া যা ব্যবহারকারীদের ডেটাসেটের তথ্য দ্রুত দেখতে সহায়তা করে। এটি ডেটাসেটের প্রথম কিছু রেকর্ড প্রদর্শন করে, যা ব্যবহারকারীদের ডেটার গঠন এবং কন্টেন্ট সম্পর্কে ধারণা দেয়। এই প্রক্রিয়াটি সাধারণত ডেটা বিশ্লেষণ শুরু করার আগে ডেটার সঠিকতা নিশ্চিত করার জন্য ব্যবহার করা হয়।
PROC PRINT এর ব্যবহার
PROC PRINT কোডটি সঠিকভাবে চালিয়ে আপনি একটি SAS ডেটাসেটের সমস্ত বা নির্দিষ্ট কিছু তথ্য প্রিন্ট করতে পারেন। এটি সাধারণত ডেটাসেটের প্রথম ২০টি রেকর্ড (যদি উল্লেখ না করা হয়) প্রদর্শন করে, তবে আপনি প্রয়োজনমতো সেটিকে কাস্টমাইজ করতে পারেন।
উদাহরণ: PROC PRINT ব্যবহার
ধরা যাক, আপনার একটি ডেটাসেট work.mydata নামে রয়েছে। সেই ডেটাসেটের কিছু তথ্য দেখানোর জন্য আপনি নিম্নলিখিত কোড ব্যবহার করতে পারেন:
proc print data=work.mydata;
run;
এই কোডটি work.mydata ডেটাসেটের সমস্ত রেকর্ড প্রিন্ট করবে।
নির্দিষ্ট ভেরিয়েবল (Columns) প্রদর্শন করা
যদি আপনি শুধুমাত্র কিছু নির্দিষ্ট কলাম (ভেরিয়েবল) প্রদর্শন করতে চান, তাহলে আপনি VAR স্টেটমেন্ট ব্যবহার করতে পারেন। এটি নির্দিষ্ট কলামগুলোকে প্রদর্শন করবে।
উদাহরণ: নির্দিষ্ট কলাম প্রদর্শন
proc print data=work.mydata;
var name age salary;
run;
এই কোডটি work.mydata ডেটাসেট থেকে শুধুমাত্র name, age, এবং salary কলামগুলো প্রদর্শন করবে।
প্রথম কিছু রেকর্ড প্রদর্শন করা
যদি আপনি শুধুমাত্র ডেটাসেটের প্রথম কিছু রেকর্ড দেখতে চান, তাহলে OBS= অপশন ব্যবহার করতে পারেন, যা আপনাকে কতগুলো রেকর্ড দেখতে চান তা নির্দিষ্ট করতে সাহায্য করবে।
উদাহরণ: প্রথম ১০টি রেকর্ড প্রদর্শন
proc print data=work.mydata(obs=10);
run;
এই কোডটি work.mydata ডেটাসেটের প্রথম ১০টি রেকর্ড প্রিন্ট করবে।
শিরোনাম (Title) যোগ করা
PROC PRINT ব্যবহার করার সময় আপনি শিরোনামও যোগ করতে পারেন, যা ডেটা প্রদর্শনকে আরও স্পষ্ট এবং বোঝাপড়ায় সহজ করে তোলে। এটি TITLE স্টেটমেন্টের মাধ্যমে করা হয়।
উদাহরণ: শিরোনাম সহ PROC PRINT
title "Employee Data Preview";
proc print data=work.mydata;
run;
এই কোডটি ডেটাসেটের উপরে "Employee Data Preview" শিরোনামটি যুক্ত করে প্রিন্ট করবে।
সারাংশ
SAS-এ PROC PRINT একটি অত্যন্ত কার্যকরী টুল যা ডেটাসেটের তথ্য প্রদর্শন করতে ব্যবহৃত হয়। এটি ডেটার গঠন এবং কন্টেন্ট দ্রুত যাচাই করতে সহায়তা করে। PROC PRINT ব্যবহার করে আপনি নির্দিষ্ট কলাম, রেকর্ড সংখ্যা এবং শিরোনাম সহ ডেটা প্রিন্ট করতে পারেন, যা বিশ্লেষণের জন্য সহায়ক হতে পারে।
SAS-এ PROC SORT, PROC MEANS, এবং PROC FREQ তিনটি অত্যন্ত গুরুত্বপূর্ণ প্রসিডিউর (procedure) যা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণে ব্যাপকভাবে ব্যবহৃত হয়। এগুলো ডেটার অর্ডারিং, পরিসংখ্যানগত বিশ্লেষণ এবং ফ্রিকোয়েন্সি টেবিল তৈরি করার জন্য ব্যবহৃত হয়।
PROC SORT: ডেটা সাজানো
PROC SORT ব্যবহার করে আপনি একটি ডেটাসেটের রেকর্ডগুলো নির্দিষ্ট ভেরিয়েবলের ভিত্তিতে সাজাতে পারেন। এটি একটি শক্তিশালী টুল, যার মাধ্যমে ডেটা সাজানো সহজ এবং দ্রুত হয়।
ব্যবহার:
- SORT: ডেটাসেটের ভেরিয়েবল(s) অনুযায়ী সাজানো হয়।
- BY: কোন ভেরিয়েবল(s) দ্বারা ডেটা সাজানো হবে তা নির্দিষ্ট করা হয়।
উদাহরণ: ডেটা সাজানো
PROC SORT DATA=work.sales;
BY Revenue; /* Revenue ভেরিয়েবল অনুযায়ী ডেটা সাজানো */
RUN;
এখানে:
work.salesডেটাসেটটিRevenueভেরিয়েবলের ভিত্তিতে সোর্ট করা হয়েছে।BYক্লজ ব্যবহার করে সজ্জার নির্দেশনা দেওয়া হয়।
DESCENDING ব্যবহার:
ডেটা সাজানোর জন্য আপনি DESCENDING কিওয়ার্ড ব্যবহার করে সোজা থেকে উল্টো বা উল্টো থেকে সোজা সাজাতে পারেন।
PROC SORT DATA=work.sales;
BY DESCENDING Revenue; /* Revenue অনুযায়ী উল্টো সাজানো */
RUN;
এখানে:
DESCENDINGদ্বারা ডেটা উল্টো অর্ডারে সাজানো হবে (সবচেয়ে বড় মান আগে আসবে)।
PROC MEANS: পরিসংখ্যানগত বিশ্লেষণ
PROC MEANS একটি পরিসংখ্যানগত প্রসিডিউর যা ডেটাসেটের নির্দিষ্ট ভেরিয়েবলের জন্য গড়, স্ট্যান্ডার্ড ডিভিয়েশন, মিনিমাম, ম্যাক্সিমাম, মিডিয়ান, ইত্যাদি পরিসংখ্যান প্রদান করে।
ব্যবহার:
- VAR: কোন ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে তা নির্দিষ্ট করা হয়।
- N, MEAN, STD, MIN, MAX: পরিসংখ্যানের ধরন নির্দিষ্ট করা হয়।
উদাহরণ: পরিসংখ্যান বিশ্লেষণ
PROC MEANS DATA=work.sales N MEAN STD MIN MAX;
VAR Revenue Age; /* Revenue এবং Age ভেরিয়েবলের জন্য পরিসংখ্যান */
RUN;
এখানে:
Nদ্বারা মোট রেকর্ডের সংখ্যা,MEANদ্বারা গড়,STDদ্বারা স্ট্যান্ডার্ড ডিভিয়েশন,MINএবংMAXদ্বারা সর্বনিম্ন এবং সর্বাধিক মান বের করা হবে।VARস্টেটমেন্টে যেসব ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে তা উল্লেখ করা হয়েছে।
এক্সট্রা অপশন:
- CLASS: ক্যাটাগরিক্যাল ভেরিয়েবলের জন্য পরিসংখ্যান।
PROC MEANS DATA=work.sales N MEAN;
VAR Revenue;
CLASS Region; /* Region অনুযায়ী পরিসংখ্যান */
RUN;
এখানে:
CLASS Regionব্যবহার করা হয়েছে, যার মাধ্যমেRegionভেরিয়েবলের জন্য আলাদা আলাদা পরিসংখ্যান বের করা হবে।
PROC FREQ: ফ্রিকোয়েন্সি টেবিল তৈরি
PROC FREQ একটি পরিসংখ্যানগত প্রসিডিউর যা একটি ডেটাসেটের ক্যাটাগোরিক্যাল ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করে। এটি ডেটার মধ্যে প্রতিটি মানের কতবার ঘটেছে তা প্রদর্শন করে।
ব্যবহার:
- TABLES: কোন ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করা হবে তা নির্দিষ্ট করা হয়।
- ORDER: ফ্রিকোয়েন্সি টেবিল সাজানোর পদ্ধতি নির্দিষ্ট করা হয়।
উদাহরণ: ফ্রিকোয়েন্সি টেবিল তৈরি
PROC FREQ DATA=work.sales;
TABLES Region Gender; /* Region এবং Gender ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি */
RUN;
এখানে:
TABLESস্টেটমেন্ট ব্যবহার করেRegionএবংGenderভেরিয়েবলগুলোর ফ্রিকোয়েন্সি টেবিল তৈরি করা হয়েছে।
অপশন: ফ্রিকোয়েন্সি প্রিন্ট করতে
- ORDER=FREQ: ফ্রিকোয়েন্সি অনুসারে সাজানোর জন্য।
PROC FREQ DATA=work.sales ORDER=FREQ;
TABLES Region;
RUN;
এখানে:
ORDER=FREQফ্রিকোয়েন্সির ভিত্তিতে ভেরিয়েবলটি সাজাবে।
সারাংশ
- PROC SORT: ডেটাসেট সজ্জার জন্য ব্যবহৃত হয়, যা ভেরিয়েবলের ভিত্তিতে ডেটাকে সাজায় (আলফাবেটিক বা ন্যূনতম থেকে সর্বাধিক বা তার উল্টোও হতে পারে)।
- PROC MEANS: পরিসংখ্যানগত বিশ্লেষণের জন্য ব্যবহৃত হয়, যেমন গড়, স্ট্যান্ডার্ড ডিভিয়েশন, সর্বনিম্ন এবং সর্বাধিক মান।
- PROC FREQ: ক্যাটাগরিক্যাল ডেটার জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করে, যা দেখায় কতবার একটি নির্দিষ্ট মান ঘটেছে।
এই তিনটি প্রসিডিউর ডেটা বিশ্লেষণে অত্যন্ত গুরুত্বপূর্ণ ভূমিকা পালন করে এবং ডেটার উপর বিভিন্ন ধরনের পরিসংখ্যানগত ও বিশ্লেষণাত্মক কাজ করতে সহায়তা করে।
SAS-এ PROC SUMMARY এবং PROC TABULATE দুটি গুরুত্বপূর্ণ প্রক্রিয়া (procedure) যা ডেটার সারাংশ এবং পরিসংখ্যানিক বিশ্লেষণ তৈরি করার জন্য ব্যবহৃত হয়। এই দুটি প্রক্রিয়া মূলত summary statistics তৈরির জন্য ব্যবহৃত হয়, যেমন গড় (mean), স্ট্যান্ডার্ড ডেভিয়েশন (standard deviation), সর্বোচ্চ (maximum), সর্বনিম্ন (minimum) এবং অন্যান্য পরিসংখ্যানিক মান।
PROC SUMMARY
PROC SUMMARY একটি শক্তিশালী প্রক্রিয়া যা ডেটার বিভিন্ন পরিসংখ্যানিক সারাংশ তৈরি করে। এটি মূলত গ্রুপিং এবং অ্যাগ্রিগেটিং (aggregating) তথ্যের জন্য ব্যবহৃত হয়, যেমন গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন বের করা।
PROC SUMMARY এর ব্যবহার
PROC SUMMARY সাধারণত ডেটা সেটকে গ্রুপ করে, তারপর বিভিন্ন পরিসংখ্যান বের করার জন্য ব্যবহার হয়। এটি OUTPUT স্টেটমেন্টের মাধ্যমে আউটপুট ডেটাসেট তৈরি করতে পারে।
উদাহরণ:
proc summary data=work.sales nway;
class region;
var sales_amount;
output out=work.sales_summary mean= mean_sales min= min_sales max= max_sales std= std_sales;
run;
proc print data=work.sales_summary;
run;
এখানে:
class region;: এখানেregionভেরিয়েবলটি ব্যবহার করে ডেটাকে গ্রুপ করা হয়েছে।var sales_amount;: এখানেsales_amountভেরিয়েবলটি উপর বিভিন্ন পরিসংখ্যান বের করা হচ্ছে।output out=work.sales_summary;: এখানে আউটপুট ডেটাসেটwork.sales_summaryতৈরি করা হচ্ছে, যা গড়, সর্বনিম্ন, সর্বোচ্চ, এবং স্ট্যান্ডার্ড ডেভিয়েশন ধারণ করবে।nway:nwayঅপশনটি শুধুমাত্র সেই রেকর্ডগুলো রাখে যেগুলোর সমস্ত শ্রেণী (class) পরিপূর্ণ।
এটি আউটপুটে একটি সারণী তৈরি করবে যার মধ্যে প্রতিটি অঞ্চলের জন্য গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন থাকবে।
PROC SUMMARY এর অন্যান্য অপশন:
mean=: গড় বের করতে।min=: সর্বনিম্ন মান বের করতে।max=: সর্বোচ্চ মান বের করতে।std=: স্ট্যান্ডার্ড ডেভিয়েশন বের করতে।
PROC TABULATE
PROC TABULATE একটি উন্নত পদ্ধতি যা সুন্দর এবং সংগঠিত টেবিল তৈরি করার জন্য ব্যবহৃত হয়। এটি পরিসংখ্যানের পাশাপাশি বিভিন্ন কাস্টমাইজড টেবিল তৈরি করতে সাহায্য করে। PROC TABULATE সাধারণত ডেটার সামগ্রিক সারাংশ তৈরি করতে ব্যবহৃত হয় এবং এটি একটি বিশদ এবং পরিষ্কার রিপোর্ট তৈরি করতে সক্ষম।
PROC TABULATE এর ব্যবহার
PROC TABULATE আপনাকে ডেটার মধ্যে শ্রেণীভুক্ত (classified) তথ্য দেখাতে সহায়তা করে। এটি ডেটার পরিসংখ্যানিক সারাংশ একটি টেবিল আকারে প্রদান করে।
উদাহরণ:
proc tabulate data=work.sales;
class region;
var sales_amount;
table region, sales_amount*(mean min max std);
run;
এখানে:
class region;:regionভেরিয়েবলটি ব্যবহার করে ডেটাকে শ্রেণীভুক্ত করা হচ্ছে।var sales_amount;:sales_amountভেরিয়েবলটির গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন বের করা হচ্ছে।table region, sales_amount*(mean min max std);: এটি একটি টেবিল তৈরি করবে যেখানেregionএর জন্য গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন প্রদর্শিত হবে।
এটি একটি টেবিল তৈরি করবে যেখানে প্রতিটি অঞ্চলের জন্য বিভিন্ন পরিসংখ্যান যেমন গড়, সর্বনিম্ন, সর্বোচ্চ এবং স্ট্যান্ডার্ড ডেভিয়েশন থাকবে।
PROC TABULATE এর অন্যান্য অপশন:
table: এই অপশনে আপনি কীভাবে টেবিল সাজাতে চান তা উল্লেখ করতে পারেন।mean,min,max,std: এই অপশনগুলো ডেটার বিভিন্ন পরিসংখ্যান নির্ধারণ করতে ব্যবহৃত হয়।
PROC SUMMARY এবং PROC TABULATE এর তুলনা
| বৈশিষ্ট্য | PROC SUMMARY | PROC TABULATE |
|---|---|---|
| মূল উদ্দেশ্য | পরিসংখ্যানগত সারাংশ তৈরি, গ্রুপিং এবং অ্যাগ্রিগেটিং | সুন্দর টেবিল আকারে সারাংশ তৈরি, ডেটার বিশ্লেষণ |
| প্রকাশিত আউটপুট | ডেটাসেট আউটপুট | টেবিল আউটপুট |
| ব্যবহার | সাধারণ পরিসংখ্যান যেমন গড়, স্ট্যান্ডার্ড ডেভিয়েশন বের করা | কাস্টমাইজড রিপোর্ট তৈরি, পরিসংখ্যান টেবিল তৈরি |
| প্রধান বৈশিষ্ট্য | গ্রুপিং, আউটপুট ডেটাসেট তৈরি, নেস্টেড ফলাফল | স্পষ্ট এবং বিশদ টেবিল, সহজে পাঠযোগ্য আউটপুট |
উপসংহার
PROC SUMMARY এবং PROC TABULATE উভয়ই ডেটা বিশ্লেষণের জন্য গুরুত্বপূর্ণ প্রক্রিয়া। PROC SUMMARY সাধারণত পরিসংখ্যানগত সারাংশ তৈরি করতে ব্যবহৃত হয়, যেখানে আপনি ডেটাসেটের গড়, সর্বনিম্ন, সর্বোচ্চ, এবং স্ট্যান্ডার্ড ডেভিয়েশন বের করতে পারেন। অন্যদিকে, PROC TABULATE ডেটার উপর সুন্দর টেবিল তৈরি করতে ব্যবহৃত হয় যা পরিসংখ্যানিক বিশ্লেষণ এবং অন্যান্য তথ্য প্রদান করে। উভয় প্রক্রিয়া নির্দিষ্ট কাজের জন্য অত্যন্ত কার্যকরী, এবং এগুলো আপনার ডেটা বিশ্লেষণকে আরও প্রাঞ্জল এবং সহজবোধ্য করতে সাহায্য করে।
SAS-এ PROC CONTENTS একটি অত্যন্ত কার্যকরী প্রক্রিয়া (Procedure) যা ডেটাসেটের Metadata দেখতে ব্যবহৃত হয়। Metadata বলতে ডেটাসেটের সম্পর্কে তথ্য বোঝানো হয়, যেমন ডেটাসেটের ভেরিয়েবল (Variables), তাদের ধরন (Type), দৈর্ঘ্য (Length), ফর্ম্যাট (Format), ইনফরমেশন এবং অন্যান্য বিভিন্ন বৈশিষ্ট্য।
PROC CONTENTS ব্যবহার করে আপনি সহজেই ডেটাসেটের সমস্ত তথ্য এবং তার কাঠামো সম্পর্কে বিশদ জানাতে পারবেন, যা পরবর্তী বিশ্লেষণ বা ডেটা ম্যানিপুলেশনে সহায়ক হতে পারে।
PROC CONTENTS এর সSint্যাক্স
PROC CONTENTS DATA=library.dataset_name;
RUN;
এখানে:
libraryহল ডেটাসেটটি যে লাইব্রেরি বা ডিরেক্টরিতে সংরক্ষিত রয়েছে তার নাম।dataset_nameহল সেই ডেটাসেটের নাম যার মেটাডেটা আপনি দেখতে চান।
PROC CONTENTS এর মাধ্যমে Metadata দেখার উদাহরণ
ধরা যাক, আপনার একটি ডেটাসেট work.employees নামে রয়েছে এবং আপনি এর মেটাডেটা দেখতে চান। নিম্নলিখিত কোডটি ব্যবহার করতে পারেন:
PROC CONTENTS DATA=work.employees;
RUN;
এই কোডটি work লাইব্রেরির employees ডেটাসেটের সমস্ত মেটাডেটা প্রিন্ট করবে, যার মধ্যে ডেটাসেটের ভেরিয়েবল, ডেটাটাইপ, দৈর্ঘ্য, ফরম্যাট এবং অন্যান্য বৈশিষ্ট্য থাকবে।
PROC CONTENTS এর ফলাফল
PROC CONTENTS চালানোর পর যে আউটপুট পাওয়া যাবে, তা সাধারণত দুটি ভাগে বিভক্ত থাকে:
- প্রাথমিক ডেটাসেটের তথ্য:
- ডেটাসেটের নাম (Dataset Name)
- ভেরিয়েবল সংখ্যা (Number of Variables)
- অবজারভেশন সংখ্যা (Number of Observations)
- ডেটাসেটের তৈরি তারিখ (Creation Date)
- সর্বশেষ আপডেট তারিখ (Last Modified Date)
- ভেরিয়েবলগুলির বিস্তারিত তথ্য:
- ভেরিয়েবলের নাম (Variable Name)
- ভেরিয়েবলের ধরন (Type: Numeric or Character)
- ভেরিয়েবলের দৈর্ঘ্য (Length)
- ফরম্যাট (Format)
- ভেরিয়েবলের লেবেল (Label)
- প্রাথমিক মান (Primary Values)
এটি আপনাকে ডেটাসেটের কাঠামো বুঝতে সহায়তা করে, বিশেষ করে যখন আপনি নতুন ডেটাসেটের সাথে কাজ শুরু করছেন।
PROC CONTENTS এর আরও অপশন
PROC CONTENTS এর মাধ্যমে আপনি আরও কিছু অতিরিক্ত তথ্য পেতে পারেন, যেমন:
- Short form (Only essential metadata)
- Data dictionary (ভেরিয়েবল এবং তার বৈশিষ্ট্য সহ)
১. কেবল ভেরিয়েবলগুলির তথ্য দেখানো
PROC CONTENTS DATA=work.employees VARNUM;
RUN;
এখানে, VARNUM অপশনটি ভেরিয়েবলগুলিকে তাদের নম্বর অনুযায়ী শো করবে, যাতে তাদের কাঠামো এবং অবস্থান বোঝা যায়।
২. ডেটাসেটের সব ধরণের প্রপার্টি দেখানো
PROC CONTENTS DATA=work.employees ALL;
RUN;
এখানে, ALL অপশনটি ডেটাসেটের সমস্ত মেটাডেটা দেখাবে, যেমন ডেটাসেটের ভেরিয়েবলগুলির বিস্তারিত তথ্য, ইনফরমেশন, এবং অন্যান্য বৈশিষ্ট্য।
৩. নির্দিষ্ট ভেরিয়েবল বা প্যারামিটার দেখতে
PROC CONTENTS DATA=work.employees OUT=contents_out;
RUN;
এখানে, OUT=contents_out ব্যবহার করা হচ্ছে আউটপুটটিকে একটি নতুন ডেটাসেটে সংরক্ষণ করতে, যাতে আপনি এটি পরবর্তীতে বিশ্লেষণ করতে পারেন।
PROC CONTENTS এর আউটপুট
PROC CONTENTS এর আউটপুট সাধারনত নিম্নলিখিত তথ্য প্রদান করে:
- ডেটাসেটের নাম এবং অবস্থান
- ভেরিয়েবল সংখ্যা এবং তাদের ধরনের তথ্য
- প্রতিটি ভেরিয়েবলের দৈর্ঘ্য, ফরম্যাট এবং লেবেল
- ডেটাসেটের মোট রেকর্ড সংখ্যা এবং অন্যান্য প্রাথমিক বৈশিষ্ট্য
এটি আপনাকে ডেটাসেটের কাঠামো বিশ্লেষণ করতে সহায়তা করে এবং যখন আপনি ডেটা ম্যানিপুলেশন বা পরিসংখ্যান বিশ্লেষণ শুরু করবেন তখন এটি খুবই উপকারী হতে পারে।
উপসংহার
SAS-এর PROC CONTENTS একটি গুরুত্বপূর্ণ প্রক্রিয়া যা ডেটাসেটের মেটাডেটা দেখতে ব্যবহৃত হয়। এটি ডেটাসেটের ভেরিয়েবল, তাদের ধরন, দৈর্ঘ্য, ফরম্যাট এবং অন্যান্য গুরুত্বপূর্ণ তথ্য দ্রুত এবং সহজে বের করার জন্য সহায়তা করে। যখন নতুন ডেটাসেট নিয়ে কাজ করবেন বা ডেটা বিশ্লেষণ শুরু করবেন, তখন এই প্রক্রিয়াটি ব্যবহার করে ডেটার কাঠামো সম্পর্কে পরিষ্কার ধারণা পাওয়া যায়।
Read more