PROC SORT, PROC MEANS, PROC FREQ এর ব্যবহার

PROC Step এবং Basic Procedures - স্যাস (SAS) - Big Data and Analytics

328

SAS-এ PROC SORT, PROC MEANS, এবং PROC FREQ তিনটি অত্যন্ত গুরুত্বপূর্ণ প্রসিডিউর (procedure) যা ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণে ব্যাপকভাবে ব্যবহৃত হয়। এগুলো ডেটার অর্ডারিং, পরিসংখ্যানগত বিশ্লেষণ এবং ফ্রিকোয়েন্সি টেবিল তৈরি করার জন্য ব্যবহৃত হয়।


PROC SORT: ডেটা সাজানো

PROC SORT ব্যবহার করে আপনি একটি ডেটাসেটের রেকর্ডগুলো নির্দিষ্ট ভেরিয়েবলের ভিত্তিতে সাজাতে পারেন। এটি একটি শক্তিশালী টুল, যার মাধ্যমে ডেটা সাজানো সহজ এবং দ্রুত হয়।

ব্যবহার:

  • SORT: ডেটাসেটের ভেরিয়েবল(s) অনুযায়ী সাজানো হয়।
  • BY: কোন ভেরিয়েবল(s) দ্বারা ডেটা সাজানো হবে তা নির্দিষ্ট করা হয়।

উদাহরণ: ডেটা সাজানো

PROC SORT DATA=work.sales;
   BY Revenue;  /* Revenue ভেরিয়েবল অনুযায়ী ডেটা সাজানো */
RUN;

এখানে:

  • work.sales ডেটাসেটটি Revenue ভেরিয়েবলের ভিত্তিতে সোর্ট করা হয়েছে।
  • BY ক্লজ ব্যবহার করে সজ্জার নির্দেশনা দেওয়া হয়।

DESCENDING ব্যবহার:

ডেটা সাজানোর জন্য আপনি DESCENDING কিওয়ার্ড ব্যবহার করে সোজা থেকে উল্টো বা উল্টো থেকে সোজা সাজাতে পারেন।

PROC SORT DATA=work.sales;
   BY DESCENDING Revenue;  /* Revenue অনুযায়ী উল্টো সাজানো */
RUN;

এখানে:

  • DESCENDING দ্বারা ডেটা উল্টো অর্ডারে সাজানো হবে (সবচেয়ে বড় মান আগে আসবে)।

PROC MEANS: পরিসংখ্যানগত বিশ্লেষণ

PROC MEANS একটি পরিসংখ্যানগত প্রসিডিউর যা ডেটাসেটের নির্দিষ্ট ভেরিয়েবলের জন্য গড়, স্ট্যান্ডার্ড ডিভিয়েশন, মিনিমাম, ম্যাক্সিমাম, মিডিয়ান, ইত্যাদি পরিসংখ্যান প্রদান করে।

ব্যবহার:

  • VAR: কোন ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে তা নির্দিষ্ট করা হয়।
  • N, MEAN, STD, MIN, MAX: পরিসংখ্যানের ধরন নির্দিষ্ট করা হয়।

উদাহরণ: পরিসংখ্যান বিশ্লেষণ

PROC MEANS DATA=work.sales N MEAN STD MIN MAX;
   VAR Revenue Age;  /* Revenue এবং Age ভেরিয়েবলের জন্য পরিসংখ্যান */
RUN;

এখানে:

  • N দ্বারা মোট রেকর্ডের সংখ্যা, MEAN দ্বারা গড়, STD দ্বারা স্ট্যান্ডার্ড ডিভিয়েশন, MIN এবং MAX দ্বারা সর্বনিম্ন এবং সর্বাধিক মান বের করা হবে।
  • VAR স্টেটমেন্টে যেসব ভেরিয়েবলের জন্য পরিসংখ্যান বের করতে হবে তা উল্লেখ করা হয়েছে।

এক্সট্রা অপশন:

  • CLASS: ক্যাটাগরিক্যাল ভেরিয়েবলের জন্য পরিসংখ্যান।
PROC MEANS DATA=work.sales N MEAN;
   VAR Revenue;
   CLASS Region;  /* Region অনুযায়ী পরিসংখ্যান */
RUN;

এখানে:

  • CLASS Region ব্যবহার করা হয়েছে, যার মাধ্যমে Region ভেরিয়েবলের জন্য আলাদা আলাদা পরিসংখ্যান বের করা হবে।

PROC FREQ: ফ্রিকোয়েন্সি টেবিল তৈরি

PROC FREQ একটি পরিসংখ্যানগত প্রসিডিউর যা একটি ডেটাসেটের ক্যাটাগোরিক্যাল ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করে। এটি ডেটার মধ্যে প্রতিটি মানের কতবার ঘটেছে তা প্রদর্শন করে।

ব্যবহার:

  • TABLES: কোন ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করা হবে তা নির্দিষ্ট করা হয়।
  • ORDER: ফ্রিকোয়েন্সি টেবিল সাজানোর পদ্ধতি নির্দিষ্ট করা হয়।

উদাহরণ: ফ্রিকোয়েন্সি টেবিল তৈরি

PROC FREQ DATA=work.sales;
   TABLES Region Gender;  /* Region এবং Gender ভেরিয়েবলের জন্য ফ্রিকোয়েন্সি */
RUN;

এখানে:

  • TABLES স্টেটমেন্ট ব্যবহার করে Region এবং Gender ভেরিয়েবলগুলোর ফ্রিকোয়েন্সি টেবিল তৈরি করা হয়েছে।

অপশন: ফ্রিকোয়েন্সি প্রিন্ট করতে

  • ORDER=FREQ: ফ্রিকোয়েন্সি অনুসারে সাজানোর জন্য।
PROC FREQ DATA=work.sales ORDER=FREQ;
   TABLES Region;
RUN;

এখানে:

  • ORDER=FREQ ফ্রিকোয়েন্সির ভিত্তিতে ভেরিয়েবলটি সাজাবে।

সারাংশ

  • PROC SORT: ডেটাসেট সজ্জার জন্য ব্যবহৃত হয়, যা ভেরিয়েবলের ভিত্তিতে ডেটাকে সাজায় (আলফাবেটিক বা ন্যূনতম থেকে সর্বাধিক বা তার উল্টোও হতে পারে)।
  • PROC MEANS: পরিসংখ্যানগত বিশ্লেষণের জন্য ব্যবহৃত হয়, যেমন গড়, স্ট্যান্ডার্ড ডিভিয়েশন, সর্বনিম্ন এবং সর্বাধিক মান।
  • PROC FREQ: ক্যাটাগরিক্যাল ডেটার জন্য ফ্রিকোয়েন্সি টেবিল তৈরি করে, যা দেখায় কতবার একটি নির্দিষ্ট মান ঘটেছে।

এই তিনটি প্রসিডিউর ডেটা বিশ্লেষণে অত্যন্ত গুরুত্বপূর্ণ ভূমিকা পালন করে এবং ডেটার উপর বিভিন্ন ধরনের পরিসংখ্যানগত ও বিশ্লেষণাত্মক কাজ করতে সহায়তা করে।

Content added By
Promotion

Are you sure to start over?

Loading...