DATA Step এর মাধ্যমে Dataset তৈরি করা

AS Datasets এর ধারণা - স্যাস (SAS) - Big Data and Analytics

339

SAS এর DATA Step একটি গুরুত্বপূর্ণ অংশ, যার মাধ্যমে আপনি নতুন ডেটাসেট তৈরি করতে, ডেটা প্রক্রিয়া করতে এবং তা ম্যানিপুলেট করতে পারেন। এটি ব্যবহার করে আপনি ডেটা তৈরি করতে পারেন, ডেটার মান পরিবর্তন করতে পারেন, বা শর্তসাপেক্ষ বিশ্লেষণ পরিচালনা করতে পারেন।


DATA Step এর পরিচিতি

DATA Step হল একটি প্রক্রিয়া যেখানে SAS ব্যবহারকারীরা ডেটাসেট তৈরি এবং পরিবর্তন করতে পারেন। এটি এক ধরনের প্রোগ্রামিং ভাষা, যা ডেটার ইনপুট এবং আউটপুট ব্যবস্থাপনা করে।

সাধারণ সিনট্যাক্স:

DATA dataset_name;
   /* ডেটা স্টেটমেন্ট */
   INPUT variable1 variable2 ...;
   /* ডেটার প্রসেসিং */
   DATALINES;
   /* ডেটা ইনপুট */
   ;
RUN;
  • DATA : এটি ডেটাসেট তৈরি করার প্রাথমিক কমান্ড।
  • dataset_name : এটি তৈরি করা ডেটাসেটের নাম।
  • INPUT : ডেটা ইনপুট করার জন্য ফিল্ডগুলি উল্লেখ করা হয়।
  • DATALINES : এখানে ডেটা লিখতে হবে।

DATA Step এর মাধ্যমে Dataset তৈরি করার ধাপ

১. নতুন Dataset তৈরি করা

নতুন ডেটাসেট তৈরি করতে DATA স্টেটমেন্ট ব্যবহার করা হয়। নিচে একটি উদাহরণ দেওয়া হলো:

DATA student_data;
   INPUT Name $ Age Gender $;
   DATALINES;
John 15 M
Alice 14 F
Bob 16 M
;
RUN;

এখানে:

  • student_data হল নতুন ডেটাসেটের নাম।
  • Name, Age, এবং Gender ডেটাসেটের ভেরিয়েবল।
  • DATALINES স্টেটমেন্টের মাধ্যমে ডেটা ইনপুট দেওয়া হচ্ছে।

এই কোডটি রান করার পর একটি নতুন ডেটাসেট তৈরি হবে, যার মধ্যে তিনটি রেকর্ড থাকবে: John, Alice, এবং Bob।


২. বিভিন্ন ধরণের ভেরিয়েবল ব্যবহৃত করা

আপনি ডেটাসেটে বিভিন্ন ধরণের ভেরিয়েবল যেমন ক্যারেক্টার (character) এবং নিউমেরিক (numeric) ব্যবহার করতে পারেন।

DATA sales_data;
   INPUT Product $ Sales Revenue;
   DATALINES;
Laptop 1200 15000
Phone 800 9000
Tablet 500 6000
;
RUN;

এখানে:

  • Product একটি ক্যারেক্টার ভেরিয়েবল।
  • Sales এবং Revenue হল নিউমেরিক ভেরিয়েবল।

৩. শর্তসাপেক্ষ ডেটা প্রসেসিং

DATA Step এর মাধ্যমে আপনি শর্তসাপেক্ষ ডেটা প্রসেসিংও করতে পারেন। যেমন, আপনি নির্দিষ্ট শর্তে কিছু পরিবর্তন করতে পারেন।

DATA filtered_data;
   SET student_data;
   IF Age > 14 THEN Status = 'Senior';
   ELSE Status = 'Junior';
RUN;

এখানে:

  • SET স্টেটমেন্টের মাধ্যমে পূর্বে তৈরি করা student_data ডেটাসেট থেকে ডেটা আনা হচ্ছে।
  • IF স্টেটমেন্টের মাধ্যমে বয়সের ওপর ভিত্তি করে Status ভেরিয়েবল নির্ধারণ করা হচ্ছে।

৪. ডেটাসেটে নতুন ভেরিয়েবল যোগ করা

আপনি ডেটাসেটে নতুন ভেরিয়েবলও তৈরি করতে পারেন। নিচে এর উদাহরণ দেওয়া হলো:

DATA updated_sales;
   SET sales_data;
   Profit = Revenue - Sales;
RUN;

এখানে:

  • Profit একটি নতুন ভেরিয়েবল, যা Revenue থেকে Sales বিয়োগ করার মাধ্যমে তৈরি করা হয়েছে।

৫. ডেটাসেটের মধ্যে ডেটা সম্পাদনা

DATA Step ব্যবহার করে আপনি ডেটা সম্পাদনা, মুছতে বা পরিবর্তন করতে পারেন।

DATA modified_data;
   SET sales_data;
   IF Product = 'Phone' THEN Revenue = 9500; /* Update Phone's Revenue */
RUN;

এখানে:

  • Product ভেরিয়েবলের মান যদি ‘Phone’ হয়, তবে Revenue আপডেট করা হচ্ছে।

DATA Step এর মাধ্যমে Dataset তৈরি করার সুবিধা

  • ডেটা প্রসেসিং: DATA Step আপনাকে ডেটা রিড, ম্যানিপুলেশন এবং বিশ্লেষণ করতে সহায়তা করে।
  • কাস্টমাইজেশন: এটি আপনাকে ডেটাসেটের বিভিন্ন ভেরিয়েবল কাস্টমাইজ করতে এবং নতুন ভেরিয়েবল তৈরি করতে সক্ষম করে।
  • শর্তসাপেক্ষ বিশ্লেষণ: DATA Step আপনাকে শর্তসাপেক্ষ ডেটা বিশ্লেষণ পরিচালনা করতে সাহায্য করে, যেমন ‘if-then’ শর্ত দিয়ে ডেটা পরিবর্তন করা।

SAS এর DATA Step একটি গুরুত্বপূর্ণ টুল, যা ডেটাসেট তৈরি এবং পরিবর্তন করার জন্য অত্যন্ত কার্যকরী। এর মাধ্যমে আপনি আপনার প্রয়োজনীয় বিশ্লেষণ করতে পারেন এবং ডেটাকে প্রয়োজনীয় ফর্ম্যাটে প্রক্রিয়া করতে পারেন।

Content added By
Promotion

Are you sure to start over?

Loading...