DATA Step এর মাধ্যমে Data Manipulation

SAS এর জন্য Data Manipulation - স্যাস (SAS) - Big Data and Analytics

303

SAS এর DATA Step হল একটি গুরুত্বপূর্ণ অংশ যা ডেটা ম্যানিপুলেশন বা ডেটা প্রক্রিয়া করার জন্য ব্যবহৃত হয়। এটি মূলত ডেটা লোড, ক্লিনিং, ম্যানিপুলেশন এবং নতুন ভেরিয়েবল তৈরি করার কাজ করে। DATA Step ব্যবহার করে আপনি আপনার ডেটাসেটে বিভিন্ন ধরনের পরিবর্তন, ফিল্টারিং, বিশ্লেষণ, এবং বিভিন্ন রকম গণনা করতে পারেন।


DATA Step এর মৌলিক গঠন

DATA Step একটি কোড ব্লক যা data এবং run কমান্ডের মধ্যে থাকে। এর মধ্যে আপনি ডেটাসেট লোড করতে, ভেরিয়েবল তৈরি করতে, শর্তাবলী প্রয়োগ করতে এবং ডেটা প্রক্রিয়াকরণ করতে পারেন।

DATA Step এর মৌলিক গঠন:

data new_dataset;
   set existing_dataset;
   /* ডেটা ম্যানিপুলেশন কোড এখানে */
run;

এখানে:

  • data new_dataset; — নতুন ডেটাসেট তৈরি করা হচ্ছে।
  • set existing_dataset; — পুরানো ডেটাসেট থেকে ডেটা নিয়ে নতুন ডেটাসেটে প্রবাহিত করা হচ্ছে।
  • run; — কোডটি কার্যকর করার জন্য ব্যবহৃত হয়।

DATA Step এর মাধ্যমে Data Manipulation

DATA Step ব্যবহার করে বিভিন্ন ধরণের ডেটা ম্যানিপুলেশন করা যায়। কিছু প্রধান ম্যানিপুলেশন অপারেশন নিম্নরূপ:

১. নতুন ভেরিয়েবল তৈরি করা

DATA Step দিয়ে আপনি নতুন ভেরিয়েবল তৈরি করতে পারেন যা পুরানো ভেরিয়েবলগুলোর উপর ভিত্তি করে গণনা বা পরিবর্তন হতে পারে।

উদাহরণ: নতুন ভেরিয়েবল তৈরি করা

data new_data;
   set old_data;
   AgeInMonths = Age * 12;  /* নতুন ভেরিয়েবল AgeInMonths তৈরি */
run;

এখানে:

  • AgeInMonths নতুন ভেরিয়েবল হিসেবে তৈরি হচ্ছে যা Age ভেরিয়েবল থেকে মাসে রূপান্তরিত বয়স প্রদর্শন করবে।

২. শর্তাবলী ব্যবহার করে ডেটা ফিল্টার করা

SAS DATA Step এ if শর্ত ব্যবহার করে ডেটা ফিল্টার করা যায়, যাতে শুধুমাত্র নির্দিষ্ট শর্ত পূরণ করা রেকর্ডগুলো রাখা হয়।

উদাহরণ: বয়সের উপর ভিত্তি করে ফিল্টার করা

data adults;
   set people;
   if age >= 18;  /* বয়স ১৮ এর সমান বা বড় হলে রেকর্ড রাখবে */
run;

এখানে:

  • if age >= 18; শর্তটি নিশ্চিত করে যে, বয়স ১৮ বা তার বেশি হলে শুধুমাত্র সেই রেকর্ডগুলো adults ডেটাসেটে রাখা হবে।

৩. ডেটা ক্লিনিং

ডেটা ক্লিনিং হল ডেটাসেটে মিসিং ভ্যালু (missing values), ডুপ্লিকেট রেকর্ড এবং অবাঞ্ছিত ডেটা পরিষ্কার করার প্রক্রিয়া। if বা where শর্ত ব্যবহার করে আপনি এই ধরনের ডেটা পরিষ্কার করতে পারেন।

উদাহরণ: মিসিং ভ্যালু অপসারণ করা

data cleaned_data;
   set raw_data;
   if name = '';  /* যদি নাম ফাঁকা থাকে তবে সেই রেকর্ড বাদ দিন */
run;

এখানে:

  • if name = ''; শর্তটি নিশ্চিত করে যে যেসব রেকর্ডে name ভেরিয়েবলটি ফাঁকা আছে, সেই রেকর্ডগুলো বাদ দেওয়া হবে।

৪. ভেরিয়েবল রিকোড করা

কখনও কখনও আপনাকে একটি ভেরিয়েবলকে নতুন মানে রিকোড (recode) করতে হতে পারে। এটি করার জন্য if-then বা select-when স্টেটমেন্ট ব্যবহার করা হয়।

উদাহরণ: বয়স রিকোড করা

data recoded_data;
   set people;
   if age < 18 then age_group = 'Minor';
   else if age >= 18 and age < 60 then age_group = 'Adult';
   else age_group = 'Senior';
run;

এখানে:

  • age_group নতুন ভেরিয়েবল তৈরি করা হচ্ছে যা বয়সের উপর ভিত্তি করে 'Minor', 'Adult', বা 'Senior' শ্রেণীতে বিভক্ত হবে।

৫. ভেরিয়েবল মুছে ফেলা

SAS-এ drop বা keep স্টেটমেন্ট ব্যবহার করে আপনি অপ্রয়োজনীয় ভেরিয়েবলগুলো মুছে ফেলতে পারেন।

উদাহরণ: ভেরিয়েবল মুছে ফেলা

data reduced_data;
   set full_data;
   drop salary;  /* salary ভেরিয়েবলটি বাদ দেয়া হচ্ছে */
run;

এখানে:

  • drop salary; স্টেটমেন্টের মাধ্যমে salary ভেরিয়েবলটি ডেটাসেট থেকে বাদ দেওয়া হচ্ছে।

উপসংহার

SAS-এর DATA Step একটি শক্তিশালী টুল যা ডেটা ম্যানিপুলেশন, বিশ্লেষণ এবং প্রক্রিয়াকরণে ব্যবহৃত হয়। আপনি DATA Step ব্যবহার করে নতুন ভেরিয়েবল তৈরি, শর্তাবলী প্রয়োগ, ডেটা ক্লিনিং, ভেরিয়েবল রিকোডিং এবং অপ্রয়োজনীয় ডেটা অপসারণ করতে পারেন। এটি SAS-এ ডেটা বিশ্লেষণ এবং প্রস্তুতির জন্য অত্যন্ত গুরুত্বপূর্ণ একটি অংশ।

Content added By
Promotion

Are you sure to start over?

Loading...