SAS-এ Character Functions ব্যবহার করে আপনি টেক্সট বা ক্যারেক্টার ডেটা ম্যানিপুলেট করতে পারেন। এই ফাংশনগুলি ক্যারেক্টার ভেরিয়েবলের উপর বিভিন্ন ধরণের প্রক্রিয়া যেমন সাবস্ট্রিং এক্সট্র্যাকশন, ফাঁকা জায়গা সরানো এবং দৈর্ঘ্য নির্ধারণের জন্য ব্যবহৃত হয়। এখানে আমরা কিছু সাধারণ ক্যারেক্টার ফাংশন যেমন SUBSTR, TRIM, এবং LENGTH সম্পর্কে আলোচনা করব।
১. SUBSTR (Substring Extraction)
SUBSTR ফাংশনটি একটি স্ট্রিং থেকে একটি নির্দিষ্ট অংশ (substring) বের করতে ব্যবহৃত হয়। এটি মূল স্ট্রিং থেকে শুরু হওয়ার পজিশন এবং কতগুলো ক্যারেক্টার বের করতে হবে তা নির্দিষ্ট করে।
SUBSTR ফাংশনের গঠন:
SUBSTR(string, start, length)
- string: মূল স্ট্রিং বা ভেরিয়েবল।
- start: যেখান থেকে সাবস্ট্রিং শুরু হবে।
- length (optional): কতটি ক্যারেক্টার সাবস্ট্রিং হিসেবে নেওয়া হবে।
উদাহরণ:
data example;
input fullname $20.;
first_name = substr(fullname, 1, 5); /* প্রথম ৫টি ক্যারেক্টার */
last_name = substr(fullname, 7); /* ৭ম পজিশন থেকে বাকি */
datalines;
Johnathan Doe
Michael Smith
Sara Lee
;
run;
proc print data=example;
run;
এখানে:
- first_name ভেরিয়েবলটি fullname ভেরিয়েবলের প্রথম ৫টি ক্যারেক্টার (যেমন "John") গ্রহণ করবে।
- last_name ভেরিয়েবলটি ৭ম ক্যারেক্টার থেকে শুরু করে বাকী অংশ (যেমন "Doe") গ্রহণ করবে।
২. TRIM (Removing Trailing Spaces)
TRIM ফাংশনটি একটি স্ট্রিংয়ের শেষে থাকা অতিরিক্ত ফাঁকা স্থান (trailing spaces) সরাতে ব্যবহৃত হয়। এটি মূল স্ট্রিংয়ের শেষে থাকা এক বা একাধিক ফাঁকা স্থান মুছে দেয়, তবে স্ট্রিংয়ের শুরু বা মাঝখানে থাকা ফাঁকা স্থান অপরিবর্তিত থাকে।
TRIM ফাংশনের গঠন:
TRIM(string)
- string: যে স্ট্রিং থেকে ফাঁকা স্থান সরাতে হবে।
উদাহরণ:
data example;
input name $20.;
trimmed_name = trim(name); /* নামের শেষে থাকা ফাঁকা স্থান সরানো */
datalines;
John
Michael
Sara
;
run;
proc print data=example;
run;
এখানে:
- trimmed_name ভেরিয়েবলটি name ভেরিয়েবল থেকে শেষে থাকা ফাঁকা স্থান মুছে দিবে। (যেমন "John " থেকে "John")
৩. LENGTH (Length of a String)
LENGTH ফাংশনটি একটি স্ট্রিং বা ক্যারেক্টার ভেরিয়েবলের দৈর্ঘ্য নির্ধারণ করতে ব্যবহৃত হয়। এটি একটি স্ট্রিংয়ের মোট ক্যারেক্টারের সংখ্যা নির্ধারণ করে, এবং স্ট্রিংয়ের শেষে থাকা ফাঁকা স্থানও গণনা করে।
LENGTH ফাংশনের গঠন:
LENGTH(string)
- string: যে স্ট্রিংয়ের দৈর্ঘ্য নির্ধারণ করতে হবে।
উদাহরণ:
data example;
input name $20.;
name_length = length(name); /* নামের দৈর্ঘ্য নির্ধারণ */
datalines;
Johnathan
Michael
Sara
;
run;
proc print data=example;
run;
এখানে:
- name_length ভেরিয়েবলটি name ভেরিয়েবলের দৈর্ঘ্য নির্ধারণ করবে। যেমন, "Johnathan" এর দৈর্ঘ্য 9 এবং "Sara" এর দৈর্ঘ্য 4।
সারাংশ
SAS-এ Character Functions যেমন SUBSTR, TRIM, এবং LENGTH অত্যন্ত কার্যকরী ফাংশন যা ক্যারেক্টার ভেরিয়েবল বা স্ট্রিংয়ের উপর বিভিন্ন প্রক্রিয়া সম্পাদন করতে সহায়তা করে:
- SUBSTR ফাংশন ব্যবহার করে স্ট্রিংয়ের নির্দিষ্ট অংশ (substring) বের করা যায়।
- TRIM ফাংশনটি স্ট্রিংয়ের শেষে থাকা অতিরিক্ত ফাঁকা স্থান সরিয়ে স্ট্রিংকে পরিষ্কার করে।
- LENGTH ফাংশনটি স্ট্রিংয়ের মোট দৈর্ঘ্য নির্ধারণ করে।
এই ফাংশনগুলির মাধ্যমে আপনি ডেটার সাথে আরও কার্যকরভাবে কাজ করতে পারবেন এবং তা বিশ্লেষণের জন্য উপযোগী করতে পারবেন।
Read more