AWK এ Substring এবং Split ফাংশন এর ব্যবহার
AWK একটি শক্তিশালী প্রোগ্রামিং ভাষা যা টেক্সট প্রসেসিং এবং ডেটা বিশ্লেষণের জন্য ব্যাপকভাবে ব্যবহৃত হয়। এই ভাষায় substring এবং split ফাংশন ব্যবহার করে টেক্সটের নির্দিষ্ট অংশগুলি আলাদা করা যায়। নিচে এই দুটি ফাংশনের ব্যবহার এবং উদাহরণগুলি আলোচনা করা হলো।
১. Substring ফাংশন
AWK এ substr() ফাংশন ব্যবহার করে একটি স্ট্রিং থেকে নির্দিষ্ট অংশ বের করা যায়। এর সিনট্যাক্স নিম্নরূপ:
substr(string, start, length)- string: যে স্ট্রিং থেকে সাবস্ট্রিংটি বের করতে হবে।
- start: যেখানে থেকে সাবস্ট্রিং শুরু হবে (1 থেকে শুরু হয়)।
- length (বিকল্প): সাবস্ট্রিংটির দৈর্ঘ্য কত হবে।
উদাহরণ: Substring ফাংশন ব্যবহার
awk '{ sub_str = substr($1, 1, 3) # প্রথম কলামের প্রথম 3 অক্ষর নিন
print "Substring of " $1 " is: " sub_str
}' filename.txtএখানে, প্রথম কলামের প্রথম তিনটি অক্ষর বের করা হয়েছে।
২. Split ফাংশন
AWK এ split() ফাংশন ব্যবহার করে একটি স্ট্রিংকে বিভক্ত করে আলাদা আলাদা অংশে রূপান্তর করা যায়। এর সিনট্যাক্স নিম্নরূপ:
split(string, array, delimiter)- string: যে স্ট্রিংকে বিভক্ত করতে হবে।
- array: একটি অ্যারে যেখানে বিভক্ত অংশগুলি সংরক্ষণ করা হবে।
- delimiter (বিকল্প): যে চিহ্নের উপর ভিত্তি করে স্ট্রিং বিভক্ত হবে (যদি উল্লেখ করা না হয়, তাহলে ডিফল্ট হলো স্পেস)।
উদাহরণ: Split ফাংশন ব্যবহার
awk '{
split($0, arr, ",") # সম্পূর্ণ লাইনে কমা ব্যবহার করে বিভক্ত করুন
for (i = 1; i <= length(arr); i++) {
print "Element " i ": " arr[i] # প্রতিটি উপাদান প্রিন্ট করুন
}
}' filename.txtএখানে, পুরো লাইনে কমা দিয়ে বিভক্ত করে একটি অ্যারেতে সংরক্ষণ করা হয়েছে এবং তারপর প্রতিটি উপাদান প্রিন্ট করা হয়েছে।
একত্রিত উদাহরণ
নিচে একটি উদাহরণ দেওয়া হলো যেখানে substr এবং split উভয় ফাংশন একসাথে ব্যবহার করা হয়েছে:
awk '{
split($0, arr, " ") # লাইনে স্পেস দ্বারা বিভক্ত করুন
first_name = arr[1] # প্রথম নাম নিন
last_name = arr[2] # শেষ নাম নিন
initials = substr(first_name, 1, 1) substr(last_name, 1, 1) # প্রথম এবং শেষ নামের প্রথম অক্ষর নিন
print "Initials: " initials
}' filename.txtএখানে, প্রথম এবং শেষ নামের প্রথম অক্ষরগুলো আলাদা করে তাদের ইনিশিয়াল তৈরি করা হয়েছে।
সারসংক্ষেপ
AWK তে substr() এবং split() ফাংশন ব্যবহার করে স্ট্রিংগুলির সাথে কাজ করা অনেক সহজ এবং কার্যকর। substr() ফাংশন ব্যবহার করে স্ট্রিংয়ের একটি নির্দিষ্ট অংশ বের করা যায়, এবং split() ফাংশন ব্যবহার করে একটি স্ট্রিংকে বিভিন্ন অংশে বিভক্ত করা যায়। এই ফাংশনগুলি টেক্সট বিশ্লেষণ এবং ডেটা প্রক্রিয়াকরণের সময় বিশেষভাবে কার্যকরী। AWK এর এই ক্ষমতা ব্যবহার করে, আপনি আপনার ডেটা বিশ্লেষণের কাজকে আরও দ্রুত এবং কার্যকরভাবে সম্পন্ন করতে পারেন।
Read more