Data Manipulation Techniques: Sorting, Filtering, Aggregation

Data Import, Export, এবং Manipulation (ডেটা ইম্পোর্ট, এক্সপোর্ট, এবং ম্যানিপুলেশন) - ম্যাটল্যাব এম-ফাইল (Matlab M-Files) - Computer Programming

316

ডেটা ম্যানিপুলেশন কৌশলগুলি অত্যন্ত গুরুত্বপূর্ণ, কারণ এগুলির মাধ্যমে কাঁচা ডেটাকে বিশ্লেষণযোগ্য এবং ব্যবহারযোগ্য তথ্যতে রূপান্তরিত করা হয়। স্ট্রিং, ফিল্টারিং এবং অ্যাগ্রিগেশন হল তিনটি মৌলিক কাজ, যা ডেটা বিশ্লেষণের জন্য ব্যবহার করা হয়।


১. স্ট্রিং (Sorting)

স্ট্রিং হল ডেটাকে নির্দিষ্ট এক ক্রমে সাজানো, যেমন উর্ধ্বমুখী (Ascending) বা অধঃপতনমুখী (Descending) ক্রমে। এটি ডেটাতে প্যাটার্ন, প্রবণতা বা আউটলাইয়ার খুঁজে বের করতে সহায়তা করে।

স্ট্রিং এর ধরন:

  • উর্ধ্বমুখী ক্রম: সর্বনিম্ন থেকে সর্বোচ্চ (যেমন, A থেকে Z, 1 থেকে 10)।
  • অধঃপতনমুখী ক্রম: সর্বোচ্চ থেকে সর্বনিম্ন (যেমন, Z থেকে A, 10 থেকে 1)।

উদাহরণ ম্যাটল্যাব-এ:

% উদাহরণ: একটি অ্যারে সাজানো
data = [5, 3, 8, 1, 2];
sorted_data = sort(data);  % উর্ধ্বমুখী ক্রমে
disp(sorted_data);  % আউটপুট: [1, 2, 3, 5, 8]

% অধঃপতনমুখী ক্রমে সাজানো
sorted_data_desc = sort(data, 'descend');
disp(sorted_data_desc);  % আউটপুট: [8, 5, 3, 2, 1]

টেবিলের উপর স্ট্রিং প্রয়োগ:

% উদাহরণ: একটি টেবিলের উপর স্ট্রিং প্রয়োগ
T = table([5; 3; 8; 1; 2], {'apple'; 'banana'; 'cherry'; 'date'; 'elderberry'}, 'VariableNames', {'Number', 'Fruit'});
sorted_table = sortrows(T, 'Number');
disp(sorted_table);

২. ফিল্টারিং (Filtering)

ফিল্টারিং হচ্ছে এমন একটি প্রক্রিয়া, যার মাধ্যমে আমরা নির্দিষ্ট শর্ত বা মান অনুসারে ডেটাকে নির্বাচন করি। এটি ডেটাসেটকে সংকুচিত করে শুধু প্রাসঙ্গিক রেকর্ডগুলিকে অন্তর্ভুক্ত করতে সাহায্য করে।

ফিল্টারিং এর ধরন:

  • শর্তভিত্তিক ফিল্টারিং: নির্দিষ্ট শর্তের উপর ভিত্তি করে রেকর্ড নির্বাচন করা (যেমন, একটি নির্দিষ্ট মানের বেশি বা কম হওয়া)।
  • পরিসীমাভিত্তিক ফিল্টারিং: একটি নির্দিষ্ট পরিসীমার মধ্যে থাকা ডেটা নির্বাচন করা।

উদাহরণ ম্যাটল্যাব-এ:

% উদাহরণ: একটি অ্যারে ফিল্টার করা
data = [5, 3, 8, 1, 2];
filtered_data = data(data > 3);  % 3 এর বেশি মান ফিল্টার করা
disp(filtered_data);  % আউটপুট: [5, 8]

% টেবিল ফিল্টার করা
T = table([5; 3; 8; 1; 2], {'apple'; 'banana'; 'cherry'; 'date'; 'elderberry'}, 'VariableNames', {'Number', 'Fruit'});
filtered_table = T(T.Number > 3, :);  % 'Number' > 3 শর্তে ফিল্টার করা
disp(filtered_table);

এডভান্সড ফিল্টারিং:

এটি আরও জটিল শর্ত ব্যবহার করে করা যেতে পারে:

% 'Number' > 3 এবং 'Fruit' হল 'banana'
filtered_table = T(T.Number > 3 & strcmp(T.Fruit, 'banana'), :);
disp(filtered_table);

৩. অ্যাগ্রিগেশন (Aggregation)

অ্যাগ্রিগেশন হল ডেটার সারণী তৈরি করার জন্য একটি প্রক্রিয়া, যা বিভিন্ন মানের উপর গণনা করে (যেমন, যোগফল, গড় বা সংখ্যা গণনা) এবং সেই অনুযায়ী ডেটা উপস্থাপন করে। এটি ডেটার উপর গণনা প্রয়োগ করে আমাদের অগ্রগতি বা প্রবণতা দেখতে সহায়তা করে।

অ্যাগ্রিগেশন এর ধরন:

  • যোগফল (Sum): একটি কলামের মোট যোগফল নির্ধারণ করা।
  • গড় (Mean): একটি কলামের গড় নির্ধারণ করা।
  • সংখ্যা গণনা (Count): শর্ত মেনে কতগুলো রেকর্ড রয়েছে তা গোনা।
  • গ্রুপিং: একটি বা একাধিক কলামের উপর ভিত্তি করে গ্রুপ তৈরি করে অ্যাগ্রিগেশন করা।

উদাহরণ ম্যাটল্যাব-এ:

% উদাহরণ: একটি অ্যারের যোগফল বের করা
data = [5, 3, 8, 1, 2];
total = sum(data);  % আউটপুট: 19
disp(total);

গ্রুপিং এবং অ্যাগ্রিগেশন:

% উদাহরণ: একটি টেবিল গ্রুপ করা এবং যোগফল বের করা
T = table([5; 3; 8; 1; 2], {'apple'; 'banana'; 'cherry'; 'apple'; 'banana'}, 'VariableNames', {'Number', 'Fruit'});
grouped_table = varfun(@sum, T, 'GroupingVariables', 'Fruit', 'InputVariables', 'Number');
disp(grouped_table);

স্ট্রিং, ফিল্টারিং এবং অ্যাগ্রিগেশন একত্রে ব্যবহার করা

এই তিনটি কৌশল একসঙ্গে ব্যবহার করে আমরা আরও জটিল ডেটা বিশ্লেষণ করতে পারি। ধরুন, আমরা প্রথমে ডেটা ফিল্টার করব, তারপর সাজাবো এবং শেষমেশ গ্রুপ করে অ্যাগ্রিগেশন প্রয়োগ করব।

উদাহরণ:

% স্ট্রিং, ফিল্টারিং, এবং অ্যাগ্রিগেশন একত্রিত করা
T = table([5; 3; 8; 1; 2], {'apple'; 'banana'; 'cherry'; 'apple'; 'banana'}, 'VariableNames', {'Number', 'Fruit'});

% 'Number' > 3 দিয়ে ফিল্টার করা
filtered_table = T(T.Number > 3, :);

% 'Number' অনুযায়ী সাজানো
sorted_filtered_table = sortrows(filtered_table, 'Number');

% 'Fruit' দ্বারা গ্রুপ করা এবং 'Number' এর যোগফল বের করা
grouped_table = varfun(@sum, sorted_filtered_table, 'GroupingVariables', 'Fruit', 'InputVariables', 'Number');
disp(grouped_table);

সারাংশ

স্ট্রিং, ফিল্টারিং, এবং অ্যাগ্রিগেশন হল ডেটা ম্যানিপুলেশনের তিনটি মৌলিক কৌশল যা ডেটা বিশ্লেষণ এবং পরিচালনার জন্য অপরিহার্য। এই কৌশলগুলির সাহায্যে:

  • স্ট্রিং ডেটাকে সাজানো হয় (Ascending/Descending order)।
  • ফিল্টারিং শর্ত অনুযায়ী ডেটা নির্বাচন করা হয়।
  • অ্যাগ্রিগেশন ডেটার উপর গণনা (যেমন, যোগফল, গড়, সংখ্যা গণনা) প্রয়োগ করে সংক্ষিপ্তসার তৈরি করা হয়।

এই কৌশলগুলি একত্রিত ব্যবহার করলে জটিল ডেটা বিশ্লেষণ সহজ এবং কার্যকরী হয়ে ওঠে।

Content added By
Promotion

Are you sure to start over?

Loading...