Data Cleansing এবং Data Transformation Techniques

Big Data and Analytics - এক্সেল ডেটা এনালাইসিস (Excel Data Analysis) - Power Query দিয়ে Data Transform করা
430

Data Cleansing কী?

Data Cleansing বা ডেটা পরিস্কার করা হলো একটি গুরুত্বপূর্ণ প্রক্রিয়া, যার মাধ্যমে ডেটা থেকে অপ্রয়োজনীয়, ভুল বা অসম্পূর্ণ তথ্য সরানো হয়, যাতে ডেটা বিশ্লেষণ সঠিক এবং নির্ভুল হয়। ডেটা ক্লিনিং-এর লক্ষ্য হল এমন ডেটা তৈরি করা যা সম্পূর্ণ, সঠিক এবং বিশ্লেষণের জন্য প্রস্তুত থাকে।

Excel-এ ডেটা ক্লিনিং-এর মাধ্যমে ডেটার গুণগত মান বৃদ্ধি পায়, এবং এটি সিদ্ধান্ত গ্রহণের জন্য সহায়ক হয়।


Data Cleansing Techniques in Excel

1. ডুপ্লিকেট ডেটা সরানো (Removing Duplicates)

Excel-এ ডুপ্লিকেট এন্ট্রি থাকা ডেটা বিশ্লেষণের জন্য সমস্যা সৃষ্টি করতে পারে। ডুপ্লিকেট ডেটা সরানোর জন্য:

ধাপ:

  • ডেটা সিলেক্ট করুন।
  • Data ট্যাবে গিয়ে Remove Duplicates অপশন সিলেক্ট করুন।
  • ডুপ্লিকেট সরানোর জন্য কোন কলামগুলো চেক করতে চান তা নির্বাচন করুন এবং OK ক্লিক করুন।

2. মিসিং ডেটা পূর্ণ করা (Filling Missing Data)

ডেটায় যদি কোন সেল খালি থাকে, তাহলে সেটা পূর্ণ করার জন্য কয়েকটি পদ্ধতি আছে:

  • গড় মান দিয়ে পূর্ণ করা (Filling with Average): আপনি গড় মান দিয়ে খালি সেল পূর্ণ করতে পারেন।
    • উদাহরণ: =AVERAGE(A2:A10)
  • সামান্য মান দিয়ে পূর্ণ করা (Filling with Specific Value): কিছু ক্ষেত্রে আপনি বিশেষ মান (যেমন: 0 বা "N/A") দিয়ে খালি সেল পূর্ণ করতে পারেন।

ধাপ:

  • Go To Special অপশনে গিয়ে Blanks সিলেক্ট করুন।
  • সেল পূর্ণ করার জন্য যে মান ইনপুট করতে চান তা টাইপ করুন এবং Ctrl + Enter চাপুন।

3. ইরর ভ্যালু (Error Values) ঠিক করা (Correcting Error Values)

Excel-এ কখনো কখনো #DIV/0!, #N/A, #VALUE! ইরর দেখা যেতে পারে। এগুলো ম্যানুয়ালি বা IFERROR ফাংশন ব্যবহার করে সংশোধন করা যায়।

ধাপ:

  • IFERROR ফাংশন ব্যবহার করে ইরর ভ্যালু আটকানো যায়:
    • =IFERROR(A1/B1, 0) – যদি ভাগফলে ইরর হয়, তাহলে ০ দেখাবে।

4. ডেটার টাইপ ঠিক করা (Fixing Data Types)

ডেটার টাইপ সঠিক না হলে বিশ্লেষণ সঠিকভাবে করা যায় না। Excel-এ সঠিক ডেটা টাইপ যেমন সংখ্যা, তারিখ বা টেক্সট সেট করা জরুরি।

ধাপ:

  • সেল সিলেক্ট করে Home ট্যাব থেকে Number Format সঠিকভাবে নির্বাচন করুন।

5. ডেটা ফরম্যাটিং (Data Formatting)

ডেটা ফরম্যাট সঠিকভাবে করা ডেটার গুণগত মান নিশ্চিত করে। এটি সংখ্যা, তারিখ বা টেক্সট ফরম্যাট সঠিকভাবে ব্যবহার করতে সাহায্য করে।

ধাপ:

  • Home ট্যাব থেকে Number Format ব্যবহার করে সঠিক ফরম্যাট নির্বাচন করুন।
  • Text to Columns অপশন ব্যবহার করে এক সেলে মিশ্র ডেটা আলাদা করা যায়।

Data Transformation Techniques in Excel

Data Transformation বা ডেটা রূপান্তর হলো ডেটাকে এক ফরম্যাট থেকে অন্য ফরম্যাটে পরিবর্তন করার প্রক্রিয়া। এটি ডেটার কার্যকারিতা এবং বিশ্লেষণ সক্ষমতা উন্নত করতে সহায়তা করে।

1. ডেটা স্ট্যান্ডার্ডাইজেশন (Data Standardization)

ডেটা স্ট্যান্ডারাইজেশন ব্যবহার করে আপনি ডেটাকে একটি নির্দিষ্ট ফরম্যাটে নিয়ে আসেন। উদাহরণস্বরূপ, তারিখের জন্য একটি নির্দিষ্ট ফরম্যাট ব্যবহার করা।

ধাপ:

  • TEXT ফাংশন ব্যবহার করে ডেটা স্ট্যান্ডার্ডাইজ করা যায়, যেমন:
    • =TEXT(A1, "dd-mm-yyyy") – এটি A1 সেলে তারিখকে "dd-mm-yyyy" ফরম্যাটে প্রদর্শন করবে।

2. ডেটা ইউনিফিকেশন (Data Unification)

এটি একাধিক সোর্স থেকে একযোগে ডেটা একত্রিত করতে ব্যবহৃত হয়। যেমন, একাধিক শীটের ডেটা একত্রিত করে একটি শীটে আনতে।

ধাপ:

  • Power Query ব্যবহার করে একাধিক সোর্স থেকে ডেটা একত্রিত করা যেতে পারে।
  • Consolidate টুল ব্যবহার করে একাধিক রেঞ্জ থেকে ডেটা সংগ্রহ করা যায়।

3. টেক্সট ডেটা বিভাজন (Text Data Splitting)

এক সেলে যদি একাধিক মান থাকে, তবে সেগুলো আলাদা করা যায়। যেমন, নাম এবং পদবি আলাদা করা।

ধাপ:

  • Text to Columns ফিচার ব্যবহার করুন:
    • Data ট্যাবে গিয়ে Text to Columns নির্বাচন করুন এবং Delimited বা Fixed Width অপশন নির্বাচন করুন।
    • সেলগুলোর মধ্যে স্পেস বা কমা দিয়ে ডেটা বিভাজন করুন।

4. কনক্যাটেনেশন (Concatenation)

কিছু ক্ষেত্রে, আলাদা সেল বা টেক্সটের মান একত্রিত করতে হয়। Excel-এ এই কাজ CONCATENATE বা & অপারেটর দিয়ে করা যায়।

ধাপ:

  • CONCATENATE ফাংশন ব্যবহার:
    • =CONCATENATE(A1, " ", B1) – এটি A1 এবং B1 সেলের টেক্সট একত্রিত করবে, তাদের মাঝে একটি স্পেস দিয়ে।

5. ডেটা র্যাংকিং (Data Ranking)

কোনো নির্দিষ্ট ডেটা রেঞ্জের মধ্যে র্যাংক তৈরি করা। Excel-এ RANK ফাংশন ব্যবহার করে ডেটার র্যাংক তৈরি করা যায়।

ধাপ:

  • RANK ফাংশন ব্যবহার:
    • =RANK(A2, A$2:A$10) – এটি A2 সেলের মানকে A2:A10 রেঞ্জে র্যাংক করবে।

6. Pivot Table তৈরি করা (Creating Pivot Table)

Pivot Table ব্যবহার করে আপনি ডেটাকে সহজে রূপান্তর করতে পারেন এবং বিভিন্ন দৃষ্টিকোণ থেকে বিশ্লেষণ করতে পারেন।

ধাপ:

  • Insert ট্যাব থেকে PivotTable নির্বাচন করুন।
  • একটি রেঞ্জ নির্বাচন করুন এবং পিভট টেবিল তৈরি করুন।
  • তারপর প্রয়োজনীয় ফিল্ডগুলো পিভট টেবিলের মধ্যে এনে ডেটা বিশ্লেষণ করুন।

Data Cleansing এবং Data Transformation এর উপকারিতা

  1. সঠিক বিশ্লেষণ: পরিষ্কার এবং সঠিকভাবে রূপান্তরিত ডেটা থেকে সঠিক বিশ্লেষণ করা যায়।
  2. বিশ্বস্ত সিদ্ধান্ত গ্রহণ: পরিস্কার ডেটা ব্যবহার করে ব্যবসায়িক সিদ্ধান্ত দ্রুত এবং কার্যকরী হয়।
  3. ডেটার গুণগত মান বৃদ্ধি: ভুল বা অসম্পূর্ণ ডেটা সরিয়ে গুণগত মান বৃদ্ধি করা হয়।
  4. ডেটার ব্যবহারযোগ্যতা: ডেটা রূপান্তর এবং স্ট্যান্ডার্ডাইজেশন ডেটাকে আরও কার্যকরী করে তোলে।
  5. সময় বাঁচানো: ক্লিনড এবং রূপান্তরিত ডেটা দ্রুত বিশ্লেষণ করা সম্ভব হয়, যা সময় বাঁচায়।

Excel-এ Data Cleansing এবং Data Transformation Techniques প্রয়োগ করে আপনি আপনার ডেটা বিশ্লেষণের জন্য প্রস্তুত করতে পারেন, যা সঠিক সিদ্ধান্ত গ্রহণে সহায়তা করবে।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...