Power Query এর মাধ্যমে Data Preparation এবং Data Cleaning

Data Import এবং Data Preparation - এক্সেল পাওয়ার পিভট (Excel Power Pivot) - Big Data and Analytics

242

Power Query হলো Excel-এর একটি শক্তিশালী টুল, যা ডেটা প্রিপারেশন (Data Preparation) এবং ডেটা ক্লিনিং (Data Cleaning) এর জন্য ব্যবহৃত হয়। Power Query ব্যবহার করে আপনি বিভিন্ন সোর্স থেকে ডেটা ইম্পোর্ট (Import) করতে পারেন এবং তা পরিশোধিত (Clean) ও প্রস্তুত (Prepare) করে Power Pivot বা অন্যান্য এক্সেল ফিচারগুলির সাথে বিশ্লেষণের জন্য ব্যবহার করতে পারেন। Power Query এর সাহায্যে আপনি ডেটা সংক্রান্ত বিভিন্ন কাজ যেমন মিসিং ভ্যালু (Missing Values), ডুপ্লিকেট (Duplicates), ডেটা ফিল্টারিং এবং সেগমেন্টেশন ইত্যাদি সহজে সম্পাদন করতে পারবেন।


Power Query এর মাধ্যমে Data Preparation এবং Data Cleaning এর ধাপসমূহ

১. Power Query Editor খুলুন

Power Query ব্যবহার করতে হলে প্রথমে Power Query Editor খুলতে হবে:

  • Data ট্যাবে যান।
  • Get & Transform Data গ্রুপের মধ্যে থেকে Get Data অপশন সিলেক্ট করুন।
  • আপনি যে সোর্স থেকে ডেটা ইম্পোর্ট করতে চান তা নির্বাচন করুন (যেমন: Excel, CSV, Web, Database ইত্যাদি)।
  • সোর্স নির্বাচন করার পর, Transform Data ক্লিক করলে Power Query Editor ওপেন হবে।

২. ডেটা ইম্পোর্ট এবং প্রিপারেশন

Power Query দিয়ে আপনি একাধিক সোর্স থেকে ডেটা ইম্পোর্ট করতে পারেন এবং তা একত্রিত (Combine) করে একটি সিংগল টেবিল তৈরি করতে পারেন।

  • Combine ফিচারের মাধ্যমে একাধিক ফাইল বা টেবিল মিশিয়ে একটি একক ডেটা সেট তৈরি করা যায়।
  • আপনি যেকোনো ফাইল (যেমন CSV, Excel) থেকে ডেটা নিয়ে আসতে পারবেন এবং এই ডেটাতে একাধিক ট্রান্সফরমেশন (Transformation) প্রয়োগ করতে পারবেন।

৩. ডেটা ক্লিনিং অপারেশন

Power Query এর মাধ্যমে ডেটা ক্লিনিং এর জন্য বেশ কিছু শক্তিশালী টুল পাওয়া যায়:

  • Remove Duplicates: আপনি ডুপ্লিকেট রেকর্ডগুলি সরিয়ে ফেলতে পারেন।
    • "Remove Duplicates" অপশন ব্যবহার করে এক বা একাধিক কলামের ভিত্তিতে ডুপ্লিকেট রেকর্ড মুছে ফেলা যায়।
  • Remove Errors: ভুল ডেটা বা ত্রুটিপূর্ণ (Error) ভ্যালু মুছে ফেলতে পারেন।
    • "Remove Errors" ব্যবহার করে অপ্রয়োজনীয় বা ভুল ডেটা সাফ করা যায়।
  • Replace Values: ডেটাতে থাকা নির্দিষ্ট মান বা শব্দগুলো পরিবর্তন (Replace) করা যায়।
    • "Replace Values" ফিচারের মাধ্যমে, যেমন মিসিং মান (null) বা ভুল মান (incorrect values) সহজে প্রতিস্থাপন করা যায়।
  • Fill Missing Values: মিসিং ভ্যালু পূর্ণ করার জন্য Fill Down বা Fill Up অপশন ব্যবহার করা যায়।
  • Trim and Clean: সাদা স্থান (White spaces) বা বিশেষ অক্ষর (Special Characters) অপসারণ করতে ব্যবহার করা হয়।

৪. ডেটা ফিল্টারিং এবং সেগমেন্টেশন

Power Query ব্যবহার করে ডেটার নির্দিষ্ট অংশ ফিল্টার (Filter) এবং সেগমেন্ট (Segment) করা যায়:

  • Filter Rows: নির্দিষ্ট মান, রেঞ্জ বা শর্তের ভিত্তিতে ডেটা ফিল্টার করা যায়। যেমন, কোন নির্দিষ্ট তারিখের বা সেলসের ভ্যালুর মধ্যে ফিল্টার করা।
  • Group By: ডেটাকে গ্রুপ করে আনা যায়, যা পরবর্তীতে বিশ্লেষণের জন্য উপকারী হতে পারে।

৫. কলাম এবং রো অপারেশন

Power Query তে আপনি নতুন কলাম যোগ (Add Column) করতে পারেন এবং পুরনো কলামকে রিমুভ (Remove) করতে পারেন:

  • Add Custom Column: একটি কাস্টম কলাম তৈরি করার মাধ্যমে কাস্টম ক্যালকুলেশন বা হিসাব করা যেতে পারে।
  • Merge Columns: একাধিক কলাম একত্রিত (Merge) করে একটি নতুন কলাম তৈরি করা যায়।

৬. ডেটার টাইপ পরিবর্তন (Change Data Type)

Power Query তে ডেটার টাইপ পরিবর্তন করা সম্ভব:

  • Data Type সিলেক্ট করে ডেটা টাইপ পরিবর্তন (যেমন: টেক্সট, নাম্বার, তারিখ ইত্যাদি) করা যায়, যা পরবর্তী বিশ্লেষণে সহায়ক হয়।

৭. ফাইনাল ডেটা লোড (Load Data)

ডেটা ক্লিনিং এবং ট্রান্সফরমেশন শেষ হলে, আপনি এই ডেটা এক্সেল শিটে বা Power Pivot মডেলে লোড (Load) করতে পারেন:

  • ডেটা লোড করার জন্য Close & Load অপশন ব্যবহার করা হয়, যার মাধ্যমে Power Query এর মাধ্যমে প্রস্তুতকৃত ডেটা এক্সেল শিটে বা ডেটা মডেলে নিয়ে আসা হয়।

Power Query এর মাধ্যমে Data Cleaning এর সুবিধা

১. ডেটা স্বয়ংক্রিয় আপডেট

Power Query দিয়ে আপনি একাধিক সোর্স থেকে ডেটা ইম্পোর্ট এবং ক্লিন করতে পারেন এবং একবার সেট করা ফিল্টার, ট্রান্সফরমেশন বা ক্লিনিং অপারেশন ভবিষ্যতে স্বয়ংক্রিয়ভাবে পুনরায় প্রয়োগ হবে।

২. প্রসেসের স্বচ্ছতা

Power Query আপনাকে ক্লিনিং এবং ট্রান্সফরমেশন এর পুরো প্রক্রিয়া দেখতে এবং বুঝতে সাহায্য করে। এতে আপনি কোনো ধাপে ভুল হলে সহজে সেটি সংশোধন করতে পারবেন।

৩. ডেটার সঠিকতা এবং বিশুদ্ধতা

Power Query দিয়ে ডেটার সঠিকতা নিশ্চিত করা যায় এবং ভুল বা অপ্রাসঙ্গিক ডেটা সরিয়ে দেওয়া যায়, যা বিশ্লেষণের সময় অত্যন্ত গুরুত্বপূর্ণ।

৪. বিভিন্ন সোর্স থেকে ডেটা একত্রিত করা

Power Query দিয়ে একাধিক ডেটা সোর্স একত্রিত করে একটি একক ডেটা সেট তৈরি করা যায়, যা সহজে বিশ্লেষণ করা যায়।


Power Query এক্সেলে ডেটা প্রিপারেশন এবং ক্লিনিংয়ের জন্য একটি অত্যন্ত কার্যকর টুল। এটি ব্যবহার করে আপনি সহজেই ডেটা ইম্পোর্ট, ক্লিন, এবং প্রিপেয়ার করে Power Pivot বা অন্যান্য বিশ্লেষণাত্মক টুলে ব্যবহার করতে পারেন।

Content added By
Promotion

Are you sure to start over?

Loading...