Tableau Prep এর মাধ্যমে Data Cleaning এবং Shaping Techniques

Tableau Prep এবং Data Cleaning - ট্যাবলেট ইউ (Tableau) - Big Data and Analytics

263

Tableau Prep একটি শক্তিশালী টুল যা ডেটা প্রস্তুতি (data preparation) এবং ডেটা রূপান্তর (data shaping) করতে সহায়তা করে। এটি ডেটা ক্লিনিং, ট্রান্সফরমেশন এবং রূপান্তর সহজ এবং দ্রুত করতে ব্যবহৃত হয়, যার মাধ্যমে Tableau-তে বিশ্লেষণের জন্য সঠিক ডেটা প্রস্তুত করা যায়। Data Cleaning এবং Shaping হল এই প্রক্রিয়াগুলির দুটি প্রধান অংশ, যার মাধ্যমে আপনি ডেটার গুণগত মান নিশ্চিত করতে পারেন।


1. Data Cleaning Techniques in Tableau Prep

Data Cleaning হল ডেটার মধ্যে ভুল, অসম্পূর্ণ বা অপ্রয়োজনীয় মানগুলিকে চিহ্নিত এবং সংশোধন করার প্রক্রিয়া। Tableau Prep এই প্রক্রিয়া সহজ এবং কার্যকরী করে তোলে।

১.১. Null Values Handling

ডেটাতে শূন্য বা Null মান থাকতে পারে, যা বিশ্লেষণের জন্য সমস্যা সৃষ্টি করতে পারে। Tableau Prep আপনাকে শূন্য মান চিহ্নিত করে এবং সেগুলি পূর্ণ বা বাদ দিতে সহায়তা করে।

Steps:

  • Null Values চিহ্নিত করা: Tableau Prep ডেটার কোন অংশে Null রয়েছে তা Data Pane-এ বা ভিউতে দেখতে পারেন।
  • Null পূর্ণ করা: আপনি Data Pane থেকে Null মান পূর্ণ করার জন্য Fill অপশন ব্যবহার করতে পারেন। উদাহরণস্বরূপ, গড় বা মিডিয়ান দিয়ে Null মান পূর্ণ করা যেতে পারে।
  • Null বাদ দেওয়া: যদি কোনো কলামে অনেক Null মান থাকে, তাহলে আপনি সেই কলামটিকে সম্পূর্ণভাবে বাদ দিতে পারেন।

১.২. Remove Duplicates

ডেটাতে যদি ডুপ্লিকেট রেকর্ড থাকে, তবে সেগুলি ডেটার বিশ্লেষণ এবং ভিজুয়ালাইজেশনে সমস্যা সৃষ্টি করতে পারে। Tableau Prep সহজেই ডুপ্লিকেট রেকর্ড মুছে ফেলতে সাহায্য করে।

Steps:

  • Duplicate Detection: Tableau Prep-এ ডেটার ভিউ দেখতে পারেন, এবং কোন কোন রেকর্ড ডুপ্লিকেট তা চিহ্নিত করতে পারেন।
  • Remove Duplicates: Remove Duplicate অপশন ব্যবহার করে ডেটার যেসব অংশে ডুপ্লিকেট রয়েছে, সেগুলি মুছে ফেলতে পারেন।

১.৩. Standardize Data

ডেটার মধ্যে একক মান বা ফরম্যাট ব্যবহার না হলে, এটি বিশ্লেষণে জটিলতা সৃষ্টি করতে পারে। Tableau Prep ব্যবহার করে আপনি ডেটার মান স্ট্যান্ডার্ডাইজ করতে পারেন, যেমন টেক্সট ফরম্যাট, ডেট ফরম্যাট ইত্যাদি।

Steps:

  • Fixing Case Sensitivity: ডেটার টেক্সট মানের ক্ষেত্রে ক্যাপিটালাইজেশন ঠিক করা (যেমন, "new york" এবং "New York")।
  • Trimming Whitespaces: অতিরিক্ত স্পেস দূর করার জন্য Trim ফিচার ব্যবহার করতে পারেন।
  • Replace Values: একাধিক মানের পরিবর্তে একটি মান ব্যবহার করতে পারেন (যেমন, 'NYC' কে 'New York' এ রূপান্তর করা)।

১.৪. Outliers Handling

অস্বাভাবিক ডেটা পয়েন্ট বা আউটলাইয়ার চিহ্নিত করা এবং সেগুলি সংশোধন করা খুবই গুরুত্বপূর্ণ। Tableau Prep আপনাকে আউটলাইয়ার চিহ্নিত করতে এবং সেগুলোর মান পরিবর্তন বা বাদ দিতে সাহায্য করে।

Steps:

  • Detect Outliers: Data Pane-এ ডেটার বৈশিষ্ট্য অনুযায়ী আউটলাইয়ার দেখতে পারেন।
  • Replace Outliers: আউটলাইয়ারের জন্য বিভিন্ন কৌশল ব্যবহার করে ডেটা পরিবর্তন করতে পারেন, যেমন আউটলাইয়ারের পরিবর্তে গড় মান দেওয়া।

2. Data Shaping Techniques in Tableau Prep

Data Shaping হল ডেটাকে সঠিকভাবে রূপান্তর বা সাজানোর প্রক্রিয়া, যাতে ডেটার গঠন বিশ্লেষণের জন্য উপযুক্ত হয়। Tableau Prep এর মাধ্যমে আপনি সহজেই ডেটাকে সঠিক আকারে রূপান্তর করতে পারেন।

২.১. Pivoting Data

Pivoting হল একটি প্রক্রিয়া যার মাধ্যমে আপনি ডেটাকে উল্লম্ব বা অনুভূমিকভাবে পুনর্গঠন করতে পারেন। এটি তখন প্রয়োজনীয় হয় যখন আপনার ডেটা একটি নির্দিষ্ট কাঠামোয় থাকে, কিন্তু আপনাকে একে অন্যভাবে বিশ্লেষণ করতে হবে।

Steps:

  • Pivot Columns to Rows: আপনি যদি একাধিক কলামের ডেটাকে একে একে রোতে রূপান্তর করতে চান, তাহলে Pivot অপশন ব্যবহার করুন।
  • Pivot Rows to Columns: একইভাবে, আপনি যদি রো থেকে কলামে রূপান্তর করতে চান, তবে Unpivot অপশন ব্যবহার করতে পারেন।

২.২. Joining Data

একাধিক ডেটা সোর্স থেকে ডেটা একত্রিত করা হয় Join এর মাধ্যমে। Tableau Prep তে আপনি সহজেই ডেটা সোর্সগুলোকে একত্রিত করতে পারেন।

Steps:

  • Inner Join: দুটি ডেটা সোর্সের মধ্যে শুধুমাত্র মিল থাকা রেকর্ডগুলো একত্রিত করুন।
  • Left/Right Join: একটি ডেটা সোর্সের সব রেকর্ড এবং অন্য সোর্সের মিল পাওয়া রেকর্ড নিয়ে কাজ করুন।
  • Full Outer Join: দুটি সোর্সের সকল রেকর্ড একত্রিত করুন, এমনকি মিল না থাকলেও।

২.৩. Union Data

Union হল একাধিক ডেটাসেটকে একটি বড় ডেটাসেটের মধ্যে একত্রিত করার পদ্ধতি। আপনি এটি ব্যবহার করে সহজে একাধিক ফাইল বা টেবিলকে একত্রিত করতে পারেন।

Steps:

  • Appending Data: একাধিক ডেটা সোর্স বা শীটগুলো একত্রিত করতে Union অপশন ব্যবহার করুন।
  • Column Mapping: যখন আপনি ইউনিয়ন করছেন, তখন নিশ্চিত করুন যে সমস্ত কলামের সঠিকভাবে ম্যাপিং করা হয়েছে।

২.৪. Data Aggregation

Aggregation হল ডেটার সারাংশ তৈরি করার প্রক্রিয়া, যেমন গড়, যোগফল, সর্বোচ্চ, সর্বনিম্ন ইত্যাদি।

Steps:

  • Group By: একাধিক রেকর্ডের ভিত্তিতে একটি নির্দিষ্ট ফিচারের মান গণনা করতে Group By ব্যবহার করুন।
  • Aggregation Functions: যেমন SUM, AVG, MAX, MIN ইত্যাদি ব্যবহার করে ডেটা সংগ্রহ করুন।

3. Using Tableau Prep for Automating Data Workflows

Tableau Prep-এর মাধ্যমে আপনি ডেটা ক্লিনিং এবং শেপিংয়ের কাজকে স্বয়ংক্রিয় করতে পারেন, যা সময় এবং প্রচেষ্টা সাশ্রয়ী হয়।

৩.১. Flow Creation and Scheduling

Tableau Prep-এ আপনি একটি Flow তৈরি করতে পারেন যা ডেটা ক্লিনিং এবং শেপিংয়ের কাজ সম্পন্ন করবে। এই ফ্লোটি পরবর্তী সময়ে স্বয়ংক্রিয়ভাবে রান করানো যেতে পারে।

Steps:

  • Create Flow: বিভিন্ন ডেটা প্রিপ্রেশন স্টেপগুলিকে একসাথে একটি Flow-তে সাজান।
  • Schedule Flow: Tableau Server বা Tableau Online এ Flow-টি সময় অনুযায়ী রান করানোর জন্য সেট আপ করুন।

৩.২. Publishing to Tableau Server

Tableau Prep-এ তৈরি করা Flow এবং Cleaned Data সহজেই Tableau Server বা Tableau Online-এ পUBLISH করা যেতে পারে, যাতে অন্য ব্যবহারকারীরা এটি ব্যবহার করতে পারে।

Steps:

  • Publish Flow: Tableau Prep-এ তৈরি করা Flow বা Cleaned Data টি Tableau Server বা Online এ পUBLISH করুন।
  • Monitor and Refresh: সময়ানুযায়ী ফ্লো রিফ্রেশ করার জন্য সেটিংস কনফিগার করুন।

সারাংশ

Tableau Prep হল একটি অত্যন্ত শক্তিশালী টুল যা ডেটার ক্লিনিং এবং শেপিং প্রক্রিয়াকে সহজ, দ্রুত, এবং কার্যকরী করে তোলে। Data Cleaning এবং Shaping করার মাধ্যমে আপনি ডেটাকে বিশ্লেষণের জন্য উপযোগী করে তুলতে পারেন। Pivoting, Joining, Union, এবং Aggregation এর মতো শক্তিশালী ফিচারগুলো ব্যবহার করে আপনি ডেটার কাঠামো পরিবর্তন এবং একত্রিত করতে পারবেন, যা Tableau তে বিশ্লেষণ এবং ভিজুয়ালাইজেশন করার জন্য অত্যন্ত গুরুত্বপূর্ণ। Tableau Prep ব্যবহার করে ডেটা প্রস্তুতির পুরো প্রক্রিয়া সহজে এবং কার্যকরীভাবে করা সম্ভব।

Content added By
Promotion

Are you sure to start over?

Loading...