Tableau Prep একটি শক্তিশালী টুল যা ডেটা প্রস্তুতি (data preparation) এবং ডেটা রূপান্তর (data shaping) করতে সহায়তা করে। এটি ডেটা ক্লিনিং, ট্রান্সফরমেশন এবং রূপান্তর সহজ এবং দ্রুত করতে ব্যবহৃত হয়, যার মাধ্যমে Tableau-তে বিশ্লেষণের জন্য সঠিক ডেটা প্রস্তুত করা যায়। Data Cleaning এবং Shaping হল এই প্রক্রিয়াগুলির দুটি প্রধান অংশ, যার মাধ্যমে আপনি ডেটার গুণগত মান নিশ্চিত করতে পারেন।
1. Data Cleaning Techniques in Tableau Prep
Data Cleaning হল ডেটার মধ্যে ভুল, অসম্পূর্ণ বা অপ্রয়োজনীয় মানগুলিকে চিহ্নিত এবং সংশোধন করার প্রক্রিয়া। Tableau Prep এই প্রক্রিয়া সহজ এবং কার্যকরী করে তোলে।
১.১. Null Values Handling
ডেটাতে শূন্য বা Null মান থাকতে পারে, যা বিশ্লেষণের জন্য সমস্যা সৃষ্টি করতে পারে। Tableau Prep আপনাকে শূন্য মান চিহ্নিত করে এবং সেগুলি পূর্ণ বা বাদ দিতে সহায়তা করে।
Steps:
- Null Values চিহ্নিত করা: Tableau Prep ডেটার কোন অংশে Null রয়েছে তা Data Pane-এ বা ভিউতে দেখতে পারেন।
- Null পূর্ণ করা: আপনি Data Pane থেকে Null মান পূর্ণ করার জন্য Fill অপশন ব্যবহার করতে পারেন। উদাহরণস্বরূপ, গড় বা মিডিয়ান দিয়ে Null মান পূর্ণ করা যেতে পারে।
- Null বাদ দেওয়া: যদি কোনো কলামে অনেক Null মান থাকে, তাহলে আপনি সেই কলামটিকে সম্পূর্ণভাবে বাদ দিতে পারেন।
১.২. Remove Duplicates
ডেটাতে যদি ডুপ্লিকেট রেকর্ড থাকে, তবে সেগুলি ডেটার বিশ্লেষণ এবং ভিজুয়ালাইজেশনে সমস্যা সৃষ্টি করতে পারে। Tableau Prep সহজেই ডুপ্লিকেট রেকর্ড মুছে ফেলতে সাহায্য করে।
Steps:
- Duplicate Detection: Tableau Prep-এ ডেটার ভিউ দেখতে পারেন, এবং কোন কোন রেকর্ড ডুপ্লিকেট তা চিহ্নিত করতে পারেন।
- Remove Duplicates: Remove Duplicate অপশন ব্যবহার করে ডেটার যেসব অংশে ডুপ্লিকেট রয়েছে, সেগুলি মুছে ফেলতে পারেন।
১.৩. Standardize Data
ডেটার মধ্যে একক মান বা ফরম্যাট ব্যবহার না হলে, এটি বিশ্লেষণে জটিলতা সৃষ্টি করতে পারে। Tableau Prep ব্যবহার করে আপনি ডেটার মান স্ট্যান্ডার্ডাইজ করতে পারেন, যেমন টেক্সট ফরম্যাট, ডেট ফরম্যাট ইত্যাদি।
Steps:
- Fixing Case Sensitivity: ডেটার টেক্সট মানের ক্ষেত্রে ক্যাপিটালাইজেশন ঠিক করা (যেমন, "new york" এবং "New York")।
- Trimming Whitespaces: অতিরিক্ত স্পেস দূর করার জন্য Trim ফিচার ব্যবহার করতে পারেন।
- Replace Values: একাধিক মানের পরিবর্তে একটি মান ব্যবহার করতে পারেন (যেমন, 'NYC' কে 'New York' এ রূপান্তর করা)।
১.৪. Outliers Handling
অস্বাভাবিক ডেটা পয়েন্ট বা আউটলাইয়ার চিহ্নিত করা এবং সেগুলি সংশোধন করা খুবই গুরুত্বপূর্ণ। Tableau Prep আপনাকে আউটলাইয়ার চিহ্নিত করতে এবং সেগুলোর মান পরিবর্তন বা বাদ দিতে সাহায্য করে।
Steps:
- Detect Outliers: Data Pane-এ ডেটার বৈশিষ্ট্য অনুযায়ী আউটলাইয়ার দেখতে পারেন।
- Replace Outliers: আউটলাইয়ারের জন্য বিভিন্ন কৌশল ব্যবহার করে ডেটা পরিবর্তন করতে পারেন, যেমন আউটলাইয়ারের পরিবর্তে গড় মান দেওয়া।
2. Data Shaping Techniques in Tableau Prep
Data Shaping হল ডেটাকে সঠিকভাবে রূপান্তর বা সাজানোর প্রক্রিয়া, যাতে ডেটার গঠন বিশ্লেষণের জন্য উপযুক্ত হয়। Tableau Prep এর মাধ্যমে আপনি সহজেই ডেটাকে সঠিক আকারে রূপান্তর করতে পারেন।
২.১. Pivoting Data
Pivoting হল একটি প্রক্রিয়া যার মাধ্যমে আপনি ডেটাকে উল্লম্ব বা অনুভূমিকভাবে পুনর্গঠন করতে পারেন। এটি তখন প্রয়োজনীয় হয় যখন আপনার ডেটা একটি নির্দিষ্ট কাঠামোয় থাকে, কিন্তু আপনাকে একে অন্যভাবে বিশ্লেষণ করতে হবে।
Steps:
- Pivot Columns to Rows: আপনি যদি একাধিক কলামের ডেটাকে একে একে রোতে রূপান্তর করতে চান, তাহলে Pivot অপশন ব্যবহার করুন।
- Pivot Rows to Columns: একইভাবে, আপনি যদি রো থেকে কলামে রূপান্তর করতে চান, তবে Unpivot অপশন ব্যবহার করতে পারেন।
২.২. Joining Data
একাধিক ডেটা সোর্স থেকে ডেটা একত্রিত করা হয় Join এর মাধ্যমে। Tableau Prep তে আপনি সহজেই ডেটা সোর্সগুলোকে একত্রিত করতে পারেন।
Steps:
- Inner Join: দুটি ডেটা সোর্সের মধ্যে শুধুমাত্র মিল থাকা রেকর্ডগুলো একত্রিত করুন।
- Left/Right Join: একটি ডেটা সোর্সের সব রেকর্ড এবং অন্য সোর্সের মিল পাওয়া রেকর্ড নিয়ে কাজ করুন।
- Full Outer Join: দুটি সোর্সের সকল রেকর্ড একত্রিত করুন, এমনকি মিল না থাকলেও।
২.৩. Union Data
Union হল একাধিক ডেটাসেটকে একটি বড় ডেটাসেটের মধ্যে একত্রিত করার পদ্ধতি। আপনি এটি ব্যবহার করে সহজে একাধিক ফাইল বা টেবিলকে একত্রিত করতে পারেন।
Steps:
- Appending Data: একাধিক ডেটা সোর্স বা শীটগুলো একত্রিত করতে Union অপশন ব্যবহার করুন।
- Column Mapping: যখন আপনি ইউনিয়ন করছেন, তখন নিশ্চিত করুন যে সমস্ত কলামের সঠিকভাবে ম্যাপিং করা হয়েছে।
২.৪. Data Aggregation
Aggregation হল ডেটার সারাংশ তৈরি করার প্রক্রিয়া, যেমন গড়, যোগফল, সর্বোচ্চ, সর্বনিম্ন ইত্যাদি।
Steps:
- Group By: একাধিক রেকর্ডের ভিত্তিতে একটি নির্দিষ্ট ফিচারের মান গণনা করতে Group By ব্যবহার করুন।
- Aggregation Functions: যেমন SUM, AVG, MAX, MIN ইত্যাদি ব্যবহার করে ডেটা সংগ্রহ করুন।
3. Using Tableau Prep for Automating Data Workflows
Tableau Prep-এর মাধ্যমে আপনি ডেটা ক্লিনিং এবং শেপিংয়ের কাজকে স্বয়ংক্রিয় করতে পারেন, যা সময় এবং প্রচেষ্টা সাশ্রয়ী হয়।
৩.১. Flow Creation and Scheduling
Tableau Prep-এ আপনি একটি Flow তৈরি করতে পারেন যা ডেটা ক্লিনিং এবং শেপিংয়ের কাজ সম্পন্ন করবে। এই ফ্লোটি পরবর্তী সময়ে স্বয়ংক্রিয়ভাবে রান করানো যেতে পারে।
Steps:
- Create Flow: বিভিন্ন ডেটা প্রিপ্রেশন স্টেপগুলিকে একসাথে একটি Flow-তে সাজান।
- Schedule Flow: Tableau Server বা Tableau Online এ Flow-টি সময় অনুযায়ী রান করানোর জন্য সেট আপ করুন।
৩.২. Publishing to Tableau Server
Tableau Prep-এ তৈরি করা Flow এবং Cleaned Data সহজেই Tableau Server বা Tableau Online-এ পUBLISH করা যেতে পারে, যাতে অন্য ব্যবহারকারীরা এটি ব্যবহার করতে পারে।
Steps:
- Publish Flow: Tableau Prep-এ তৈরি করা Flow বা Cleaned Data টি Tableau Server বা Online এ পUBLISH করুন।
- Monitor and Refresh: সময়ানুযায়ী ফ্লো রিফ্রেশ করার জন্য সেটিংস কনফিগার করুন।
সারাংশ
Tableau Prep হল একটি অত্যন্ত শক্তিশালী টুল যা ডেটার ক্লিনিং এবং শেপিং প্রক্রিয়াকে সহজ, দ্রুত, এবং কার্যকরী করে তোলে। Data Cleaning এবং Shaping করার মাধ্যমে আপনি ডেটাকে বিশ্লেষণের জন্য উপযোগী করে তুলতে পারেন। Pivoting, Joining, Union, এবং Aggregation এর মতো শক্তিশালী ফিচারগুলো ব্যবহার করে আপনি ডেটার কাঠামো পরিবর্তন এবং একত্রিত করতে পারবেন, যা Tableau তে বিশ্লেষণ এবং ভিজুয়ালাইজেশন করার জন্য অত্যন্ত গুরুত্বপূর্ণ। Tableau Prep ব্যবহার করে ডেটা প্রস্তুতির পুরো প্রক্রিয়া সহজে এবং কার্যকরীভাবে করা সম্ভব।
Read more