Skewness হলো একটি পরিসংখ্যানিক পরিমাপ যা একটি ডেটাসেটের বণ্টন (distribution) এর অস্বাভাবিকতা বা অসমতা বোঝায়। এটি ডেটার বণ্টনের কেন্দ্রের (mean, median, mode) আশেপাশে কতটা ভারসাম্যহীনতা বা অস্বাভাবিকতা রয়েছে তা নির্ধারণ করতে সাহায্য করে। অর্থাৎ, Skewness একটি ডেটাসেটের বণ্টন কতটা বামে বা ডানে ঝুঁকে (asymmetric) আছে তা পরিমাপ করে।
ডেটার skewness তিন ধরনের হতে পারে:
- Positive Skew (ডান দিকে ঝুঁকে থাকা)
- Negative Skew (বাম দিকে ঝুঁকে থাকা)
- Symmetrical Distribution (সামঞ্জস্যপূর্ণ বণ্টন)
১. Positive Skew (ডান দিকে ঝুঁকে থাকা)
যখন একটি ডেটাসেটের বণ্টন ডান দিকে ঝুঁকে থাকে, অর্থাৎ ডেটার অধিকাংশ মান বামদিকে কেন্দ্রীভূত থাকে এবং ডানদিকে কিছু মাত্র বড় মান বা আউটলাইয়ার থাকে, তখন Positive Skew বা Right Skew বলা হয়।
বৈশিষ্ট্য:
- Mean > Median > Mode
- ডেটা অনেকটা বাম দিকে জমা থাকে এবং ডানদিকে এক বা একাধিক বড় মান থাকে।
- ডিস্ট্রিবিউশনটি একটি লম্বা ডানদিকে "tail" তৈরি করে, যা ডেটার বেশ কিছু বড় মান বা আউটলাইয়ার দ্বারা প্রভাবিত হয়।
উদাহরণ:
- আয়ের ডেটা: সাধারণত, বেশিরভাগ লোকের আয় একই পরিসরে থাকে, কিন্তু কিছু মানুষের আয় অনেক বেশি থাকে, যেমন একটি বড় কোম্পানির সিইও। এই কারণে আয়ের বণ্টন ডান দিকে ঝুঁকে থাকতে পারে।
২. Negative Skew (বাম দিকে ঝুঁকে থাকা)
যখন একটি ডেটাসেটের বণ্টন বাম দিকে ঝুঁকে থাকে, অর্থাৎ ডেটার অধিকাংশ মান ডানদিকে কেন্দ্রীভূত থাকে এবং বামদিকে কিছু মাত্র ছোট মান বা আউটলাইয়ার থাকে, তখন Negative Skew বা Left Skew বলা হয়।
বৈশিষ্ট্য:
- Mean < Median < Mode
- ডেটা অধিকাংশ ক্ষেত্রেই ডান দিকে জমা থাকে এবং বামদিকে এক বা একাধিক ছোট মান থাকে।
- ডিস্ট্রিবিউশনটি একটি লম্বা বাম দিকে "tail" তৈরি করে, যা ডেটার ছোট মান বা আউটলাইয়ার দ্বারা প্রভাবিত হয়।
উদাহরণ:
- পরীক্ষার ফলাফল: একটি ক্লাসে বেশিরভাগ ছাত্রের নম্বর উচ্চ হতে পারে, কিন্তু কিছু ছাত্রের নম্বর অনেক কম থাকতে পারে, ফলে পরীক্ষার ফলাফলের বণ্টন বাম দিকে ঝুঁকে থাকবে।
৩. Symmetrical Distribution (সামঞ্জস্যপূর্ণ বণ্টন)
যখন একটি ডেটাসেটের বণ্টন সামঞ্জস্যপূর্ণ (Symmetrical) হয়, অর্থাৎ ডেটার মান গুলি কেন্দ্রের চারপাশে সমানভাবে ছড়িয়ে থাকে, তখন এটি একটি Symmetrical Distribution। এতে কোন সুস্পষ্ট ঝুঁকির দিকে প্রবণতা থাকে না।
বৈশিষ্ট্য:
- Mean = Median = Mode
- ডেটার মান গুলি সমানভাবে কেন্দ্রীভূত থাকে এবং বাম এবং ডান দিকে সমানভাবে বিতরণ হয়।
- সাধারণত এটি একটি সোজা সেন্ট্রাল পিকের মতো হয় এবং এর "tail" দুটি দিকে সমানভাবে বিস্তৃত থাকে।
উদাহরণ:
- Normal Distribution (নরমাল বণ্টন): একটি সিমেট্রিক্যাল বণ্টনের সবচেয়ে জনপ্রিয় উদাহরণ হল নরমাল বণ্টন, যেখানে ডেটা সেন্ট্রাল পিকের চারপাশে সমানভাবে ছড়িয়ে থাকে (যেমন, উচ্চতা, ওজন ইত্যাদি)।
Skewness এর প্রভাব এবং ব্যাখ্যা
- Positive Skew (ডান দিকে ঝুঁকে থাকা):
- Mean সাধারণত Median এর চেয়ে বেশি হবে।
- কিছু আউটলাইয়ার বা বড় মান ডেটার ডান দিকে বাড়তি প্রভাব ফেলতে পারে।
- উদাহরণস্বরূপ, আয়ের ক্ষেত্রে কিছু লোকের আয় অনেক বেশি হতে পারে, যা বণ্টনকে ডান দিকে ঝুঁকিয়ে দেয়।
- Negative Skew (বাম দিকে ঝুঁকে থাকা):
- Mean সাধারণত Median এর চেয়ে কম হবে।
- কিছু আউটলাইয়ার বা ছোট মান ডেটার বাম দিকে বাড়তি প্রভাব ফেলতে পারে।
- উদাহরণস্বরূপ, শিক্ষার্থীদের পরীক্ষার ফলাফল, যেখানে বেশিরভাগ ছাত্রের নম্বর বেশি কিন্তু কিছু ছাত্রের নম্বর অনেক কম।
- Symmetrical Distribution (সামঞ্জস্যপূর্ণ বণ্টন):
- Mean, Median এবং Mode সবই সমান হয়।
- ডেটার মান সেন্ট্রাল অঞ্চলে সমানভাবে বিতরণ থাকে।
সারাংশ
Skewness ডেটাসেটের বণ্টনের অস্বাভাবিকতা বা অসমতা পরিমাপ করে। Positive Skew বা Right Skew তে ডেটা ডান দিকে ঝুঁকে থাকে এবং Negative Skew বা Left Skew তে ডেটা বাম দিকে ঝুঁকে থাকে। Symmetrical Distribution এমন একটি বণ্টন যেখানে ডেটা সমানভাবে বিতরণ থাকে এবং কোন ঝুঁকির প্রভাব থাকে না। Skewness পরিমাপ ডেটার প্রকৃতি এবং বিশ্লেষণ করতে সহায়ক।
Read more