Median এবং তার ব্যবহার

Measures of Central Tendency - পরিসংখ্যান (Statistics) - Big Data and Analytics

575

মিডিয়ান হল একটি পরিসংখ্যানিক পরিমাপ, যা ডেটার কেন্দ্রস্থল বা মধ্যবিন্দু নির্দেশ করে। এটি এমন একটি মান যা একটি সাজানো ডেটা সেটের মাঝের অবস্থান নির্দেশ করে, যেখানে ডেটার অর্ধেক মান তার থেকে কম এবং অর্ধেক মান তার থেকে বেশি।


মিডিয়ান কীভাবে নির্ধারণ করা হয়?

  1. ডেটা সাজানো: প্রথমে ডেটাকে আকার অনুযায়ী (অথবা মান অনুযায়ী) ছোট থেকে বড় বা বড় থেকে ছোট সাজানো হয়।
  2. মাঝের মান খোঁজা:
    • যদি ডেটার মোট সংখ্যা বিজোড় হয়, তবে মধ্যমানটি হবে সেই সংখ্যাটি যেটি সোজাসুজি মাঝখানে থাকে।
    • যদি ডেটার মোট সংখ্যা যুগল (even) হয়, তবে মধ্যমান হবে মধ্যবর্তী দুটি সংখ্যার গড়।

মিডিয়ান বের করার সূত্র:

বিজোড় সংখ্যা (Odd Number of Data Points):

যখন ডেটার সংখ্যা বিজোড়, তখন মধ্যম মানটি হবে:

মিডিয়ান=(n+12)th ডেটা পয়েন্ট\text{মিডিয়ান} = \left( \frac{n+1}{2} \right)^{th} \text{ ডেটা পয়েন্ট}

এখানে, nn হল মোট ডেটা পয়েন্টের সংখ্যা।

যুগল সংখ্যা (Even Number of Data Points):

যখন ডেটার সংখ্যা যুগল, তখন মিডিয়ান হবে মধ্যবর্তী দুটি মানের গড়:

মিডিয়ান=(n2)th মান+(n2+1)th মান2\text{মিডিয়ান} = \frac{ \left( \frac{n}{2} \right)^{th} \text{ মান} + \left( \frac{n}{2}+1 \right)^{th} \text{ মান}}{2}


মিডিয়ান এবং গড়ের (Mean) মধ্যে পার্থক্য:

  • গড় (Mean): গড় ডেটার সমস্ত মান যোগ করে এবং তা মোট ডেটার সংখ্যা দ্বারা ভাগ করে নির্ধারণ করা হয়। এটি সংবেদনশীল হতে পারে যদি ডেটাতে কোনো এক্সট্রিম মান (অ্যাওট্লায়ার) থাকে।
  • মিডিয়ান (Median): মিডিয়ান ডেটার মধ্যবর্তী মান, এবং এটি এক্সট্রিম মানের প্রভাব থেকে মুক্ত থাকে। এটি ডেটার প্রকৃত কেন্দ্রে স্থান নির্দেশ করে, যা ডেটার গড়ের চেয়ে অনেক বেশি নির্ভুল হতে পারে যদি ডেটাতে বড় গড় পরিবর্তন ঘটে।

মিডিয়ান এর ব্যবহার:

১. ডেটার বিতরণ বুঝতে:

মিডিয়ান সাধারণত ডেটার প্রকৃত কেন্দ্রস্থল চিহ্নিত করতে ব্যবহৃত হয়। বিশেষ করে, যখন ডেটার মধ্যে কিছু এক্সট্রিম বা আউটলায়ার মান থাকে, তখন মিডিয়ান গড়ের চেয়ে বেশি প্রযোজ্য এবং বিশ্বাসযোগ্য হয়।

  • উদাহরণ: একটি শহরের গড় আয় যদি অনেক বড় আয়ের লোক দ্বারা প্রভাবিত হয়, তবে গড়ের তুলনায় মিডিয়ান আয় শহরের সাধারণ মানুষের জন্য আরো সত্যি প্রতিফলিত করবে।

২. গড় থেকে বিক্ষিপ্ত ডেটা বিশ্লেষণ:

যখন ডেটা খুব বেশি ছড়িয়ে থাকে বা অসমানভাবে বিতরণ হয়, তখন গড়ের তুলনায় মিডিয়ান আরও ভালো একটি সূচক হিসেবে কাজ করে, কারণ এটি ডেটার কেন্দ্রস্থল নির্ধারণ করতে সক্ষম।

  • উদাহরণ: একটি ব্যবসার পণ্য বিক্রির সংখ্যা যদি মাসে মাসে পরিবর্তিত হয় এবং কিছু মাসে বিক্রির সংখ্যা অত্যন্ত বেশি থাকে, তবে গড় বিক্রির সংখ্যা বিভ্রান্তিকর হতে পারে, কিন্তু মিডিয়ান বিক্রি ডেটার প্রকৃত প্রতিফলন দেবে।

৩. গণনা এবং পরিসংখ্যানিক প্রতিবেদন:

ডেটার কেন্দ্রীয় প্রবণতা নির্ধারণের জন্য মিডিয়ান একটি গুরুত্বপূর্ণ টুল। এটি ব্যবহার করা হয় যখন ডেটার আকার বা গণনা সম্পর্কিত বিভিন্ন তুলনা করতে হয়।

  • উদাহরণ: জনসংখ্যা বা আয় সম্পর্কিত প্রতিবেদন তৈরি করতে মিডিয়ান ব্যবহার করা হয়, যেখানে অতিরিক্ত আয়ের প্রভাব কমিয়ে প্রকৃত গড় আয় জানানো হয়।

৪. সামাজিক বা অর্থনৈতিক গবেষণায়:

সামাজিক বা অর্থনৈতিক গবেষণায় ডেটা সেটের ভারসাম্য (সমতা) বা অসামঞ্জস্য নির্ধারণ করতে মিডিয়ান ব্যবহৃত হয়। এটি নিশ্চিত করে যে এক্সট্রিম ভ্যালু কিংবা আউটলায়ার তথ্য গবেষণার ফলাফলে প্রভাব ফেলছে না।

  • উদাহরণ: একটি দেশের গড় আয় পরিসংখ্যানের ক্ষেত্রে, অধিক আয়ের একটি ছোট গোষ্ঠী গড় আয়কে প্রভাবিত করতে পারে, তবে মিডিয়ান আয়ের পরিসংখ্যান অধিক সঠিক এবং গ্রহণযোগ্য।

মিডিয়ান এর কিছু উদাহরণ:

  1. আয় (Income): যদি একটি গ্রামের ১০ জন লোকের আয়ের পরিসংখ্যান হয়: ২০,০০০, ২৫,০০০, ৩০,০০০, ৫০,০০০, ১,০০,০০০, ১,৫০০,০০০, ২,০০,০০০, ৩,০০,০০০, ৪,০০,০০০, ১০,০০,০০০, তাহলে, আয়ের মিডিয়ান হবে ৫০,০০০, যা গড় থেকে বেশি প্রতিনিধিত্বমূলক।
  2. শিক্ষার্থী পরীক্ষার ফলাফল: ১০ জন শিক্ষার্থীর পরীক্ষার নম্বর: ৫৫, ৬০, ৬৫, ৭০, ৭৫, ৮০, ৮৫, ৯০, ৯৫, ১০০। এখানে, মিডিয়ান হবে ৭৫ (মধ্যম মান)।

সারাংশ

মিডিয়ান একটি ডেটা সেটের কেন্দ্রীয় মানের প্রতিনিধিত্ব করে এবং এটি গড়ের তুলনায় অধিক নির্ভুল হতে পারে, বিশেষত যখন ডেটাতে এক্সট্রিম বা আউটলায়ার মান থাকে। মিডিয়ান ব্যবহার করা হয় ডেটার প্রকৃত কেন্দ্রে স্থান নির্ধারণে এবং যখন ডেটার মধ্যে বিভ্রান্তি বা ছড়িয়ে পড়া বেশি থাকে। এটি পরিসংখ্যান, গবেষণা, অর্থনীতি এবং সামাজিক বিশ্লেষণে একটি গুরুত্বপূর্ণ টুল।

Content added By
Promotion

Are you sure to start over?

Loading...