Big Data and Analytics Percentiles এবং Quartiles এর ধারণা গাইড ও নোট

444

Percentiles এবং Quartiles উভয়ই পরিসংখ্যানের গুরুত্বপূর্ণ ধারণা, যা একটি ডেটা সেটের বন্টন বুঝতে এবং বিশ্লেষণ করতে ব্যবহৃত হয়। এই ধারণাগুলি ডেটার একটি নির্দিষ্ট ভাগ বা অংশকে চিহ্নিত করতে সাহায্য করে, যা বিশেষত বড় ডেটা সেট বিশ্লেষণের জন্য উপকারী।


১. Percentiles (শতাংশ)

Percentiles হল ডেটা সেটের নির্দিষ্ট শতকরা অংশ নির্দেশকারী মান। একটি নির্দিষ্ট শতাংশ ডেটার মানকে পার করার জন্য একটি নির্দিষ্ট পয়েন্ট বা ভ্যালু নির্ধারণ করা হয়। অর্থাৎ, যখন একটি ডেটা সেটের শতকরা অংশ বের করা হয়, তখন আমরা percentiles ব্যবহার করি। উদাহরণস্বরূপ, ৫০তম পারসেন্টাইল মানে হলো এমন একটি মান, যেখানে ৫০% ডেটা এর নিচে এবং ৫০% ডেটা এর উপরে থাকে।

Percentiles এর উদাহরণ:

ধরা যাক, একটি ছাত্রদের পরীক্ষার স্কোরের ডেটা রয়েছে, যার মধ্যে ১০০ জন ছাত্রের নম্বর রয়েছে। এখন, ২৫তম পারসেন্টাইল মানে হবে এমন একটি স্কোর, যেখানে ২৫% ছাত্রের স্কোর তার নিচে এবং ৭৫% ছাত্রের স্কোর তার উপরে থাকবে।

  • পঞ্চম পারসেন্টাইল (5th Percentile): ডেটার প্রথম ৫% এর মধ্যে থাকা মান।
  • ৯৫তম পারসেন্টাইল (95th Percentile): ডেটার ৯৫% এর মধ্যে থাকা মান।

এই পদ্ধতিতে, Percentiles ডেটাকে ছোট ছোট ভাগে ভাগ করতে সাহায্য করে, যা ডেটার বৈশিষ্ট্য বা প্রবণতা বুঝতে সহায়ক।


২. Quartiles (চতুর্থাংশ)

Quartiles একটি ডেটা সেটকে ৪টি সমান অংশে ভাগ করে। এটি একটি বিশেষ ধরনের পারসেন্টাইল, যেখানে ডেটাকে ৪টি সমান ভাগে বিভক্ত করা হয় এবং প্রতিটি ভাগের মধ্যে ২৫% ডেটা থাকে। তিনটি প্রধান Quartiles রয়েছে:

  1. Q1 (প্রথম চতুর্থাংশ বা Lower Quartile): এটি ২৫তম পারসেন্টাইল (P25) হিসেবে পরিচিত, যেখানে ডেটার ২৫% অংশ এই মানের নিচে এবং ৭৫% অংশ এই মানের উপরে থাকে।
  2. Q2 (দ্বিতীয় চতুর্থাংশ বা Median): এটি ৫০তম পারসেন্টাইল (P50) হিসেবে পরিচিত, যা ডেটা সেটের মধ্যম মান বা Median
  3. Q3 (তৃতীয় চতুর্থাংশ বা Upper Quartile): এটি ৭৫তম পারসেন্টাইল (P75) হিসেবে পরিচিত, যেখানে ডেটার ৭৫% অংশ এই মানের নিচে এবং ২৫% অংশ এই মানের উপরে থাকে।

এই তিনটি Quartiles একটি ডেটা সেটের বিভিন্ন অংশের মধ্যে সুষম বিভাজন তৈরি করে এবং ডেটার প্রস্থ বা বিস্তার বুঝতে সাহায্য করে।

Quartiles এর উদাহরণ:

ধরা যাক, একটি পরীক্ষায় ১০টি ছাত্রের নম্বরের ডেটা:

10, 20, 30, 40, 50, 60, 70, 80, 90, 100

এখন, এই ডেটা সেটের Quartiles বের করা:

  • Q1 (প্রথম চতুর্থাংশ): ২৫% ছাত্রের নম্বর ৩০ এর নিচে (25th Percentile), তাই প্রথম চতুর্থাংশ হবে ৩০।
  • Q2 (মাধ্যমিক বা Median): ৫০% ছাত্রের নম্বর ৫৫ এর নিচে (50th Percentile), তাই দ্বিতীয় চতুর্থাংশ হবে ৫৫।
  • Q3 (তৃতীয় চতুর্থাংশ): ৭৫% ছাত্রের নম্বর ৮০ এর নিচে (75th Percentile), তাই তৃতীয় চতুর্থাংশ হবে ৮০।

Percentiles এবং Quartiles এর মধ্যে পার্থক্য

বৈশিষ্ট্যPercentilesQuartiles
সংখ্যাডেটার যেকোনো শতাংশের জন্য নির্ধারিত।তিনটি মূল Quartile (Q1, Q2, Q3)।
বিভাজনডেটাকে শতকরা ভাগে বিভক্ত করা।ডেটাকে ৪টি সমান ভাগে বিভক্ত করা।
উদাহরণ১০ শতাংশ, ২৫ শতাংশ, ৫০ শতাংশ, ৯০ শতাংশ ইত্যাদি।প্রথম চতুর্থাংশ (Q1), দ্বিতীয় চতুর্থাংশ (Q2), তৃতীয় চতুর্থাংশ (Q3)।
ব্যবহারডেটার বিস্তার এবং পার্থক্য বুঝতে।ডেটার মধ্যে বৈচিত্র্য বা কেন্দ্রীকরণের পরিসীমা বুঝতে।

সারাংশ

Percentiles এবং Quartiles ডেটার বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে। Percentiles ডেটার শতকরা ভাগের মাধ্যমে একটি নির্দিষ্ট মান নির্ধারণ করে, যেখানে Quartiles ডেটাকে চারটি সমান অংশে ভাগ করে। Percentiles ডেটার বিস্তার বা বৈশিষ্ট্য বোঝাতে ব্যবহৃত হয়, এবং Quartiles ডেটার মধ্যম বা সেন্ট্রাল টেন্ডেন্স নির্ধারণে সহায়ক।

Content added By
Promotion

Are you sure to start over?

Loading...