Range, Quartile Deviation এবং Mean Deviation গাইড ও নোট

Big Data and Analytics - পরিসংখ্যান (Statistics) - Measures of Dispersion
532

ডেটার বৈচিত্র্য, বা ডেটা সেটের মধ্যে পার্থক্য এবং বিচ্যুতি, পরিসংখ্যানিক বিশ্লেষণের গুরুত্বপূর্ণ অংশ। এটি সাধারণত Range, Quartile Deviation (QD), এবং Mean Deviation (MD) এর মাধ্যমে পরিমাপ করা হয়। এই পরিসংখ্যানিক পরিমাপগুলো ডেটার বৈচিত্র্য বা স্ক্যাটার সম্পর্কে ধারণা দেয়, যা ডেটার বিস্তার এবং কেন্দ্রীকরণ বুঝতে সহায়ক।


১. Range (রেঞ্জ)

Range হল একটি ডেটা সেটের সর্বোচ্চ এবং সর্বনিম্ন মানের মধ্যে পার্থক্য। এটি একটি সরল এবং মৌলিক পরিসংখ্যানিক পরিমাপ যা ডেটার বিস্তার বা ছড়িয়ে পড়া বোঝাতে ব্যবহৃত হয়।

রেঞ্জ হিসাব করার সূত্র:

Range=Maximum ValueMinimum Value\text{Range} = \text{Maximum Value} - \text{Minimum Value}

ব্যবহার:

  • Range ডেটার বিস্তার বা ভ্যারিয়েশন বুঝতে সহায়ক। এটি সাধারণত প্রথম দৃষ্টিতে ডেটার প্রকৃতি বোঝানোর জন্য ব্যবহার করা হয়।
  • যেহেতু এটি খুব সহজে গণনা করা যায়, এটি দ্রুত ডেটার মূল বৈশিষ্ট্য তুলে ধরে।

উদাহরণ:

ধরা যাক, একটি পরীক্ষায় ছাত্রদের স্কোরগুলো হল: ৪৫, ৬৮, ৭৯, ৯২, ৫৭

  • সর্বোচ্চ স্কোর = ৯২
  • সর্বনিম্ন স্কোর = ৪৫
  • Range = ৯২ - ৪৫ = ৪৭

২. Quartile Deviation (QD) বা Interquartile Range (IQR)

Quartile Deviation (QD), যা Interquartile Range (IQR) নামেও পরিচিত, হল ডেটার মধ্যস্থ ৫০% (Q1 থেকে Q3) মধ্যে পার্থক্য। এটি ডেটার কেন্দ্রীকরণের পার্থক্য বা বিচ্যুতি বুঝতে সাহায্য করে এবং আউটলায়ার বা বিশাল পরিবর্তনগুলোর প্রভাব কমায়।

Quartile Deviation হিসাব করার সূত্র:

Quartile Deviation (QD)=Q3Q12\text{Quartile Deviation (QD)} = \frac{Q3 - Q1}{2}

এখানে,

  • Q1 হল প্রথম কোয়ারটাইল (২৫% পয়েন্ট)
  • Q3 হল তৃতীয় কোয়ারটাইল (৭৫% পয়েন্ট)

ব্যবহার:

  • QD ডেটার মধ্যে কেন্দ্রীকরণ বা ছড়িয়ে পড়া বোঝাতে ব্যবহৃত হয়, বিশেষত যখন আউটলায়ার বা বাইরের ডেটা পয়েন্টগুলি রয়েছে।
  • এটি Range এর তুলনায় বেশি নির্ভুল পরিমাপ, কারণ এটি আউটলায়ারের প্রভাব কমায়।

উদাহরণ:

ধরা যাক, ডেটাসেট: ৫, ৭, ১২, ১৫, ১৮, ২১, ২৫, ২৮, ৩২

  • Q1 (প্রথম কোয়ারটাইল) = ১০.৫
  • Q3 (তৃতীয় কোয়ারটাইল) = ২৪
  • Quartile Deviation (QD) = (২৪ - ১০.৫) / ২ = ৬.৭৫

৩. Mean Deviation (MD)

Mean Deviation (MD) হল ডেটার প্রতিটি মান এবং গড়ের (Mean) মধ্যে পার্থক্যের গড় মান। এটি ডেটার থেকে গড়ের বিচ্যুতি বা ছড়িয়ে পড়া মাপতে ব্যবহৃত হয়।

Mean Deviation হিসাব করার সূত্র:

Mean Deviation (MD)=XiXN\text{Mean Deviation (MD)} = \frac{\sum |X_i - \overline{X}|}{N}

এখানে,

  • XiX_i হলো ডেটার প্রতিটি মান
  • X\overline{X} হলো গড় মান
  • NN হলো ডেটার মোট সংখ্যা

ব্যবহার:

  • MD ডেটার মধ্যে কতটা বিচ্যুতি বা ভিন্নতা আছে তা বোঝাতে ব্যবহৃত হয়।
  • এটি Range এবং Quartile Deviation এর তুলনায় একটি গড় বিচ্যুতি দেখায়, তবে এটি প্রতিটি মানের বিচ্যুতি বিবেচনা করে।

উদাহরণ:

ধরা যাক, ডেটাসেট: ৩, ৫, ৭, ৯, ১১

  • গড় মান X\overline{X} = (৩ + ৫ + ৭ + ৯ + ১১) / ৫ = ৭
  • MD = 37+57+77+97+1175\frac{|3 - 7| + |5 - 7| + |7 - 7| + |9 - 7| + |11 - 7|}{5} = 4+2+0+2+45\frac{4 + 2 + 0 + 2 + 4}{5} = 2.4

Range, Quartile Deviation এবং Mean Deviation তুলনা:

বৈশিষ্ট্যRangeQuartile Deviation (QD)Mean Deviation (MD)
ডেটা পদ্ধতিসর্বোচ্চ এবং সর্বনিম্ন মানের পার্থক্যপ্রথম এবং তৃতীয় কোয়ারটাইলের মধ্যবর্তী পার্থক্যগড় এবং ডেটার প্রতিটি মানের মধ্যে পার্থক্য
গণনাখুব সহজ এবং সরলQ1 এবং Q3 থেকে গণনাপ্রতিটি মান এবং গড়ের মধ্যে বিচ্যুতি গণনা
প্রভাবিত হয়আউটলায়ার দ্বারাআউটলায়ার কম প্রভাব ফেলেআউটলায়ার দ্বারা কিছুটা প্রভাবিত হয়
ব্যবহারডেটার বিস্তার বুঝতেডেটার কেন্দ্রীকরণের বিচ্যুতি বোঝাতেডেটার গড়ের কাছাকাছি মানের বিচ্যুতি বুঝতে

সারাংশ

Range, Quartile Deviation, এবং Mean Deviation তিনটি গুরুত্বপূর্ণ পরিসংখ্যানিক পরিমাপ যা ডেটার বৈচিত্র্য এবং বিস্তার বোঝাতে ব্যবহৃত হয়। Range ডেটার সর্বোচ্চ এবং সর্বনিম্ন মানের মধ্যে পার্থক্য বোঝায়, Quartile Deviation (QD) ডেটার মধ্যস্থ ৫০% এর মধ্যে পার্থক্য বোঝায়, এবং Mean Deviation (MD) গড় থেকে প্রতিটি ডেটার বিচ্যুতি বোঝাতে ব্যবহৃত হয়। এই পরিসংখ্যানিক পরিমাপগুলো ডেটার বৈচিত্র্য এবং কেন্দ্রীকরণ সম্পর্কে স্পষ্ট ধারণা দেয়।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...