Variance এবং Standard Deviation এর ব্যবহার

Measures of Dispersion - পরিসংখ্যান (Statistics) - Big Data and Analytics

1.2k

Variance (ভিন্নতা) এবং Standard Deviation (মানদণ্ড) হল পরিসংখ্যানের গুরুত্বপূর্ণ ধারণা, যা ডেটার বিস্তার বা ছড়িয়ে পড়া পরিমাপ করতে ব্যবহৃত হয়। তারা ডেটার বৈচিত্র্য এবং গড়ের চারপাশে ডেটা পয়েন্টগুলোর ছড়িয়ে পড়ার মাত্রা সম্পর্কে ধারণা দেয়। এই দুটি পরিসংখ্যানিক পদ্ধতির মধ্যে সম্পর্ক রয়েছে, তবে তাদের ব্যবহার এবং গণনা কিছুটা আলাদা।


১. Variance (ভিন্নতা)

Variance হল একটি পরিমাপ যা দেখায় ডেটার মধ্যে কতটা বৈচিত্র্য বা পরিবর্তন রয়েছে, অর্থাৎ ডেটা পয়েন্টগুলি গড়ের (mean) থেকে কতটুকু দূরে অবস্থান করছে। এটি গড় থেকে প্রতিটি ডেটা পয়েন্টের বিচ্যুতি (deviation) এর বর্গ যোগ করে এবং সেই যোগফলকে ডেটা পয়েন্টের মোট সংখ্যা দিয়ে ভাগ করে নির্ণীত হয়।

গণনা:

ডেটা পয়েন্টগুলির জন্য ভিন্নতা (variance) গণনা করার জন্য নিচের ফর্মুলা ব্যবহার করা হয়:

Variance(σ2)=(xiμ)2N\text{Variance} (\sigma^2) = \frac{\sum (x_i - \mu)^2}{N}

এখানে:

  • xix_i = প্রতিটি ডেটা পয়েন্ট
  • μ\mu = গড় মান
  • NN = ডেটা পয়েন্টের সংখ্যা

ব্যবহার:

  • Variance মূলত ডেটার বিস্তার বা ছড়িয়ে পড়ার পরিমাপ দেয়। এটি ডেটা সেটের বৈচিত্র্য বা বিচ্যুতি বুঝতে সাহায্য করে।
  • উদাহরণস্বরূপ, যদি একটি স্কুলে শিক্ষার্থীদের পরীক্ষা ফলাফলের variance বেশি হয়, তা হলে বোঝা যায় যে শিক্ষার্থীদের মধ্যে পারফরম্যান্সের পার্থক্য অনেক বেশি।

২. Standard Deviation (মানদণ্ড)

Standard Deviation হল variance এর বর্গমূল। এটি ডেটার বিচ্যুতি বা ছড়িয়ে পড়ার পরিমাপ প্রদান করে এবং ডেটা পয়েন্টগুলো গড়ের কাছাকাছি বা দূরে আছে কি না তা স্পষ্টভাবে বুঝতে সাহায্য করে। স্ট্যান্ডার্ড ডেভিয়েশন সাধারণত variance এর তুলনায় আরও ব্যবহারিক এবং বোঝার জন্য সহজ।

গণনা:

স্ট্যান্ডার্ড ডেভিয়েশন গণনা করার জন্য, প্রথমে variance বের করা হয় এবং তারপর তার বর্গমূল নেওয়া হয়:

Standard Deviation(σ)=(xiμ)2N\text{Standard Deviation} (\sigma) = \sqrt{\frac{\sum (x_i - \mu)^2}{N}}

ব্যবহার:

  • Standard Deviation ডেটার ছড়িয়ে পড়া বা বৈচিত্র্য সম্পর্কে সোজাসুজি ধারণা প্রদান করে। এটি গড় থেকে ডেটা পয়েন্টগুলো কতটা দূরে বা কাছাকাছি অবস্থান করছে তা পরিমাপ করে।
  • Standard Deviation কম হলে বোঝা যায় ডেটা পয়েন্টগুলি গড়ের কাছাকাছি অবস্থান করছে, এবং বেশি হলে ডেটা পয়েন্টগুলো গড় থেকে অনেক দূরে অবস্থান করছে।

Variance এবং Standard Deviation এর মধ্যে সম্পর্ক

  • Variance এবং Standard Deviation একে অপরের সাথে সম্পর্কিত। Standard Deviation হল Variance এর বর্গমূল।
  • Variance একে অপরকে তুলনা করার জন্য একটি পরিমাপ প্রদান করে, কিন্তু এর একক গড়ের একক থেকে ভিন্ন হওয়ার কারণে কিছুটা কঠিন হতে পারে। অপরদিকে, Standard Deviation একই এককে থাকে, যা ডেটা বিশ্লেষণের জন্য সহজতর।

Variance এবং Standard Deviation এর ব্যবহার

১. ডেটার বৈচিত্র্য পরিমাপ করা:

যত বেশি Variance বা Standard Deviation হবে, তত বেশি ডেটা পয়েন্টগুলি গড় থেকে বিচ্যুত হচ্ছে। উদাহরণস্বরূপ, একটি ফাইন্যান্সিয়াল প্রতিষ্ঠান তাদের বিনিয়োগের ঝুঁকি পরিমাপ করতে স্ট্যান্ডার্ড ডেভিয়েশন ব্যবহার করে। যদি স্টকের স্ট্যান্ডার্ড ডেভিয়েশন বেশি হয়, তবে তার মানে হল যে স্টকটির দাম অনেক পরিবর্তিত হতে পারে, যা ঝুঁকি বাড়াতে পারে।

২. গড়ের চারপাশে ডেটা পয়েন্টের ছড়িয়ে পড়া পরিমাপ করা:

Standard Deviation এবং Variance সহায়ক হয় ডেটার মধ্যে ছড়িয়ে পড়া বা বিস্তার সম্পর্কে তথ্য পেতে। এটি একে অপরের তুলনায় পরিমাণগত ডেটা বিশ্লেষণ করতে ব্যবহৃত হয়।

৩. পরিসংখ্যানিক সিদ্ধান্তে সহায়তা করা:

যদি কোন গবেষক বা প্রতিষ্ঠান পরিসংখ্যানিক সিদ্ধান্ত নিতে চায়, তবে Variance এবং Standard Deviation তার জন্য সহায়ক। উদাহরণস্বরূপ, যদি দুটি ডেটাসেটের মধ্যে বেশি Standard Deviation থাকে, তবে এটি নির্দেশ করে যে ডেটাগুলির মধ্যে পার্থক্য বেশি হতে পারে।


Variance এবং Standard Deviation এর উদাহরণ:

  1. শিক্ষা:
    • যদি দুটি স্কুলের পরীক্ষার ফলাফলের স্ট্যান্ডার্ড ডেভিয়েশন একে অপরের তুলনায় বেশি হয়, তবে শিক্ষার্থীদের পারফরম্যান্সের বৈচিত্র্য বেশি। একটি স্কুলের স্ট্যান্ডার্ড ডেভিয়েশন কম হতে পারে, যা নির্দেশ করে যে বেশিরভাগ শিক্ষার্থী গড়ের কাছাকাছি ফলাফল পেয়েছে।
  2. ব্যবসা:
    • একটি কোম্পানির বিক্রয় যদি বেশ স্থিতিশীল হয় (কম স্ট্যান্ডার্ড ডেভিয়েশন), তবে তার মানে কোম্পানির বিক্রয় পূর্বানুমানযোগ্য এবং কম ঝুঁকিপূর্ণ।

সারাংশ

Variance এবং Standard Deviation উভয়ই ডেটার বৈচিত্র্য বা ছড়িয়ে পড়া পরিমাপ করতে ব্যবহৃত হয়। Variance ডেটার গড় থেকে বিচ্যুতির পরিমাপ প্রদান করে, কিন্তু তার একক গড়ের একক থেকে ভিন্ন হওয়ার কারণে কিছুটা জটিল। অন্যদিকে, Standard Deviation হল Variance এর বর্গমূল, যা ডেটার ছড়িয়ে পড়ার পরিমাণ বোঝাতে আরও সহজ এবং বাস্তবিক। উভয়ই পরিসংখ্যানিক বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে এবং ডেটা সেটের বৈচিত্র্য বা স্প্রেড নির্ধারণ করতে সহায়ক।

Content added By
Promotion

Are you sure to start over?

Loading...