তোমরা ইতোমধ্যেই জেনেছ যে, পরিসংখ্যান নির্দিষ্ট লক্ষ্যে সংগৃহীত উপাত্ত নিয়ে কাজ করে। সংগৃহীত উপাত্ত বিশ্লেষণ ও ব্যাখ্যা করে আমরা কোনো বিষয়ে সিদ্ধান্ত গ্রহণ করে থাকি। পূর্বের শ্রেণিতে তোমরা উপাত্তের লেখচিত্রে উপস্থাপন সম্পর্কে জেনেছ। এই ধরনের উপস্থাপনা উপাত্তের কিছু গুরুত্বপূর্ণ বৈশিষ্ট্য প্রকাশ করে। নিচের ছবিটি লক্ষ করো:
আমাদের হৃদস্পন্দনের হার ও তার ছন্দ পরীক্ষা করার জন্য চিকিৎসকরা ইলেক্ট্রোকার্ডিওগ্রাম বা ইসিজি করে থাকেন, যার গ্রাফ দেখতে অনেকটা এই রকম। আর এই গ্রাফ দেখে চিকিৎসকরা হার্ট অ্যাটাক, হৃদরোগ, অস্বাভাবিক হৃদস্পন্দন ইত্যাদি শনাক্ত করে ব্যবস্থাপত্র দিয়ে থাকেন। তাছাড়া, সংগৃহীত উপাত্তের প্রতিনিধিত্বকারী মান খুঁজে বের করার জন্য তোমরা কেন্দ্রীয় প্রবণতার পরিমাপ সম্পর্কে পূর্বের শ্রেণিগুলোতে ধারাবাহিকভাবে জেনে এসেছ। তবে কোনো বিষয়ে সিদ্ধান্ত গ্রহণের ক্ষেত্রে কেন্দ্রীয় মান আমাদের মোটামুটি একটি ধারণা দেয়। কিন্তু অপেক্ষাকৃত নির্ভুল সিদ্ধান্তের জন্য উপাত্তগুলোকে সূক্ষভাবে বিশ্লেষণ ও ব্যাখ্যা করা প্রয়োজন হয়। সেক্ষেত্রে উপাত্তগুলো কেন্দ্রীয় মানের চারপাশে কীভাবে ছড়িয়ে-ছিটিয়ে আছে, সে সম্পর্কেও আমাদের জানতে হবে।
আমাদের জানতে হবে।
একটি উদাহরণের মাধ্যমে বিষয়টি আলোচনা করা যাক-
তুমিতো জানো, তোমার জেলার স্কুলগুলো নিয়ে প্রতি বছর জেলাভিত্তিক "T - 20 স্কুল ক্রিকেট" প্রতিযোগিতার আয়োজন করা হয়। বরাবরের মতো এবারও তোমাদের স্কুলের ক্রিকেট দল ওই প্রতিযোগিতায় অংশগ্রহণ করে।
ধরো, প্রতিযোগিতায় দশটি ম্যাচে তোমাদের স্কুলের দু'জন ব্যাটসম্যান A ও B করা রান এবং ফাইনাল ম্যাচের নিবেশন সারণি নিম্নরূপ :
ফাইনাল ম্যাচের নিবেশন সারণি
উভয় ব্যাটসম্যানের করা রানের গড় ও মধ্যক নির্ণয় করে কী মান পেলে? দু'জনেরই রানের গড় এবং মধ্যক একই। তোমাদের কী মনে হয়, এই দু'জন খেলোয়াড়ের পারদর্শিতা একই? একেবারেই না। কারণ সমান সংখ্যক ম্যাচ খেলে ব্যাটসম্যান A এর রানের পরিসর (0-117) এবং ব্যাটসম্যান B এর রানের পরিসর (46- 60)। ভেবে দেখো তো দু'জন ব্যাটসম্যানের পারদর্শিতার ধারাবাহিকতার মধ্যে কোনো পার্থক্য আছে কি না? যদি থাকে তবে সংক্ষেপে নিচের খালি বক্সে যুক্তিসহ তোমার মতামত লেখো:
তোমার ভাবনাটির সঠিকতা যাচাইয়ের জন্য চলো উভয় ব্যাটসম্যানের স্কোরগুলো সংখ্যারেখায় বিন্দুর মাধ্যমে বসিয়ে দেখি:
ব্যাটসম্যান A এর স্কোরগুলোর সংখ্যারেখায় উপস্থাপন
উপরের চিত্র দুটি পর্যবেক্ষণ করে আমরা দেখতে পাই, ব্যাটসম্যান B এর স্কোরের বিন্দুগুলো কেন্দ্রীয় মানের (গড় ও মধ্যক) খুব কাছাকাছি অবস্থান করছে। অন্য দিকে ব্যাটসম্যান A এর স্কোরের বিন্দুগুলো কেন্দ্রীয় মান (গড় ও মধ্যক) থেকে অনেক দূরে দূরে ছড়িয়ে ছিটিয়ে আছে, যদিও তাদের রানের গড় ও মধ্যক একই।
সুতরাং আমরা বলতে পারি, কোনো একটি বিষয়ে বস্তুনিষ্ঠ সিদ্ধান্ত গ্রহণের ক্ষেত্রে সংগৃহীত উপাত্তের কেন্দ্রীয় প্রবণতার পরিমাপই যথেষ্ট নয়। কেন্দ্রীয় মানের সাপেক্ষে উপাত্তগুলো বিস্তারও পরিমাপ করা প্রয়োজন। কেননা এটি কেন্দ্রীয় মানের যথার্থতা যাচাই করে। যে তথ্যসারির বিস্তার যত কম তার কেন্দ্রীয় মানগুলো ততো বেশি প্রতিনিধিত্বকারী। বিস্তার তথ্যসারির মানগুলোর সামঞ্জস্যতা পরিমাপ করে। যে তথ্যসারির বিস্তার যত বেশি তার মানগুলো ততো বেশি অসামঞ্জস্যপূর্ণ।
তাই, এই অভিজ্ঞতায় বিস্তার পরিমাপ (Measures of Dispersion) এর গুরুত্ব ও নির্ণয়ের পদ্ধতি সম্পর্কে জানবো।
তোমরা ইতোমধ্যেই জেনেছ, দুই বা ততোধিক তথ্যসারির মধ্যে তুলনা করাই হলো বিস্তার পরিমাপ নির্ণয়ের মূল উদ্দেশ্য। তথ্যসারিগুলোর প্রকৃতির উপর ভিত্তি করে বিভিন্ন প্রকার বিস্তার পরিমাপ ব্যবহার করা হয়। তবে এই শ্রেণিতে আমরা বিভিন্ন প্রকার বিস্তার পরিমাপগুলো থেকে পরিসর, গড় ব্যবধান, ভেদাঙ্ক ও পরিমিত ব্যবধান সম্পর্কে সংক্ষিপ্ত পরিসরে জানার চেষ্টা করব।
পরিসর হলো কোনো তথ্যরাশির বা নিবেশনের বৃহত্তম মান ও ক্ষুদ্রতম মানের ব্যবধান বা পার্থক্য। তবে শ্রেণি বিন্যস্ত উপাত্তের ক্ষেত্রে সর্বশেষ শ্রেণির উচ্চসীমা ও প্রথম শ্রেণির নিম্নসীমার ব্যবধান হবে পরিসর। পরিসরকে সাধারণত R দ্বারা প্রকাশ করা হয়।
একক কাজ: ১
ক)-12, -7, -2, 0, 7, 8 তথ্যসারির পরিসর নির্ণয় করো।
খ) ধরো, গড় মাসে তোমার ক্লাসের 62 জন শিক্ষার্থীর উপস্থিতির শ্রেণি বিন্যস্ত তালিকাটি নিম্নরূপ ছিল।
প্রত্যেকেই নিজ নিজ খাতায় হিসাব করো এবং ফলাফল নিচের বক্সে লেখো:
দৈনন্দিন জীবনে পরিসরের ব্যবহার
আমরা জেনেছি, পরিসর প্রতিনিধিত্বশীল বিস্তার পরিমাপক নয়। তাই এটি ব্যবহারিক জীবনে ঢালাওভাবে খুব একটা ব্যবহৃত হতে দেখা যায় না। তবে বিশেষ কয়েকটি ক্ষেত্রে পরিসরের ব্যবহার অনস্বীকার্য। যেমন:
(i) তোমরা প্রতিদিন রেডিও বা টেলিভিশনে আবহাওয়ার পূর্বাভাস জেনে থাকো। লক্ষ করলে দেখবে বা শুনবে আবহাওয়াবিদগণ দৈনিক তাপমাত্রার বিবরণ দেয়ার সময় গড় তাপমাত্রার কথা না বলে সর্বোচ্চ ও সর্বনিম্ন তাপমাত্রার কথা বলে থাকেন। অর্থাৎ তাঁরা উপাত্তের পরিসর ব্যবহার করে থাকেন।
(ii) তোমরা অনেকেই শেয়ার বাজারের কথা শুনে থাকবে। শেয়ার বাজারে প্রতিনিয়ত শেয়ারের দাম কমে অথবা বাড়ে। তাই শেয়ার ক্রেতা ও বিক্রেতা উভয়কেই শেয়ারের সর্বনিম্ন ও সর্বোচ্চ মূল্যের পরিসর জানতে হয়। শেয়ার মূল্যের পরিসর জানা থাকলে দর কষাকষিতে শেয়ার ক্রেতা ও বিক্রেতার ক্ষতির সম্ভাবনা কম থাকে।
দলগত কাজ:
গড় ব্যবধান (Mean Deviation)
সুতরাং, তোমার ক্লাসে গত আট দিনের শিক্ষার্থীদের অনুপস্থিত সংখ্যাগুলোর গড় 9 এবং গড় ব্যবধান 3.75।
গড় ব্যবধান নির্ণয় করে তোমরা বুঝতে পারলে গড় থেকে অন্যান্য মানগুলো কত দূরে অবস্থিত।
এই চারটি ধাপ অনুসরণ করে আমরা যে n সংখ্যক ব্যবধানের
গড় নির্ণয় করলাম, এটিই হলো অবিন্যস্ত বা অশ্রেণিকৃত উপাত্তের
"গাণিতিক গড় হতে নির্ণীত গড় ব্যবধান" নির্ণয়ের সূত্র।
উদাহরণ- ১: চলো সূত্র ব্যবহার করে ব্যাটসম্যান A এর করা রানের গাণিতিক গড় হতে গড় ব্যবধান নির্ণয় করি:
শ্রেণিবিন্যস্ত উপাত্তের গড় ব্যবধান নির্ণয়
কিন্তু পরিমিত ব্যবধান জানার পূর্বে আমাদের ভেদাঙ্ক (Variance) সম্পর্কে জানতে হবে।
ভেদাঙ্ক (Variance)
তোমাদের নিশ্চয়ই মনে আছে, গাণিতিক গড় বা মধ্যক থেকে গড় ব্যবধান নির্ণয়ের সময় ব্যবধানের পরম মান ব্যবহার করা হয়েছিল। কিন্তু কেন? কারণটি নিচের বক্সে সংক্ষেপে লেখো।
গড় ব্যবধান নির্ণয়ে পরম মান ব্যবহার সংক্রান্ত সমস্যাটি আমরা অন্যভাবেও সমাধান করতে পারি। তথ্যরাশির প্রতিটি মান থেকে তাদের গড় বা মধ্যকের ব্যবধানকে বর্গ করে। সেক্ষেত্রে আবশ্যই বিচ্যুতির বর্গ অঋণাত্মক হবে।
চলো উদাহরণের মাধ্যমে বিষয়টি বুঝতে চেষ্টা করি:
আলেয়ার পরিবারের সদস্যসংখ্যা 6 এবং তাদের বয়স 5, 15, 25, 35, 45 ও 55 বছর। পরিবারের সদস্যদের বয়সের গড় x = 30. [হিসেবটি যাচাই করে দেখো]
এক্ষেত্রে গাণিতিক গড় স থেকে প্রতিটি মানের বিচ্যুতির বর্গের সমষ্টি
উপরের হিসাব দুটি পর্যালোচনা করে দেখা যায়, আলেয়া ও টমাসের পরিবারের সদস্যদের বয়সের গাণিতিক গড় একই। কিন্তু টমাসের পরিবারের সদস্যদের বয়সের বিস্তারের (30) চেয়ে আলেয়ার পরিবারের সদস্যদের বয়সের বিস্তার (50) বেশি।
সুতরাং আমরা বলতে পারি, বিস্তার পরিমাপের ক্ষেত্রে তথ্যসারির উপাত্ত ও তাদের গাণিতিক গড়ের ব্যবধানের বর্গের সমষ্টি নির্ণয় করলেই সমস্যাটির সমাধান হবে না। তথ্যসারির উপাত্ত ও তাদের গাণিতিক গড়ের
তোমরা জেনে অবাক হবে, আমাদের দৈনন্দিন জীবনে এমন অনেক উদাহরণ রয়েছে যেখানে আমরা না জেনেও পরিমিত ব্যবধানের মতো গাণিতিক ঘটনা প্রয়োগ করছি। যেমন:
১. আমাদের আয় ও চাহিদা অনুসারে দৈনন্দিন বাজেটে আমরা একটি গড় অর্থ বরাদ্ধ করে থাকি। কোনো রকম গাণিতিক হিসাব ছাড়াই আমরা পরিমিত ব্যবধান ব্যবহার করে নির্ধারণ করে থাকি বরাদ্ধের চেয়ে খুব বেশি বা কম ব্যয় করছি কি না। এটি স্পষ্টতই একটি সহজাত গণনা যা আমার মনই আমার জন্য করে থাকে।
২. তাছাড়া বিভিন্ন প্রকার গবেষণা, পরিকল্পনা প্রণয়ন, সামাজিক কর্মকান্ড ও শিল্পকারখানায় সমজাতীয় পণ্যের উৎকর্ষতা যাচাই সম্পর্কিত তথ্যসমূহের বিশ্লেষণে এটি বহুলভাবে ব্যবহৃত হয়ে থাকে।
৩. পরিমিত ব্যবধান হলো এমন একটি গুরুত্বপূর্ণ হাতিয়ার যা ব্যবসার মালিগণ ঝুঁকি ব্যবস্থাপনা এবং সিদ্ধান্ত গ্রহণের ক্ষেত্রে ব্যবহার করে থাকেন। বিক্রয় হ্রাস বা খারাপ গ্রাহক পর্যালোচনা বৃদ্ধির মতো পরিস্থিতিতে সম্ভাব্য ঝুঁকি ব্যবস্থাপনার কৌশলগুলো তৈরি করতে এটি ব্যবহার করেন।
৪. চিকিৎসা গবেষণা ও ঔষধ তৈরিতে পরিমিত ব্যবধান ব্যবহার করা হয়। তুমি হয়তো ভাবছো, এটি কীভাবে সম্ভব? তোমরা তো জানো, করোনাভাইরাসের মতো একটি নতুন ভাইরাসের জন্য একটি নতুন ভ্যাকসিন আবিষ্কার জরুরী হয়ে পড়েছিল। এর জন্য ভাইরাসটির বিপুল সংখ্যক অ্যান্টি-ভাইরাল দিয়ে পরীক্ষা-নিরীক্ষা করা হয় এবং সময়ের সাথে সাথে তা পর্যবেক্ষণ করা হয়। প্রতিটি নমুনায় ভাইরাস নির্মূলের গড়ের হারে অ্যান্টি-ভাইরালের একই প্রভাব রয়েছে কি না তা পরিমিত ব্যবধানের মাধ্যমে গণনা করা হয়।
আরও দেখুন...