5 number summary, Boxplots

কোন ডাটাসেটের descriptive analysis এর জন্য 5 number summary গুরুত্বপূর্ণ। একটি ধারণা দেয় ডাটাগুলো কিভাবে distributed আছে। 5 number summary এর ক্ষেত্রে ৫টি তথ্য দেওয়া থাকে। যথাক্রমে:

  • The minimum: ডাটাসেটের সবচেয়ে ছোট মান। 
  • The first Quartile (Q1): ডাটাসেটের lower half এর মধ্যমা (median)।
  • The median: ডাটাসেটের মধ্যমা (median)।
  • The third Quartile (Q3): ডাটাসেটের upper half এর মধ্যমা (median)।
  • The maximum: ডাটাসেটের সবচেয়ে বড় মান। 

একটি উদাহরণ দিয়ে বুঝাই। ধরি একটি ডাটাসেট {23, 6, 4, 9, 17, 34, 45, 3, 67, 13, 53} দেওয়া আছে। প্রথমেই ডাটাসেটকে ছোট থেকে বড় সাজিয়ে নিতে হবে – {3, 4, 6, 9, 13, 17, 23, 34, 45, 53, 67}। 

দেখা যাচ্ছে minimum এবং maximum যথাক্রমে 3 এবং 67। Median হল 17। 

এইখানে lower half এর median 6 অর্থাৎ Q1 = 6. আর  upper half এর median 45, Q3 = 45.

Graphical representation: 5 number summary এর graphical representation এর জন্য box and whisker plot / box plot ব্যাবহার করা হয়। বক্স অংশটা Q1 থেকে Q3 (interquartile range) বুঝায়। বক্সের বাম থেকে minimum পর্যন্ত একটা whisker থাকে, ডাটাসেটের lowest ডাটা এইখানে থাকে। বক্সের ডান থেকে maximum পর্যন্ত আরেকটা whisker থাকে, ডাটাসেটের highest ডাটা এইখানে থাকে।

Figure 1: Box and whisker plot for the given example

আরও পড়তে চাইলে:

  1. http://web.mnstate.edu/peil/MDEV102/U4/S36.pdf
  2. https://www.imathas.com/stattools/boxplot.html (box plot generator)

Leave a Reply