Sufficient Statistic: Definition, Example

আমরা জানি যে পপুলেশনের ক্ষেত্রে প্যারামিটার এবং স্যাম্পলের ক্ষেত্রে স্ট্যাটিস্টিক্স বলে। যদি আমরা এমন কোন একটা স্ট্যাটিস্টিক্স জানি যেইটা দিয়ে ঐ পপুলেশনের কোন প্যারামিটার সম্পর্কে সব জানা হয়ে যায়, তাহলে সেই স্ট্যাটিস্টিক্সকে আমরা বলব Sufficient statistics। যেমন স্যাম্পলের মিন দিয়ে আমরা পপুলেশন মিন μ এস্টিমেট করতে চাই। অরিজিনাল ডাটা পয়েন্টের যা ইনফরমেশন পপুলেশন মিনে থাকে, যদি পপুলেশন মিনের সেই ইনফরমেশন ধরে রাখতে পারে, তাইলে আমরা বলতে পারি হল একটা sufficient statistics। 

একটা উদাহরণ দিয়ে বুঝি। ধরি একটা ডাটাসেট দেওয়া {৩, ৫, ৬, ৮, ১২}, এর স্যাম্পল মিন বের করলাম ৬.৮। এখন স্যাম্পল মিন দিয়ে আমরা এস্টিমেট করি পপুলেশন মিন হল ৬.৮। এখন ধরলাম আমি ডাটাসেট তা জানিনা, খালি স্যাম্পল মিনের মান ৬.৮ এইটা জানি। এই মান ব্যাবহার করে আমরা এস্টিমেট করি পপেলেশন মিন কত। আমরা এইখানে ফুল ডাটাসেট না জেনেও খালি স্যাম্পল মিনের মান জেনে পপুলেশন মিন এস্টিমেট করতে পারি। এজন্য এইখানে স্যাম্পল মিনটাই আমাদের sufficient statistics। আমরা সাফিশিয়েন্ট স্ট্যাটিস্টিক্সের কনসেপ্ট বুঝলাম, তাইলে এখন এর সংজ্ঞাটা দেখি। 

Sufficient statistic: ধরি একটা প্রবাবিলিটি ডিস্ট্রিবিউশন যেইটার একটা প্যারামিটার হল θ। এর মান অজানা। এই প্রবাবিলিটি ডিস্ট্রিবিউশন থেকে কয়েকটা র‍্যান্ডম স্যাম্পল নেওয়া হল: X1, X2, …, Xn। তাইলে স্ট্যাটিস্টিক্স,

 T = r( X1, X2, …, Xn ),

θ এর জন্য একটা সাফিশিয়েন্ট স্ট্যাটিস্টিক্স হবে যদি X1, X2, …, Xn এর কন্ডিশনাল ডিস্ট্রিবিউশন, T দেওয়া আছে, θ এর উপর ডিপেন্ড না করে। 

Ancillary Statistic: সাফিশিয়েন্ট স্ট্যাটিস্টিক্স যেমন একটা প্যারামিটারের ব্যাপারে সব ইনফরমেশন দেয়, Ancillary statistic প্যারামিটারের ব্যাপারে কোন ইনফরমেশন দেয়না। 

আরও পড়তে চাইলে:

3 thoughts on “Sufficient Statistic: Definition, Example

  1. Pingback: Neyman-Fisher Factorization Criterion/Theorem: How to find a sufficient statistic? | Learn with Gauhar

  2. Pingback: Sufficient Statistics: Working out different distributions (Part 2) | Learn with Gauhar

  3. Pingback: Sufficient Statistics: Working out different distributions (Part 3) | Learn with Gauhar

Leave a Reply