আমরা জানি যে পপুলেশনের ক্ষেত্রে প্যারামিটার এবং স্যাম্পলের ক্ষেত্রে স্ট্যাটিস্টিক্স বলে। যদি আমরা এমন কোন একটা স্ট্যাটিস্টিক্স জানি যেইটা দিয়ে ঐ পপুলেশনের কোন প্যারামিটার সম্পর্কে সব জানা হয়ে যায়, তাহলে সেই স্ট্যাটিস্টিক্সকে আমরা বলব Sufficient statistics। যেমন স্যাম্পলের মিন x̄ দিয়ে আমরা পপুলেশন মিন μ এস্টিমেট করতে চাই। অরিজিনাল ডাটা পয়েন্টের যা ইনফরমেশন পপুলেশন মিনে থাকে, যদি x̄ পপুলেশন মিনের সেই ইনফরমেশন ধরে রাখতে পারে, তাইলে আমরা বলতে পারি x̄ হল একটা sufficient statistics।
একটা উদাহরণ দিয়ে বুঝি। ধরি একটা ডাটাসেট দেওয়া {৩, ৫, ৬, ৮, ১২}, এর স্যাম্পল মিন বের করলাম ৬.৮। এখন স্যাম্পল মিন দিয়ে আমরা এস্টিমেট করি পপুলেশন মিন হল ৬.৮। এখন ধরলাম আমি ডাটাসেট তা জানিনা, খালি স্যাম্পল মিনের মান ৬.৮ এইটা জানি। এই মান ব্যাবহার করে আমরা এস্টিমেট করি পপেলেশন মিন কত। আমরা এইখানে ফুল ডাটাসেট না জেনেও খালি স্যাম্পল মিনের মান জেনে পপুলেশন মিন এস্টিমেট করতে পারি। এজন্য এইখানে স্যাম্পল মিনটাই আমাদের sufficient statistics। আমরা সাফিশিয়েন্ট স্ট্যাটিস্টিক্সের কনসেপ্ট বুঝলাম, তাইলে এখন এর সংজ্ঞাটা দেখি।
Sufficient statistic: ধরি একটা প্রবাবিলিটি ডিস্ট্রিবিউশন যেইটার একটা প্যারামিটার হল θ। এর মান অজানা। এই প্রবাবিলিটি ডিস্ট্রিবিউশন থেকে কয়েকটা র্যান্ডম স্যাম্পল নেওয়া হল: X1, X2, …, Xn। তাইলে স্ট্যাটিস্টিক্স,
T = r( X1, X2, …, Xn ),
θ এর জন্য একটা সাফিশিয়েন্ট স্ট্যাটিস্টিক্স হবে যদি X1, X2, …, Xn এর কন্ডিশনাল ডিস্ট্রিবিউশন, T দেওয়া আছে, θ এর উপর ডিপেন্ড না করে।
Ancillary Statistic: সাফিশিয়েন্ট স্ট্যাটিস্টিক্স যেমন একটা প্যারামিটারের ব্যাপারে সব ইনফরমেশন দেয়, Ancillary statistic প্যারামিটারের ব্যাপারে কোন ইনফরমেশন দেয়না।
আরও পড়তে চাইলে:
- https://www.statisticshowto.com/sufficient-statistic/
- https://www.math.arizona.edu/~tgk/466/sufficient.pdf
- http://www.ams.sunysb.edu/~zhu/ams571/Lecture7_571.pdf
- https://people.missouristate.edu/songfengzheng/Teaching/MTH541/Lecture%20notes/Sufficient.pdf
- https://onlinelibrary.wiley.com/doi/full/10.1002/0470011815.b2a15162
- https://online.stat.psu.edu/stat415/lesson/24/24.1
- https://encyclopediaofmath.org/wiki/Sufficient_statistic
- https://nowak.ece.wisc.edu/ece830/ece830_fall11_lecture4.pdf
Pingback: Neyman-Fisher Factorization Criterion/Theorem: How to find a sufficient statistic? | Learn with Gauhar
Pingback: Sufficient Statistics: Working out different distributions (Part 2) | Learn with Gauhar
Pingback: Sufficient Statistics: Working out different distributions (Part 3) | Learn with Gauhar