Sufficient Statistics: Working out different distributions (Part 1)

আমরা ফ্যাক্টরাইজেশন থিওরেম ব্যাবহার করে বিভিন্ন প্রবাবিলিটি ডিস্ট্রিবিওশনের জন্য সাফিশিয়েন্ট স্ট্যাটিস্টিক্স বের করে দেখব। এর জন্য নিচের জিনিসগুলো খেয়াল রাখতে হবে। 

  • যে ডিস্ট্রিবিওশন দেওয়া থাকবে, তার pdf/pmf জানতে হবে। 
  • জয়েন্ট pdf/pmf বের করতে হবে। 
  • h(x) এবং gθ(t) বের করতে হবে। অজানা প্যারামিটারসহ সকল অংশ gθ(t) তে যাবে, বাদবাকি সব হবে h(x)। 
  • gθ(t) ফাংশনে অজানা প্যারামিটার এবং কন্সটান্ট বাদে যে ভ্যারিয়েবল থাকবে, সেইটা হবে আমাদের সাফিশিয়েন্ট স্ট্যাটিস্টিক্স।

১। একটা Bernoulli ডিস্ট্রিবিওশন দেওয়া আছে, এর একটা অজানা প্যারামিটার হল p। p এর সাফিশিয়েন্ট স্ট্যাটিস্টিক্স কি হবে?

আমরা জানি বার্নোলি ডিস্ট্রিবিওশনের pmf হল,

\begin{aligned} f(x)=p^{x}(1-p)^{1-x} \end{aligned}

X1,X2,…,Xn এর জয়েন্ট pmf হবে,

\begin{aligned} f(x_1,x_2,...,x_n|p) &= f(x_1|p)\times(x_2|p)\times...\times(x_n|p) \\ &= p^{x_1}(1-p)^{1-x_1}\times p^{x_2}(1-p)^{1-x_2}\times...\times p^{x_n}(1-p)^{1-x_n} \\ &= p^{x_1 + x_2 +...+x_n } (1-p)^{1-x_1+1-x_2+...+1-x_n} \\ &= p^{\sum x_i}(1-p)^{n-\sum x_i} \end{aligned}

ফ্যাক্টরাইজেশন থিওরেমটা দেখি,

f(x_1, x_2,..., x_n | \theta) = h(x) g_{\theta}(t)

এখন আমরা ফ্যাক্টরাইজেশন থিওরেম ব্যাবহার করে দেখতে পারি, অজানা প্যারামিটারসহ পুরো অংশটুকু হবে gθ(t), বাকিটুকু হবে h(x)। এইখানে,

h(x) = 1 \\ g_{\theta}(t) = p^{\sum x_i}(1-p)^{n-\sum x_i}

এখন যদি আমরা gθ(t) খেয়াল করি, n হচ্ছে কন্সটান্ট, p তো আমাদের অজানা প্যারামিটার। এইখানে ∑xi এর মান জানলে হয়ে যাবে। সুতরাং ∑xi হচ্ছে p এর জন্য সাফিশিয়েন্ট স্ট্যাটিস্টিক্স।


২। ধরি একটা পয়সন ডিস্ট্রিবিওশন দেওয়া আছে, যার অজানা প্যারামিটার λ > 0λ এর সাফিশিয়েন্ট স্ট্যাটিস্টিক্স কি হবে?

পয়সন ডিস্ট্রিবিওশনের pmf,

\begin{aligned} f(x)= \frac{e^{- \lambda} \lambda^{x}}{x!} \end{aligned}

জয়েন্ট pmf হবে,

\begin{aligned} f(x_1,x_2,...,x_n|\lambda) &= f(x_1|\lambda)\times(x_2|\lambda)\times...\times(x_n|\lambda) \\ &= \frac{e^{- \lambda} \lambda^{x_1}}{x_2!}\times\frac{e^{- \lambda} \lambda^{x_2}}{x_2!}\times...\times\frac{e^{- \lambda} \lambda^{x_n}}{x_n!} \\ &= \frac{e^{-\lambda-\lambda-...-\lambda} \lambda^{x_1 + x_2+...+x_n}}{x_1!x_2!...x_n!} \\ &= (e^{-n\lambda} \lambda^{\sum x_i}) (\frac{1}{x_1!x_2!...x_n!}) \end{aligned}

এইখানে,

h(x) = \frac{1}{x_1!x_2!...x_n!} \\ \\ g_{\theta}(t) = e^{-n\lambda} \lambda^{\sum x_i}

আমরা gθ(t) খেয়াল করলে দেখতে পারি সাফিশিয়েন্ট স্ট্যাটিস্টিক্স T(x) = ∑xi হবে।

আরও দেখতে চাইলে:

Leave a Reply