Sufficient Statistics: Working out different distributions (Part 3)

October 29, 2020 / noushin.gauhar / Leave a comment

আমরা আরও কয়েকটা উদাহরণ দেখব বিভিন্ন ডিস্ট্রিবিওশনের। উদাহরণগুলো বুঝার জন্য সাফিশিয়েন্ট স্ট্যাটিস্টিক্স ও ফ্যাক্টরাইজেশন থিওরেমের ধারনা থাকতে হবে। এই থ্রেডের আগের অংশ এইখানে। ৫। ধরি একটা নরমাল ডিস্ট্রিবিওশন দেওয়া আছে, যার অজানা প্যারামিটার মিন μ এবং ভ্যারিয়্যান্স σ2 = 1। μ এর সাফিশিয়েন্ট স্ট্যাটিস্টিক্স কি হবে? নরমাল ডিস্ট্রিবিওশনের pdf, $latex f(x)= \frac{1}{\sigma \sqrt{2 \pi}} \: … Continue reading Sufficient Statistics: Working out different distributions (Part 3)

Neyman-Fisher Factorization Criterion/Theorem: How to find a sufficient statistic?

October 26, 2020October 31, 2020 / noushin.gauhar / Leave a comment

আমরা সাফিশিয়েন্ট স্ট্যাটিস্টিক্সের কনসেপ্ট জেনেছি। এখন যদি আমরা কোন প্যারামিটারের জন্য সাফিশিয়েন্ট স্ট্যাটিস্টিক্স বের করতে চাই, তাহলে কি করব? আমরা সংজ্ঞা থেকে বলতে পারি যে র‍্যান্ডম স্যাম্পলগুলোর কন্ডিশনাল ডিস্ট্রিবিউশন বের করতে পারি, এরপর ক্যালকুলেশন করে দেখতে পারি ডিস্ট্রিবিউশন প্যারামিটারের উপর নির্ভর করে কিনা। প্রাক্টিকালি কন্ডিশনাল ডিস্ট্রিবিউশন বের করা এত সহজ না। এজন্য কোন প্যারামিটারের জন্য … Continue reading Neyman-Fisher Factorization Criterion/Theorem: How to find a sufficient statistic?

Sufficient Statistic: Definition, Example

October 26, 2020 / noushin.gauhar / 3 Comments

আমরা জানি যে পপুলেশনের ক্ষেত্রে প্যারামিটার এবং স্যাম্পলের ক্ষেত্রে স্ট্যাটিস্টিক্স বলে। যদি আমরা এমন কোন একটা স্ট্যাটিস্টিক্স জানি যেইটা দিয়ে ঐ পপুলেশনের কোন প্যারামিটার সম্পর্কে সব জানা হয়ে যায়, তাহলে সেই স্ট্যাটিস্টিক্সকে আমরা বলব Sufficient statistics। যেমন স্যাম্পলের মিন x̄ দিয়ে আমরা পপুলেশন মিন μ এস্টিমেট করতে চাই। অরিজিনাল ডাটা পয়েন্টের যা ইনফরমেশন পপুলেশন মিনে … Continue reading Sufficient Statistic: Definition, Example

Random Variables

September 30, 2020October 28, 2020 / noushin.gauhar / 1 Comment

আলজেবরায় আমরা ইকুয়েশন সল্ভ করতে বিভিন্ন ভ্যারিয়েবল ব্যাবহার করেছি। কোন একটা অজানা মানকে প্রকাশ করতে এই ভ্যারিয়েবল ব্যাবহার করি। যেমন: x + 4 = 7, এইখানে সল্ভ করলে আমরা মান পাব x = 3। আমরা কিছু ক্যালকুলেশন করে ভ্যারিয়েবল x এর মান পেয়েছি। Random variable: অনুরূপভাবে প্রবাবিলিটি ও স্টাটিস্টিক্সে র‍্যান্ডম ভ্যারিয়েবল ব্যাবহার করা হয়। কোন … Continue reading Random Variables

Bessel’s correction: why N-1?

August 22, 2020 / noushin.gauhar / Leave a comment

এরমধ্যে আমরা standard deviation (s) আর variance (s2) এর ব্যাপারে জেনেছি। কিন্তু একটা বিষয় লক্ষনীয় স্যাম্পলের s এবং s2 বের করার সময় আমরা N-1 দিয়ে ভাগ করি। কেন করি? শুধু N দিয়ে ভাগ করিনা কেন? Bessel’s correction: কিছু সূত্রে কারেকশন হিসেবে ’N-1’ দেখা যায়, এই কারেকশনকে Bessel’s correction বলে। স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন আর স্যাম্পল ভ্যারিয়েন্সের … Continue reading Bessel’s correction: why N-1?

Discrete and continuous variable

August 20, 2020 / noushin.gauhar / Leave a comment

Discrete variable: যা নির্দিষ্ট সময়ের মধ্যে গণনা করে শেষ করা যায় এবং এর মানগুলো নির্দিষ্ট হয়। যেমন: ক্লাসে যদি মোট ৫ জন স্টুডেন্ট থাকে, তাহলে স্টুডেন্ট সংখ্যা ১, ২, ৩, ৪, ৫ - এর মধ্যে যেকোনো একটা মান হবে। কখনই ৩.৫ বা ২.৪৬ এমন কোন মান হতে পারবেনা। ব্যাগের মধ্যে কয়টা বল আছে, কোন রুমে … Continue reading Discrete and continuous variable

Sample space

August 18, 2020 / noushin.gauhar / 1 Comment

Experiment হচ্ছে একটি প্রসেস যার কিছু রেজাল্ট থাকে এবং এই রেজাল্টগুলোকে রেকর্ড বা অব্জার্ভকরা হয়। একটা এক্সপেরিমেন্টের সম্ভাব্য রেজাল্টকে Outcome বলে। কোন এক্সপেরিমেন্টের এক বা একাধিক outcome কে Event বলা হয়। Sample space: কোন এক্সপেরিমেন্টের যতগুলো সম্ভাব্য outcome আছে, সবগুলো মিলায় হল sample space। { } এই সেট দিয়ে স্যাম্পল স্পেস কে লেখা হয়। … Continue reading Sample space

5 number summary, Boxplots

August 1, 2020September 22, 2021 / noushin.gauhar / Leave a comment

কোন ডাটাসেটের descriptive analysis এর জন্য 5 number summary গুরুত্বপূর্ণ। একটি ধারণা দেয় ডাটাগুলো কিভাবে distributed আছে। 5 number summary এর ক্ষেত্রে ৫টি তথ্য দেওয়া থাকে। যথাক্রমে: The minimum: ডাটাসেটের সবচেয়ে ছোট মান। The first Quartile (Q1): ডাটাসেটের lower half এর মধ্যমা (median)। The median: ডাটাসেটের মধ্যমা (median)। The third Quartile (Q3): ডাটাসেটের upper half এর … Continue reading 5 number summary, Boxplots

Standard deviation, variance, coefficient of variance

July 31, 2020 / noushin.gauhar / 4 Comments

Variability: কোন ডাটাসেটে ডাটাগুলো কতটুকু ছড়ানো আছে, একটা ডাটা পয়েন্ট আরেকটা ডাটা পয়েন্ট থেকে কত দুরে বা কাছে আছে, এই ব্যাপারটাকে variability বলে। Variability মাপার জন্য সাধারণত standard deviation, variance আর coefficient of variance ব্যাবহার করা হয়। Standard deviation (SD): ডাটাসেটের mean এর সাপেক্ষে ডাটাপয়েন্টগুলোর বিচ্যুতি বুঝা যায়। Mean থেকে ডাটা পয়েন্ট যতদূরে, বিচ্যুতি ততো … Continue reading Standard deviation, variance, coefficient of variance

Mean, median, mode (গড়, মধ্যমা, প্রচুরক)

July 24, 2020 / noushin.gauhar / 1 Comment

ধরি একটা ডাটাসেটে দেওয়া আছে {১৩, ৪, ২, ৮, ১১, ১৫, ৩, ৭, ১৯}। এইখানে ৯টি ডাটা পয়েন্ট আছে। Mean (গড়): একেবারে সোজা বাংলায় গড় যেইটাকে বলে, সেইটাই। এখন আমরা এই ডাটাসেটের Mean বের করার জন্য প্রথমে সবগুলা ডাটা পয়েন্টের মান যোগ করব। এরপর মোট ডাটা সংখ্যা দিয়ে ভাগ করব। যোগ: ১৩ + ৪ + … Continue reading Mean, median, mode (গড়, মধ্যমা, প্রচুরক)

Learn with Gauhar

Learn computer science with me in Bangla

statistics