Khoảng tin cậy và khoảng tin cậy


Dương Ðan Quỳnh
4 năm trước
Hữu ích 4 Chia sẻ Viết bình luận 0
Đã xem 5921

Ngày mai, trong bài giảng cuối cùng của khóa học Thống kê toán học, tôi sẽ cố gắng minh họa - sử dụng mô phỏng Monte Carlo - sự khác biệt giữa thống kê cổ điển và phương pháp Bayesien.

Cách (đơn giản) tôi thấy nó là như sau,

  • đối với người thường xuyên, xác suất là thước đo tần suất của các sự kiện lặp lại, do đó, việc giải thích là các tham số được cố định (nhưng không xác định) và dữ liệu là ngẫu nhiên
  • đối với người Bayes, xác suất là thước đo mức độ chắc chắn của các giá trị, do đó, việc giải thích là các tham số là ngẫu nhiên và dữ liệu được cố định

Hoặc để trích dẫn Chủ nghĩa thường xuyên và Chủ nghĩa Bayes: Một Primer do Python điều khiển , một nhà thống kê Bayes sẽ nói "với dữ liệu quan sát của chúng tôi, có xác suất 95% rằng giá trị thực sự  nó sẽ nằm trong đó ".

Để có thêm trực giác về những trích dẫn đó, hãy xem xét một vấn đề đơn giản, với các thử nghiệm của Bernoulli, với các yêu cầu bảo hiểm. Chúng tôi muốn rút ra một số khoảng tin cậy cho xác suất để yêu cầu thua lỗ. Có = 1047 chính sách. Và 159 yêu sách.

Xem xét khoảng tin cậy tiêu chuẩn (thường xuyên). Nó có nghĩa là gì

(nghĩa là "từ dữ liệu của loại này"). Đối với mỗi mẫu, tính khoảng tin cậy với mối quan hệ ở trên. Đó là khoảng tin cậy 95% vì trong 95% kịch bản, giá trị thực nghiệm nằm trong khoảng tin cậy. Từ quan điểm tính toán, đó là ý tưởng sau đây:

> xbar <- 159
> n <- 1047
> ns <- 100
> M=matrix(rbinom(n*ns,size=1,prob=xbar/n),nrow=n)

Tôi tạo ra 100 mẫu kích thước . Đối với mỗi mẫu, tôi tính giá trị trung bình và khoảng tin cậy từ mối quan hệ trước:

> fIC=function(x) mean(x)+c(-1,1)*1.96*sqrt(mean(x)*(1-mean(x)))/sqrt(n)
> IC=t(apply(M,2,fIC))
> MN=apply(M,2,mean)

Sau đó, chúng tôi vẽ tất cả các khoảng tin cậy. Màu đỏ khi chúng không chứa ý nghĩa thực nghiệm:

> k=(xbar/n<IC[,1])|(xbar/n>IC[,2])
> plot(MN,1:ns,xlim=range(IC),axes=FALSE,
+ xlab="",ylab="",pch=19,cex=.7,
+ col=c("blue","red")[1+k])
> axis(1)
> segments(IC[,1],1:ns,IC[,2],1:
+ ns,col=c("blue","red")[1+k])
> abline(v=xbar/n)



Hữu ích 4 Chia sẻ Viết bình luận 0
Đã xem 5921