Hướng dẫn better bootstrap confidence intervals - khoảng tin cậy bootstrap tốt hơn

Lấy mẫu từ dân số

Trong một thí nghiệm khoa học điển hình, chúng tôi quan tâm đến hai quần thể (kiểm soát và kiểm tra) và liệu có sự khác biệt giữa các phương tiện của chúng không (MuffTest - MuffControl).

Chúng tôi đi về điều này bằng cách thu thập các quan sát từ dân số kiểm soát và từ dân số thử nghiệm.

Chúng tôi có thể dễ dàng tính toán sự khác biệt trung bình trong các mẫu quan sát của chúng tôi. Đây là ước tính của chúng tôi về quy mô hiệu ứng dân số mà chúng tôi quan tâm.

Nhưng làm thế nào để chúng ta có được một thước đo độ chính xác và niềm tin về ước tính của chúng ta? Chúng ta có thể hiểu được cách nó liên quan đến sự khác biệt có nghĩa là dân số?

Giới thiệu khoảng tin cậy bootstrap

Chúng tôi muốn có được khoảng tin cậy 95% (95% CI) xung quanh ước tính của chúng tôi về sự khác biệt trung bình. 95% chỉ ra rằng bất kỳ khoảng tin cậy nào như vậy sẽ nắm bắt được sự khác biệt trung bình dân số 95% của thời gian11 nói cách khác, nếu chúng ta lặp lại thí nghiệm của mình 100 lần, thu thập 100 bộ quan sát độc lập và tính toán CI 95% cho sự khác biệt trung bình mỗi Thời gian, 95 trong số các khoảng tin cậy này sẽ thu được sự khác biệt trung bình dân số .. nghĩa là, chúng ta có thể tự tin 95% khoảng thời gian chứa trung bình thực sự của dân số.95% confidence interval (95% CI) around the our estimate of the mean difference. The 95% indicates that any such confidence interval will capture the population mean difference 95% of the time11 In other words, if we repeated our experiment 100 times, gathering 100 independent sets of observations, and computing a 95% CI for the mean difference each time, 95 of these confidence intervals would capture the population mean difference.. That is to say, we can be 95% confident the interval contains the true mean of the population.

Chúng ta có thể tính toán CI 95% của chênh lệch trung bình bằng cách thực hiện lấy mẫu Bootstrap.

Bootstrap trong hành động

Bootstrap22 Tên có nguồn gốc từ câu nói của mình bởi một người bootstraps, thường được sử dụng như một sự hô hào để đạt được thành công mà không cần sự giúp đỡ bên ngoài. là một kỹ thuật đơn giản nhưng mạnh mẽ. Nó được mô tả đầu tiên bởi Bradley Efron.2 The name is derived from the saying “pull oneself by one’s bootstraps”, often used as an exhortation to achieve success without external help. is a simple but powerful technique. It was first described by Bradley Efron.

Nó tạo ra nhiều mẫu người (với sự thay thế) từ một bộ quan sát duy nhất và tính toán kích thước hiệu ứng của lợi ích trên mỗi mẫu này. Các mô hình lại bootstrap của kích thước hiệu ứng sau đó có thể được sử dụng để xác định 95% CI.

Với máy tính, chúng tôi có thể thực hiện 5000 resples rất dễ dàng.

Sự phân phối lại của sự khác biệt trong phương tiện tiếp cận phân phối bình thường. Điều này là do định lý giới hạn trung tâm: Một số lượng lớn các mẫu ngẫu nhiên độc lập sẽ tiếp cận phân phối bình thường ngay cả khi dân số cơ bản không được phân phối bình thường.

Bootstrap Resampling mang lại cho chúng ta hai lợi ích quan trọng:

  1. Phân tích thống kê phi tham số. Không cần phải cho rằng các quan sát của chúng tôi, hoặc các quần thể cơ bản, thường được phân phối. Nhờ định lý giới hạn trung tâm, việc phân phối lại kích thước hiệu ứng sẽ tiếp cận tính quy tắc.
  2. Dễ dàng xây dựng CI 95% từ phân phối lại. Đối với 1000 mô hình phân biệt bootstrap của chênh lệch trung bình, người ta có thể sử dụng giá trị thứ 25 và giá trị thứ 975 của sự khác biệt được xếp hạng là ranh giới của khoảng tin cậy 95%. (Điều này nắm bắt được 95% trung tâm của phân phối.) Việc xây dựng khoảng thời gian như vậy được gọi là khoảng phần trăm.

Điều chỉnh các phân phối tái tạo không đối xứng

Mặc dù việc lấy mẫu lại phân phối của sự khác biệt về phương tiện thường có phân phối bình thường, nhưng không có gì lạ khi gặp phân phối sai lệch. Do đó, Efron đã phát triển Bootstrap được điều chỉnh và tăng tốc độ lệch (BCA Bootstrap) để giải thích cho độ lệch và vẫn có được 95% trung tâm của phân phối. Dabest áp dụng hiệu chỉnh BCA cho các phân phối bootstrap lấy mẫu lại của kích thước hiệu ứng.

Các lô ước tính kết hợp lấy lại Bootstrap

Biểu đồ ước tính được tạo ra bởi dabest trình bày RawData và khoảng tin cậy bootstrap của kích thước hiệu ứng (sự khác biệt về phương tiện) cạnh nhau như một biểu đồ tích hợp duy nhất. Do đó, nó kết hợp chặt chẽ sự trình bày trực quan của dữ liệu thô với một dấu hiệu của sự khác biệt trung bình dân số và khoảng tin cậy của nó.

trừu tượng

Chúng tôi xem xét vấn đề thiết lập khoảng tin cậy gần đúng cho một tham số duy nhất trong một họ đa số. Các khoảng gần đúng tiêu chuẩn dựa trên lý thuyết khả năng tối đa, có thể khá sai lệch. Trong thực tế, các thủ thuật dựa trên các phép biến đổi, điều chỉnh thiên vị, v.v., thường được sử dụng để cải thiện độ chính xác của chúng. Các khoảng tin cậy bootstrap được thảo luận trong bài viết này tự động kết hợp các thủ thuật như vậy mà không yêu cầu nhà thống kê phải suy nghĩ chúng cho mỗi ứng dụng mới, với giá tăng đáng kể trong nỗ lực tính toán. Các khoảng mới kết hợp một cải tiến so với các phương pháp được đề xuất trước đây, dẫn đến tính chính xác bậc hai trong một loạt các vấn đề. Ngoài các họ tham số, các khoảng thời gian bootstrap cũng được phát triển cho các tình huống không tham số.

Hướng dẫn better bootstrap confidence intervals - khoảng tin cậy bootstrap tốt hơn
, can be quite misleading. In practice, tricks based on transformations, bias corrections, and so forth, are often used to improve their accuracy. The bootstrap confidence intervals discussed in this article automatically incorporate such tricks without requiring the statistician to think them through for each new application, at the price of a considerable increase in computational effort. The new intervals incorporate an improvement over previously suggested methods, which results in second-order correctness in a wide variety of problems. In addition to parametric families, bootstrap intervals are also developed for nonparametric situations.