Hướng dẫn bootstrap confidence interval interpretation - giải thích khoảng tin cậy bootstrap

Lấy mẫu từ dân số

Trong một thí nghiệm khoa học điển hình, chúng tôi quan tâm đến hai quần thể (kiểm soát và kiểm tra) và liệu có sự khác biệt giữa các phương tiện của chúng không (MuffTest - MuffControl).

Show

Chúng tôi đi về điều này bằng cách thu thập các quan sát từ dân số kiểm soát và từ dân số thử nghiệm.

Chúng tôi có thể dễ dàng tính toán sự khác biệt trung bình trong các mẫu quan sát của chúng tôi. Đây là ước tính của chúng tôi về quy mô hiệu ứng dân số mà chúng tôi quan tâm.

Nhưng làm thế nào để chúng ta có được một thước đo độ chính xác và niềm tin về ước tính của chúng ta? Chúng ta có thể hiểu được cách nó liên quan đến sự khác biệt có nghĩa là dân số?

Gianluca Malato là một nhà khoa học dữ liệu, người dạy học máy và khoa học dữ liệu trên www.yourdatateacher.com.

Introducing the bootstrap confidence interval95% confidence interval (95% CI) around the our estimate of the mean difference. The 95% indicates that any such confidence interval will capture the population mean difference 95% of the time11 In other words, if we repeated our experiment 100 times, gathering 100 independent sets of observations, and computing a 95% CI for the mean difference each time, 95 of these confidence intervals would capture the population mean difference.. That is to say, we can be 95% confident the interval contains the true mean of the population.

We want to obtain a 95% confidence interval (95% CI) around the our estimate of the mean difference. The 95% indicates that any such confidence interval will capture the population mean difference 95% of the time11 In other words, if we repeated our experiment 100 times, gathering 100 independent sets of observations, and computing a 95% CI for the mean difference each time, 95 of these confidence intervals would capture the population mean difference.. That is to say, we can be 95% confident the interval contains the true mean of the population.

We can calculate the 95% CI of the mean difference by performing bootstrap resampling.

The bootstrap in action2 The name is derived from the saying “pull oneself by one’s bootstraps”, often used as an exhortation to achieve success without external help. is a simple but powerful technique. It was first described by Bradley Efron.

Nó tạo ra nhiều mẫu người (với sự thay thế) từ một bộ quan sát duy nhất và tính toán kích thước hiệu ứng của lợi ích trên mỗi mẫu này. Các mô hình lại bootstrap của kích thước hiệu ứng sau đó có thể được sử dụng để xác định 95% CI.

Với máy tính, chúng tôi có thể thực hiện 5000 resples rất dễ dàng.

Sự phân phối lại của sự khác biệt trong phương tiện tiếp cận phân phối bình thường. Điều này là do định lý giới hạn trung tâm: Một số lượng lớn các mẫu ngẫu nhiên độc lập sẽ tiếp cận phân phối bình thường ngay cả khi dân số cơ bản không được phân phối bình thường.

Bootstrap Resampling mang lại cho chúng ta hai lợi ích quan trọng:

  1. Phân tích thống kê phi tham số. Không cần phải cho rằng các quan sát của chúng tôi, hoặc các quần thể cơ bản, thường được phân phối. Nhờ định lý giới hạn trung tâm, việc phân phối lại kích thước hiệu ứng sẽ tiếp cận tính quy tắc.
  2. Dễ dàng xây dựng CI 95% từ phân phối lại. Đối với 1000 mô hình phân biệt bootstrap của chênh lệch trung bình, người ta có thể sử dụng giá trị thứ 25 và giá trị thứ 975 của sự khác biệt được xếp hạng là ranh giới của khoảng tin cậy 95%. (Điều này nắm bắt được 95% trung tâm của phân phối.) Việc xây dựng khoảng thời gian như vậy được gọi là khoảng phần trăm.

Hãy để chúng tôi thấy chúng tôi muốn tính toán khoảng tin cậy 95% của giá trị trung bình. Hãy để tính toán tất cả các số chúng ta cần theo công thức của khoảng tin cậy.

Bây giờ chúng ta cần giá trị của t. Hàm tính toán phân phối tích lũy nghịch đảo là PPF. Chúng ta cần áp dụng giá trị tuyệt đối vì phân phối tích lũy hoạt động với đuôi trái, vì vậy kết quả sẽ âm.

Hãy tưởng tượng bạn hỏi tôi chiều cao của tôi. Tôi có thể nói rằng tôi cao 1,93 m, nhưng tôi không cung cấp cho bạn bất kỳ thông tin nào về sự không chắc chắn của biện pháp này. Khoảng tin cậy là các khoảng trong đó chúng ta có một sự tự tin nhất định để tìm ra giá trị thực của chúng ta có thể quan sát được. Các nhà khoa học thường tìm kiếm khoảng tin cậy 95%, nhưng nó rất phổ biến để sử dụng 90% hoặc thậm chí 99%. Vì vậy, khi bạn hỏi tôi về chiều cao của tôi, tôi nên trả lời bạn với ước tính lỗi hoặc với khoảng tin cậy, như là với độ tin cậy 95%, tôi đã từ 1,92 m đến 1,93 m.

Đó là những gì mà công cụ này cung cấp cho chúng ta: một khoảng cách tìm thấy giá trị thực của người có thể quan sát được.

Hãy tưởng tượng bạn hỏi tôi chiều cao của tôi. Tôi có thể nói rằng tôi cao 1,93 m, nhưng tôi không cung cấp cho bạn bất kỳ thông tin nào về sự không chắc chắn của biện pháp này. Khoảng tin cậy là các khoảng trong đó chúng ta có một sự tự tin nhất định để tìm ra giá trị thực của chúng ta có thể quan sát được. Các nhà khoa học thường tìm kiếm khoảng tin cậy 95%, nhưng nó rất phổ biến để sử dụng 90% hoặc thậm chí 99%. Vì vậy, khi bạn hỏi tôi về chiều cao của tôi, tôi nên trả lời bạn với ước tính lỗi hoặc với khoảng tin cậy, như là với độ tin cậy 95%, tôi đã từ 1,92 m đến 1,93 m.

Hãy tưởng tượng bạn hỏi tôi chiều cao của tôi. Tôi có thể nói rằng tôi cao 1,93 m, nhưng tôi không cung cấp cho bạn bất kỳ thông tin nào về sự không chắc chắn của biện pháp này. Khoảng tin cậy là các khoảng trong đó chúng ta có một sự tự tin nhất định để tìm ra giá trị thực của chúng ta có thể quan sát được. Các nhà khoa học thường tìm kiếm khoảng tin cậy 95%, nhưng nó rất phổ biến để sử dụng 90% hoặc thậm chí 99%. Vì vậy, khi bạn hỏi tôi về chiều cao của tôi, tôi nên trả lời bạn với ước tính lỗi hoặc với khoảng tin cậy, như là với độ tin cậy 95%, tôi đã từ 1,92 m đến 1,93 m.

  • Một số thuộc tính hữu ích của khoảng tin cậy là:
  • Hãy để nhập khẩu một số thư viện hữu ích.
  • Bây giờ, hãy mô phỏng một bộ dữ liệu được tạo bằng 100 số được trích xuất từ ​​phân phối bình thường.
  • Sử dụng bootstrap
  • Máy tính khoảng tin cậy trong Python
  • Kết luận
  • Một số thuộc tính hữu ích của khoảng tin cậy là:
  • Hãy để nhập khẩu một số thư viện hữu ích.
  • Bây giờ, hãy mô phỏng một bộ dữ liệu được tạo bằng 100 số được trích xuất từ ​​phân phối bình thường.
  • Sử dụng bootstrap
  • Máy tính khoảng tin cậy trong Python
  • Kết luận

Một số thuộc tính hữu ích của khoảng tin cậy là:

Hãy để nhập khẩu một số thư viện hữu ích.

Bây giờ, hãy mô phỏng một bộ dữ liệu được tạo bằng 100 số được trích xuất từ ​​phân phối bình thường.

Hãy để nhập khẩu một số thư viện hữu ích.

Bây giờ, hãy mô phỏng một bộ dữ liệu được tạo bằng 100 số được trích xuất từ ​​phân phối bình thường.

Sử dụng bootstrap

Máy tính khoảng tin cậy trong Python

  • Kết luận
  • Ảnh của Edge2Edge Media trên unplash

Khi chúng ta đo lường một cái gì đó, chúng ta luôn phải tính toán độ không đảm bảo của kết quả. Khoảng tin cậy là một công cụ rất hữu ích để tính toán một phạm vi mà chúng ta có thể tìm thấy giá trị thực của người quan sát được với một sự tự tin nhất định.

Bây giờ, hãy mô phỏng một bộ dữ liệu được tạo bằng 100 số được trích xuất từ ​​phân phối bình thường.

Sử dụng bootstrap

Máy tính khoảng tin cậy trong Python

Kết luận

Ảnh của Edge2Edge Media trên unplash

Khi chúng ta đo lường một cái gì đó, chúng ta luôn phải tính toán độ không đảm bảo của kết quả. Khoảng tin cậy là một công cụ rất hữu ích để tính toán một phạm vi mà chúng ta có thể tìm thấy giá trị thực của người quan sát được với một sự tự tin nhất định.

Hãy tưởng tượng bạn hỏi tôi chiều cao của tôi. Tôi có thể nói rằng tôi cao 1,93 m, nhưng tôi không cung cấp cho bạn bất kỳ thông tin nào về sự không chắc chắn của biện pháp này. Khoảng tin cậy là các khoảng trong đó chúng ta có một sự tự tin nhất định để tìm ra giá trị thực của chúng ta có thể quan sát được. Các nhà khoa học thường tìm kiếm khoảng tin cậy 95%, nhưng nó rất phổ biến để sử dụng 90% hoặc thậm chí 99%. Vì vậy, khi bạn hỏi tôi về chiều cao của tôi, tôi nên trả lời bạn với ước tính lỗi hoặc với khoảng tin cậy, như là với độ tin cậy 95%, tôi đã từ 1,92 m đến 1,93 m.

Đó là những gì mà công cụ này cung cấp cho chúng ta: một khoảng cách tìm thấy giá trị thực của người có thể quan sát được.

Sử dụng bootstrap

Máy tính khoảng tin cậy trong Python

Kết luận

  1. Ảnh của Edge2Edge Media trên unplash
  2. Khi chúng ta đo lường một cái gì đó, chúng ta luôn phải tính toán độ không đảm bảo của kết quả. Khoảng tin cậy là một công cụ rất hữu ích để tính toán một phạm vi mà chúng ta có thể tìm thấy giá trị thực của người quan sát được với một sự tự tin nhất định.
  3. Hãy tưởng tượng bạn hỏi tôi chiều cao của tôi. Tôi có thể nói rằng tôi cao 1,93 m, nhưng tôi không cung cấp cho bạn bất kỳ thông tin nào về sự không chắc chắn của biện pháp này. Khoảng tin cậy là các khoảng trong đó chúng ta có một sự tự tin nhất định để tìm ra giá trị thực của chúng ta có thể quan sát được. Các nhà khoa học thường tìm kiếm khoảng tin cậy 95%, nhưng nó rất phổ biến để sử dụng 90% hoặc thậm chí 99%. Vì vậy, khi bạn hỏi tôi về chiều cao của tôi, tôi nên trả lời bạn với ước tính lỗi hoặc với khoảng tin cậy, như là với độ tin cậy 95%, tôi đã từ 1,92 m đến 1,93 m.
  4. Đó là những gì mà công cụ này cung cấp cho chúng ta: một khoảng cách tìm thấy giá trị thực của người có thể quan sát được.

Một số thuộc tính hữu ích của khoảng tin cậy là:

Máy tính khoảng tin cậy trong Python

Kết luận

Ảnh của Edge2Edge Media trên unplash

import numpy as np 
from scipy.stats import t

Khi chúng ta đo lường một cái gì đó, chúng ta luôn phải tính toán độ không đảm bảo của kết quả. Khoảng tin cậy là một công cụ rất hữu ích để tính toán một phạm vi mà chúng ta có thể tìm thấy giá trị thực của người quan sát được với một sự tự tin nhất định.

x = np.random.normal(size=100)

Hãy tưởng tượng bạn hỏi tôi chiều cao của tôi. Tôi có thể nói rằng tôi cao 1,93 m, nhưng tôi không cung cấp cho bạn bất kỳ thông tin nào về sự không chắc chắn của biện pháp này. Khoảng tin cậy là các khoảng trong đó chúng ta có một sự tự tin nhất định để tìm ra giá trị thực của chúng ta có thể quan sát được. Các nhà khoa học thường tìm kiếm khoảng tin cậy 95%, nhưng nó rất phổ biến để sử dụng 90% hoặc thậm chí 99%. Vì vậy, khi bạn hỏi tôi về chiều cao của tôi, tôi nên trả lời bạn với ước tính lỗi hoặc với khoảng tin cậy, như là với độ tin cậy 95%, tôi đã từ 1,92 m đến 1,93 m.

m = x.mean() 
s = x.std()
dof = len(x)-1
confidence = 0.95

Một số thuộc tính hữu ích của khoảng tin cậy là:

t_crit = np.abs(t.ppf((1-confidence)/2,dof))

Hãy để nhập khẩu một số thư viện hữu ích.

(m-s*t_crit/np.sqrt(len(x)), m+s*t_crit/np.sqrt(len(x))) # (-0.14017768797464097, 0.259793719043611)

Bây giờ, hãy mô phỏng một bộ dữ liệu được tạo bằng 100 số được trích xuất từ ​​phân phối bình thường.

Hãy để chúng tôi thấy chúng tôi muốn tính toán khoảng tin cậy 95% của giá trị trung bình. Hãy để tính toán tất cả các số chúng ta cần theo công thức của khoảng tin cậy.

values = [np.random.choice(x,size=len(x),replace=True).mean() for i in range(1000)] np.percentile(values,[100*(1-confidence)/2,100*(1-(1-confidence)/2)]) # array([-0.13559955, 0.26480175])

Bây giờ chúng ta cần giá trị của t. Hàm tính toán phân phối tích lũy nghịch đảo là PPF. Chúng ta cần áp dụng giá trị tuyệt đối vì phân phối tích lũy hoạt động với đuôi trái, vì vậy kết quả sẽ âm.

Kết luận

Ảnh của Edge2Edge Media trên unplash

Khi chúng ta đo lường một cái gì đó, chúng ta luôn phải tính toán độ không đảm bảo của kết quả. Khoảng tin cậy là một công cụ rất hữu ích để tính toán một phạm vi mà chúng ta có thể tìm thấy giá trị thực của người quan sát được với một sự tự tin nhất định.