Bootstrap có giống với khoảng tin cậy không?

Khoảng tin cậy Bootstrap đang được sử dụng rộng rãi hơn khi phần mềm có sẵn - nhưng chúng vẫn có xu hướng là ngoại lệ hơn là quy tắc ngay cả trong những tình huống thực sự nên sử dụng chúng. Ví dụ, các khoảng tiệm cận (xấp xỉ bình thường) được biết là không đáng tin cậy đối với các thước đo thường được sử dụng như tỷ lệ rủi ro quy kết và thậm chí đối với các phương tiện đơn giản của dữ liệu sai lệch

Một vấn đề quan trọng trong tài liệu là nhiều tác giả chỉ đơn giản tuyên bố rằng họ đã đính kèm khoảng tin cậy bootstrap mà không cần giải thích thêm. Điều cần thiết là nêu rõ loại khoảng thời gian khởi động được đính kèm - liệu quá trình khởi động có được sử dụng để ước tính sai số chuẩn 

Bootstrap có giống với khoảng tin cậy không?
và sau đó khoảng thời gian này được sử dụng trong khoảng thời gian xấp xỉ bình thường hay liệu một số loại khoảng phần trăm ( . Đúng là thuật ngữ bootstrapping không được mọi người đồng ý - và chúng tôi lấy 
Bootstrap có giống với khoảng tin cậy không?
làm ví dụ về quy trình này được mô tả là 'không tham số' mặc dù dựa trên phân phối Poisson - mặc dù . Do đó, người ta phải luôn đính kèm một tài liệu tham khảo cho biết tác giả là người đầu tiên sử dụng loại khoảng thời gian khởi động cụ thể của bạn.

Nó cũng cần thiết để mô tả chính xác cách bootstrapping được thực hiện và số lần lặp lại liên quan. Trong khi (một số) khoảng tin cậy bootstrap cho phép một người bỏ qua các giả định về tính quy tắc, thì chúng không đáp ứng được nhu cầu về tính độc lập thống kê của các quan sát trừ khi điều này được tính cụ thể trong phương pháp bootstrapping. Chúng tôi đưa ra một ví dụ y tế trong đó các quan sát rõ ràng là không độc lập về mặt thống kê được gộp lại để tính toán khoảng tin cậy xấp xỉ thông thường và (dường như) để khởi động. Cả hai khoảng kết quả đều giống nhau - và cả hai đều sai. Chúng tôi cũng đưa ra một ví dụ thú y về việc giảm số lượng trứng trong phân khi không rõ chính xác cái gì đã được khởi động và khi việc ghép đôi rõ ràng được thực hiện trên cơ sở tùy tiện

Có một xu hướng đáng lo ngại, đặc biệt là với các bài báo về sinh thái học, chỉ đơn giản là thay đổi mức độ xác suất của khoảng tin cậy nếu chúng (cảm thấy) quá rộng. Mặc dù không có gì là 'do Chúa ban' (hoặc thậm chí là 'do nhà thống kê') cung cấp khoảng 95%, nhưng ít nhất chúng cũng cung cấp một điểm tham chiếu chung. Thay đổi thành khoảng 80% chỉ thu hút sự chú ý đến tính biến thiên của dữ liệu. Một vấn đề khác mà chúng tôi gặp phải là không phải lúc nào các nhà nghiên cứu cũng rút ra được kết luận đúng từ khoảng tin cậy. Ví dụ: so sánh giá trị của một thống kê thu được trong một nghiên cứu với khoảng tin cậy 95% gắn với giá trị trung bình của thống kê đó từ hơn 30 nghiên cứu dường như là sai lệch

Vẽ N mẫu (N sẽ ở hàng trăm và nếu phần mềm cho phép, tính bằng hàng nghìn) từ mẫu ban đầu có thay thế

2

Đối với mỗi mẫu, tìm trung bình mẫu

3

Sắp xếp các phương tiện mẫu này theo thứ tự độ lớn

4

Để có được khoảng tin cậy 95%, chúng ta sẽ tìm 95% trung bình của mẫu có nghĩa là. Đối với điều này, tìm phương tiện tại 2. 5% và 97. 5% phần trăm. 2. phân vị thứ 5 sẽ ở vị trí (0. 025)(N + 1) và 97. phân vị thứ 5 sẽ ở vị trí (0. 975)(N + 1). Nếu bất kỳ số nào trong số này không phải là số nguyên, hãy làm tròn đến số nguyên gần nhất. Giá trị của các vị trí này là giới hạn dưới và trên của khoảng thời gian khởi động 95% cho giá trị trung bình thực

Cần lưu ý rằng mỗi khi chúng tôi thực hiện quy trình này, chúng tôi có thể nhận được một khoảng thời gian khởi động hơi khác nhau. Bây giờ chúng tôi đưa ra một ví dụ

Ví dụ 13. 3. 4

Đối với dữ liệu được cung cấp trong Ví dụ 13. 3. 2 , đạt được khoảng tin cậy bootstrap 95% cho μ.

Dung dịch

Chúng tôi đã lấy N = 200 mẫu có kích thước 12. Như vậy 0. 025 × 201 = 5. 025 ≈ 5 và 0. 975 × 201 = 195. 975 ≈  196. Do đó, lấy giá trị thứ 5 và thứ 196 của mẫu được sắp xếp (theo thứ tự tăng dần) có nghĩa là, chúng tôi nhận được 95% khoảng tin cậy bootstrap cho μ is (263.8,311.5).

1

So sánh khoảng tin cậy cổ điển mà chúng tôi thu được trong Ví dụ 6. 3. 3, tức là (257. 81, 313. 59), khoảng tin cậy bootstrap của Ví dụ 13. 3. 4 có độ dài nhỏ hơn và do đó ít biến đổi hơn. Ngoài ra, chúng ta đã thấy trong Ví dụ 6. 3. 3 rằng giả định về tính quy tắc là cần thiết cho khoảng tin cậy đã bị nghi ngờ. Trong phương pháp bootstrap, chúng tôi không có bất kỳ giả định phân phối nào.

2

Bởi vì các phương pháp bootstrap phù hợp hơn với các phương pháp không tham số, nên đôi khi, nên lấy một khoảng tin cậy về trung vị hơn là trung bình. Với một sửa đổi nhỏ của quy trình mà chúng ta đã mô tả cho khoảng tin cậy bootstrap cho giá trị trung bình, chúng ta có thể thu được khoảng tin cậy bootstrap cho giá trị trung bình.

Quy trình tìm khoảng tin cậy bootstrap cho trung vị

1

Vẽ N mẫu (N sẽ ở hàng trăm và nếu phần mềm cho phép, tính bằng hàng nghìn) từ mẫu ban đầu có thay thế

2

Đối với mỗi mẫu, hãy tìm trung vị mẫu

3

Sắp xếp các trung vị mẫu này theo thứ tự độ lớn

4

Để có được khoảng tin cậy 95%, chúng ta sẽ tìm 95% trung vị của mẫu. Đối với điều này, tìm trung vị tại 2. 5% và 97. 5% phần tư. 2. phân vị thứ 5 sẽ ở vị trí (0. 025)(N + 1) và 97. phân vị thứ 5 sẽ ở vị trí (0. 975)(N + 1). Nếu bất kỳ số nào trong số này không phải là số nguyên, hãy làm tròn đến số nguyên gần nhất. Các giá trị của các vị trí này là giới hạn dưới và trên của khoảng thời gian khởi động 95% cho trung bình

Trong thực tế, nên lấy bao nhiêu mẫu bootstrap? . mức độ quan trọng của kết quả và loại sức mạnh tính toán nào có sẵn. Nói chung, tốt hơn là bắt đầu với 1000 mẫu con. Với sức mạnh tính toán hiện có, thậm chí thực hiện 10.000 lần lặp lại không phải là vấn đề lớn. Có rất nhiều công trình trong tài liệu về kiểm tra giả thuyết bootstrap và hồi quy. Đây là ngoài phạm vi của chương này. Trong Chương 10 chúng tôi sử dụng phương pháp lấy mẫu lại bootstrap để thu được các ước tính Bayes theo kinh nghiệm.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128178157000130

Mô hình tiếp xúc tích lũy

Debasis Kundu, Ayon Ganguly, trong Phân tích các mô hình ứng suất theo bước , 2017

2. 3. 5 So sánh số

Mitra và cộng sự. [ 31] đã thực hiện các thử nghiệm mô phỏng mở rộng để so sánh hiệu suất của khoảng tin cậy bootstrap, the asymptotic confidence intervals and the CRIs. It is observed that the performances of the bootstrap confidence intervals are better than the asymptotic confidence intervals in terms of the coverage percentages, although the average lengths of bootstrap confidence intervals are slightly larger than those of asymptotic confidence intervals. It is also observed that for fixed sample size n và r, khi giá trị của τ1 tăng lên, hiệu suất của θ^1improves in terms of lower biases and MSEs on the account of availability of more data points, and as expected the performance of θ^2deteriorates, but very marginally. The performances of the BEs based on the noninformative priors are quite satisfactory. The biases and MSEs of the BEs are smaller than those of the MLEs for all the parameters. The average lengths of the HPD CRIs are also smaller than the corresponding average lengths of the bootstrap confidence intervals, and they maintain the coverage percentages. Based on the extensive simulation experiments BEs with noninformative priors are recommended in this case.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128097137000028

Kiểm tra tuổi thọ ứng suất theo từng bước với nhiều chế độ lỗi

Debasis Kundu, Ayon Ganguly, trong Phân tích các mô hình ứng suất theo bước , 2017

4. 3. 3 So sánh số và phân tích dữ liệu

Balakrishnan và Han [ 42 ] đã thực hiện các thử nghiệm mô phỏng mở rộng để quan sát hiệu quả của các phương pháp khác nhau trong thực tế. Chúng tôi báo cáo ngắn gọn những phát hiện của họ như sau. Người ta quan sát thấy rằng hiệu suất của MLE s khá khả quan theo nghĩa là khi kích thước mẫu tăng lên, độ lệch trung bình và sai số bình phương trung bình (MSE) giảm. Hiệu suất của khoảng tin cậy chính xác thu được bằng cách giải các phương trình phi tuyến tính như đã đề cập trước đây là rất tốt theo nghĩa là chúng duy trì tỷ lệ phần trăm bao phủ cho tất cả các tham số ở các mức danh nghĩa khác nhau và cho các giá trị τ1 khác nhau . Ví dụ: nếu τ1 nhỏ thì tỷ lệ che phủ của θ11 và θ12 thấp hơn giá trị danh nghĩa và tương tự khi τ1 lớn thì tỷ lệ che phủ tương ứng của θ21 và θ22 là nhỏ. Người ta cũng quan sát thấy rằng khi τ1 nhỏ thì độ dài kỳ vọng của khoảng tin cậy chính xác cho θ11 và θ12 lớn hơn đáng kể so với hai khoảng tin cậy kia. Hiện tượng tương tự cũng xảy ra đối với θ21 và θ22 khi τ1 lớn. bootstrap confidence intervals cannot maintain the coverage percentages of all the θij for all τ1 values. For example, if τ1 is small the coverage percentages of θ11 and θ12 are lower than the nominal value and similarly when τ1 is large, the corresponding coverage percentages of θ21 and θ22 are small. It is also observed that when τ1 is small the expected lengths of the exact confidence intervals for θ11 and θ12 are significantly larger than the other two. The same phenomenon is observed for θ21 and θ22 when τ1 is large.

Bây giờ chúng tôi trình bày phân tích tập dữ liệu do Balakrishnan và Han báo cáo ban đầu [ 42 ]. Tập dữ liệu được tạo với n = 25, r = 20, τ1 = 3 và θ11 = 8. 96, θ12 = 12. 18, θ21 = 4. 48, θ22 = 4. 06. Tập dữ liệu được trình bày trong Bảng 4. 1 . Trong trường hợp này n11 = 7, n12 = 5, n21 = 4, n22 = 4. MLE s của θij được cung cấp tại đây.

Bảng 4. 1 . Bộ dữ liệu mô phỏng của Balakrishnan và Han [ 42 ]

Mức độ căng thẳng 1 Mức độ căng thẳng 2(trước τ1 = 3)(sau τ1 = 3)Thời gian hư hỏng Nguyên nhân hư hỏng Thời gian hư hỏng Nguyên nhân hư hỏng0. 14513. 10510. 28913. 53720. 34523. 60820. 38213. 62110. 57523. 64020. 57713. 81411. 12614. 51421. 58814. 94611. 59721. 77212. 42822. 7442

θ^11=7. 510,θ^12=10. 514,θ^21=4. 128,θ^22=4. 128

Lưu ý rằng khoảng tin cậy 95% dựa trên các phương pháp khác nhau được báo cáo trong Bảng 4. 2 . Người ta quan sát thấy rằng độ dài của khoảng tin cậy chính xác của θ12, θ21 và θ22 lớn hơn đáng kể so với hai khoảng còn lại.

Bảng 4. 2 . Khoảng tin cậy 95% của θij thu được bằng các phương pháp khác nhau

Tham sốChính xácAsymptoticBootstrapθ11 = 8. 96(3. 647, 16. 912)(1. 947, 13. 073)(3. 906, 15. 606)θ12 = 12. 18(4. 635, 28. 457)(1. 298, 19. 729)(5. 216, 24. 401)θ21 = 4. 48(1. 633, 19. 177)(0. 083, 8. 174)(1. 412, 14. 185)θ22 = 4. 06(1. 633, 19. 177)(0. 083, 8. 174)(1. 637, 18. 534)

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128097137000041

Sinh học dân số tích hợp và mô hình hóa, Phần B

Ruth King, Rachel McCrea, trong Sổ tay thống kê , 2019

2. 1. 1 ví dụ. dữ liệu chuột

Chúng tôi xem xét một ví dụ về dữ liệu chụp–thu thập lại liên quan đến chuột hươu (Peromyscus maniculatus) được thu thập bằng bẫy trong khoảng thời gian 6 ngày liên tiếp tại East Stuart Gulch, Colorado bởi V. Reid. Xem Huggins (1991) để thảo luận thêm về dữ liệu. Với mục đích chứng minh ứng dụng của công cụ ước tính hai mẫu, chúng tôi đơn giản hóa dữ liệu bằng cách xác định dịp chụp 1 là ngày 1–3 và chụp dịp 2 là ngày 4–6. Do đó, một con vật bị mắc bẫy vào bất kỳ ngày nào trong số các ngày 1, 2 hoặc 3 đều được ghi nhận là đã được quan sát thấy ở lần bắt 1; . Note that we will consider the data more fully in Sections 2. 2 and 3 , and in particular we will remove the combining of days implemented here. The corresponding, simplified, two-sample capture–recapture data are provided in Table 2 .

Table 2 . Observed Mice Data Using a Two-Sample Capture–Recapture Study

Capture Occasion 201Capture0?9Occasion 11227

Applying the Lincoln–Petersen estimator we obtain an estimate of the total population size of 38. 41. The corresponding 95% confidence interval for the total population using a nonparametric bootstrap approach is given by (38. 19, 38. 81). We note that applying the Chapman estimator provides a very similar estimate of 38. 64 and associated 95% nonparametric bootstrap confidence interval of (38. 00, 40. 09). Both estimates suggest that the majority of individuals have been observed within the study with little uncertainty.

Throughout this chapter we apply a nonparametric bootstrap approach for calculating the confidence intervals of the parameters. To calculate the associated confidence interval of the parameters, within each bootstrap replication, we simulate “new” data by sampling with replacement over the set of observed capture histories and calculate the associated MLEs of the model parameters. Thus, we take the capture histories as the sampling level. We use a percentile bootstrap confidence interval by taking the lower and upper 2. 5% quantiles of the associated MLEs obtained over the bootstrap replicates. The nonparametric bootstrap approach is used for several reasons. (i) the bootstrap approach does not rely on the asymptotic normality assumption which is perhaps questionable in this case given the amount of available data; (ii) the estimates of population size are close to the boundary leading to unreliable confidence intervals (using the delta method to obtain standard errors of transformed estimates even when this may appear reasonable may lead to naive confidence intervals with bounds outside the permissible range); (iii) for ease of use for calculating associated confidence intervals of functions of the estimated parameters (see, for example, Section 3. 2 where we individually estimate the population sizes of subgroups corresponding to males and females, and wish to also obtain an estimate of the total population size).

For the above observed data, with only two capture occasions, the estimates rely on a number of assumptions. For example, this includes that the population is homogeneous with regard to capture probabilities, so that all individuals have the same capture probability at a given occasion. Cụ thể, điều này ngụ ý rằng các trường hợp bắt giữ là độc lập với nhau để một cá nhân được quan sát trong lần bắt giữ đầu tiên không ảnh hưởng đến xác suất liên quan mà cá nhân đó được quan sát trong lần bắt giữ thứ hai—hãy nhớ lại cơ sở lý luận của công cụ ước tính Lincoln–Petersen. Nói cách khác, xác suất mà một cá nhân được quan sát ở lần bắt thứ hai không phụ thuộc vào việc họ có được quan sát ở lần bắt đầu tiên hay không. Những sai lệch trong hệ thống so với những giả định như vậy sẽ dẫn đến những ước tính sai lệch và không đáng tin cậy về tổng quy mô dân số. Tuy nhiên, thật không may, đối với các nghiên cứu thu hồi-thu hồi hai mẫu, không thể kiểm tra các giả định như vậy—chúng tôi có ba giá trị dữ liệu được quan sát cho phép ước tính ba tham số. tổng kích thước quần thể, xác suất một cá thể được quan sát thấy trong trường hợp bắt giữ 1 và xác suất một cá thể được quan sát thấy trong trường hợp bắt giữ 2. There are no additional degrees of freedom to model or test for independence or additional heterogeneity. Tuy nhiên, chúng tôi đã đơn giản hóa dữ liệu cho ví dụ này để so sánh với các phân tích sau này. Một kiểm tra trực quan đơn giản về dữ liệu chi tiết hơn cho thấy rằng những giả định này có khả năng bị vi phạm. Ví dụ: một số con chuột bị bắt cả sáu lần trong khi những con khác chỉ bị bắt một lần, khiến chúng tôi đặt câu hỏi về giả định khả năng phát hiện của tất cả các cá thể là như nhau. Một cách rõ ràng để điều tra các vấn đề như vậy và giải quyết chúng trong quy trình lập mô hình là mở rộng thiết kế nghiên cứu và xem xét nhiều trường hợp chụp (như trường hợp dữ liệu chuột chi tiết hơn)

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/S0169716118300877

CÁC PHƯƠNG PHÁP KHỞI ĐỘNG CƠ BẢN

Rand R. Wilcox, trong Áp dụng các kỹ thuật thống kê đương đại , 2003

7. 3 Phương pháp phân vị phần trăm đã sửa đổi cho hồi quy bình phương nhỏ nhất và tương quan Pearson

Cả hai phương pháp phân vị và bootstrap-t đã được xem xét khi tính toán một. khoảng tin cậy 95 cho độ dốc của đường hồi quy bình phương nhỏ nhất — và cả hai đều được phát hiện là không đạt yêu cầu khi cỡ mẫu nhỏ hoặc thậm chí lớn vừa phải. Ví dụ: có những tình huống đã biết trong đó phương pháp phân vị yêu cầu n = 250 để có được phạm vi xác suất chính xác hợp lý. Tuy nhiên, khi so sánh một số phương pháp, Wilcox (1996b) đã tìm thấy một sửa đổi nhỏ của phương pháp phân vị hoạt động khá tốt trên một lớp tương đối rộng các đối tượng không bình thường. . Ngoài ra, không giống như phương pháp thông thường để tính toán khoảng tin cậy cho độ dốc, phương pháp này hoạt động tốt khi có phương sai thay đổi.

Để bắt đầu, trước tiên chúng tôi lưu ý rằng trong hồi quy, hai phương pháp chung đã được xem xét để tạo mẫu bootstrap. Phương pháp thứ nhất dựa trên việc lấy mẫu lại các giá trị từ phần dư, nhưng không đưa ra chi tiết nào vì phương pháp này xử lý kém phương sai thay đổi (e. g. , Wu, 1986 ). Phương pháp thứ hai linh hoạt hơn nhiều (vì những lý do chung được nêu chi tiết trong Efron và Tibshirani, 1993 , trang. 113–115). Nó cho phép phương sai thay đổi, vì vậy chúng tôi tập trung vào phương pháp này ở đây. Cụ thể, chúng tôi thu được một mẫu bootstrap đơn giản bằng cách lấy mẫu lại, với sự thay thế, n cặp giá trị từ n cặp giá trị ban đầu được sử dụng để tính toán ước tính bình phương nhỏ nhất của độ dốc và hệ số chặn. Trong các ký hiệu, nếu chúng ta quan sát (X1, Y1), …, (Xn, Yn), một mẫu bootstrap thu được bằng cách lấy mẫu lại n cặp điểm này, với mỗi cặp điểm có xác suất được lấy mẫu lại là 1/n. Ví dụ, nếu chúng tôi quan sát thấy

(6, 2), (12, 22), (10, 18), (18, 24), (16, 29),

một mẫu bootstrap có thể là

(10, 18), (16, 29), (10, 18), (6, 2), (6, 2)

Tức là, có n = 5 cặp điểm, do đó, với mỗi lần lấy mẫu lại, có 1/5 xác suất cặp điểm đầu tiên được chọn sẽ là (6, 2) và điều này đúng với cặp điểm còn lại . Ký hiệu phổ biến cho mẫu bootstrap thu được theo cách này là (X1*,Y1*),…(Xn*,Yn*) . Trong hình minh họa của chúng tôi, (X1*,Y1*)=(10,18)(X2*,Y2 . Ước tính bình phương nhỏ nhất của độ dốc và giao điểm dựa trên mẫu bootstrap này được biểu thị bằng b1* và b0* tương ứng. . The least squares estimate of the slope and intercept based on this bootstrap sample is represented by b1* and b0* respectively.

Phương pháp bootstrap phân vị cơ bản được mô tả trong Phần 7. 1 mở rộng đến tình huống hiện tại một cách đơn giản. Để tính toán một. 95 cho độ dốc, trước tiên hãy lặp lại quy trình tạo mẫu bootstrap có kích thước n B lần, mang lại B ước tính bootstrap về độ dốc, mà chúng tôi đặt tên là b11*. Sau đó, một xấp xỉ. Khoảng tin cậy 95 cho độ dốc được đưa ra bởi 95% ở giữa của các ước tính bootstrap này. Trong các ký hiệu, chúng tôi viết các ước tính bootstrap B này của độ dốc theo thứ tự tăng dần là b1(1)* ≤ b1(2)* ≤ … ≤ b1(B)*. Để ℓ=. 025B và đặt u = B − ℓ sau đó làm tròn ℓ và u thành số nguyên gần nhất, gần đúng. khoảng tin cậy 95 cho độ dốc là

(b1(ℓ+1)*,b1(u)*)

Mặc dù phạm vi xác suất của khoảng tin cậy vừa đưa ra có thể khác đáng kể so với. 95 khi n nhỏ hơn 250, nó có một thuộc tính có giá trị thực tế đáng kể. Với n, phạm vi xác suất thực tế khá ổn định trên một phạm vi phân phối tương đối rộng, ngay cả khi có mức độ phương sai thay đổi khá lớn và cỡ mẫu nhỏ. Điều này gợi ý một phương pháp để có được khoảng tin cậy chính xác hợp lý. Adjust the confidence interval so that the actual probability coverage is close to . 95 khi lấy mẫu từ phân phối chuẩn và có phương sai đồng nhất. Sau đó, sử dụng khoảng tin cậy đã điều chỉnh này cho các phân phối không chuẩn hoặc khi có phương sai thay đổi. Vì vậy, chúng tôi điều chỉnh phương pháp bootstrap phân vị khi tính toán một. khoảng tin cậy 95, dựa trên công cụ ước lượng hồi quy bình phương nhỏ nhất, theo cách sau. Lấy B = 599 và đối với mỗi mẫu bootstrap, hãy tính ước tính bình phương nhỏ nhất của độ dốc. Tiếp theo, đặt 599 giá trị này theo thứ tự tăng dần, thu được b1(1)* ≤ … ≤ b1(599)*. Các. khoảng tin cậy 95 là

(7. 7)(b1(a)*,b1(c)*),

với n < 40, a = 7 và c = 593; . Nói cách khác, những lựa chọn này cho a và c bắt nguồn từ chiến lược của Gosset để xử lý các cỡ mẫu nhỏ. Giả định tính quy tắc đối với một cỡ mẫu nhất định, xác định giá trị (quan trọng) sao cho xác suất xảy ra lỗi Loại I là α, sau đó hy vọng rằng các giá trị này tiếp tục cho kết quả tốt trong điều kiện không bình thường. Chiến lược này hoạt động tương đối tốt ở đây ( Wilcox, 1996b ), nhưng nó không hoạt động tốt đối với các vấn đề khác, chẳng hạn như khi tính khoảng tin cậy cho . Khoảng tin cậy dựa trên Phương trình (7. 7) sẽ được gọi là phương pháp bootstrap phần trăm sửa đổi.

KIỂM ĐỊNH GIẢ THUYẾT

Từ chối H0. β1=0 nếu khoảng tin cậy cho độ dốc, được cho bởi Phương trình (7. 7) , không chứa số 0.

Khoảng tin cậy cho phần chặn có thể được tính theo cách tương tự. Bạn chỉ cần thay b1, ước lượng bình phương nhỏ nhất của độ dốc, bằng b0, ước tính của phần chặn trong phần mô tả của phương pháp bootstrap đã sửa đổi vừa đưa ra. Mặc dù có các tình huống phát sinh khi chúng tôi có được phạm vi xác suất chính xác hơn so với phương pháp thông thường được trình bày trong Chương 6 , các vấn đề thực tế vẫn xảy ra. Nghĩa là, chúng tôi có được phạm vi xác suất chính xác khi tính toán khoảng tin cậy cho độ dốc trong một phạm vi tình huống tương đối rộng, nhưng phương pháp bootstrap phần trăm đã sửa đổi kém thành công hơn khi xử lý phần chặn. Cách cải thiện phương pháp bootstrap đã sửa đổi khi xử lý phần chặn vẫn chưa được biết.

Có hai điểm thực tế cần lưu ý khi so sánh khoảng tin cậy bootstrap cho độ dốc vừa được mô tả với phương pháp thông thường trong Chapter 6. First, often the bootstrap method yields a longer confidence interval because its probability coverage is generally much closer to the nominal .95 level — the actual probability coverage of the conventional method is often much smaller than .95. In some cases the actual probability coverage drops below .51 That is, the conventional method often gives a shorter confidence interval because it is not nearly as accurate as the modified percentile bootstrap method. Second, despite having longer confidence intervals, situations arise where the bootstrap method rejects H0: β1 =0 and the conventional method does not.

THÍ DỤ

Sử dụng dữ liệu xâm lược trong Bảng 6. 3 , giả thuyết H0 đã được chứng minh. β1 = 0 không bị bác bỏ với α =. 05 bằng cách sử dụng bài kiểm tra T của Học sinh thông thường được đưa ra bởi Phương trình (6. 10) . Sử dụng phương pháp bootstrap phần trăm đã sửa đổi,. Khoảng tin cậy 95 cho độ dốc là (−0. 105, −0. 002), khoảng này không chứa số 0, vì vậy bạn từ chối. Các. 95 khoảng tin cậy dựa trên T của Sinh viên [sử dụng Phương trình (6. 8) ] là (−0. 08, 0. 0002).

THÍ DỤ

Đối với giá bán nhà ở Bảng 6. 4 , các. 95 khoảng tin cậy sử dụng phương pháp bootstrap là (. 166,. 265) so với (. 180,. 250) sử dụng T của sinh viên. Student's T đưa ra một khoảng tin cậy ngắn hơn, nhưng về cơ bản nó có thể kém chính xác hơn vì nó nhạy cảm với việc vi phạm các giả định về tính chuẩn tắc và phương sai thay đổi đồng nhất.

7. 3. 1 Chức năng S-PLUS lsfitci

Chức năng S-PLUS

lsfitci(x,y)

tính toán một sửa đổi. 95 phần trăm khoảng tin cậy bootstrap cho độ dốc và giao điểm của đường hồi quy bình phương nhỏ nhất. Ở đây x là một vectơ của các giá trị dự đoán và y là một vectơ tương ứng của các giá trị kết quả.

7. 3. 2. Kiểm tra mối tương quan bằng không

Phương pháp bootstrap phân vị phần trăm sửa đổi vừa được mô tả hoạt động tương đối tốt khi mục tiêu là kiểm tra giả thuyết về mối tương quan bằng không ( Wilcox & Muska, 2001). You proceed exactly as already described in this section, except for every bootstrap sample you compute Pearson's correlation r rather than the least squares estimate of the slope. So now we have B bootstrap values for r, which, when written in ascending order, we label r(1)* ≤ … ≤ r(B)*. Then a .95 confidence interval for ρ is

(r(a)*,r(c)*),

một lần nữa với n < 40, a = 7 và c = 593; . Như thường lệ, nếu khoảng này không chứa số 0, hãy từ chối H0. ρ = 0

Chúng ta đã thấy trong Chương 6 rằng phương sai thay đổi gây ra bài kiểm tra T của Sinh viên về H0. ρ = 0 để có các thuộc tính không mong muốn. Tất cả các dấu hiệu cho thấy bootstrap phân vị đã sửa đổi sẽ loại bỏ những vấn đề này. Khi ρ ≠ 0, phạm vi xác suất thực tế vẫn khá gần với. 95 với điều kiện ρ không quá lớn. Nhưng nếu, ví dụ, ρ =. 8, phạm vi xác suất thực tế của phương pháp bootstrap phần trăm sửa đổi có thể không đạt yêu cầu trong một số trường hợp ( Wilcox & Muska, 2001 ). Không có phương pháp được biết đến để khắc phục vấn đề này.

7. 3. 3 Nút chức năng S-PLUS

Chức năng S-PLUS

lõi ngô(x,y)

tính toán một. khoảng tin cậy 95 cho ρ bằng cách sử dụng phương pháp bootstrap phần trăm đã sửa đổi. Một lần nữa, x và y là các biến S-PLUS chứa các vectơ quan sát

THÍ DỤ

Đối với dữ liệu xâm lược trong Bảng 6. 3 , Bài kiểm tra T của sinh viên không bác bỏ giả thuyết rằng mối tương quan bằng không. Thay vào đó, sử dụng phương thức khởi động phân vị phần trăm đã sửa đổi, hàm S-PLUS corb trả về một. khoảng tin cậy 95 của (−0. 54, −0. 01). Vậy bây giờ ta bác bỏ H0. ρ = 0 (vì khoảng tin cậy không chứa số 0) và ta kết luận rằng hai biến này phụ thuộc.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780127515410500286

So sánh hai nhóm

Rand R. Wilcox, trong Giới thiệu về Kiểm tra giả thuyết và ước tính mạnh mẽ (Ấn bản thứ năm) , 2022

5. 4. 1 So sánh M-Estimators

Phần này nhận xét về trường hợp đặc biệt, trong đó mục tiêu là so sánh M-số đo vị trí dựa trên công cụ ước tính M một bước. Chương 4 lưu ý rằng, dựa trên các mô phỏng được thực hiện cho đến nay, phương pháp tốt nhất để tính toán khoảng tin cậy cho μm< . Một lần nữa, khi so sánh hai nhóm độc lập bằng cách sử dụng công cụ ước tính vị trí M một bước, phương pháp bootstrap phân vị hoạt động khá tốt. Ví dụ: với kích thước mẫu là 20 hoặc 30, trong số các tình huống được xem xét trong , the M-measure of location, is to use a percentile bootstrap method. When comparing two independent groups using a one-step M-estimator of location, again, a percentile bootstrap method performs fairly well. For example, with sample sizes of 20 or 30, among the situations considered in Özdemir (2013) , các ước tính về xác suất lỗi Loại I thực tế, khi thử nghiệm . 05 cấp, dao động trong khoảng 0. 049 và 0. 061.

Khoảng tin cậy không bootstrap dựa trên ước tính sai số chuẩn sẽ cung cấp phạm vi xác suất tốt khi kích thước mẫu đủ lớn, . Nếu cả hai phân phối đều đối xứng, thì khoảng tin cậy dựa trên sai số chuẩn ước tính dường như có giá trị khi phân phối t của Student được sử dụng để xác định giá trị tới hạn phù hợp, nhưng không có quy tắc quyết định tốt, dựa trên dữ liệu thực nghiệm có sẵn, liệu phân phối có đủ đối xứng hay không. (Người ta có thể kiểm tra giả định rằng các bản phân phối là đối xứng, nhưng một phép thử như vậy phải có bao nhiêu công suất để biện minh cho việc sử dụng một phương pháp giả định các bản phân phối đối xứng?)

Özdemir (2013) đã đưa ra một phương pháp thay thế mà xác suất lỗi Loại I ước tính nằm trong khoảng 0. 044 và 0. 050 trong số các tình huống được xem xét trong một nghiên cứu mô phỏng, trái ngược với việc sử dụng phương pháp bootstrap phần trăm trong đó xác suất lỗi Loại I nằm trong khoảng 0. 049 và 0. 061. Khả năng kiểm soát được cải thiện đối với xác suất lỗi Loại I phải trả giá bằng thời gian thực hiện cao hơn và không có khoảng tin cậy. Sơ lược về phương pháp như sau. Đặt μˆj ( j=1 , 2) biểu thị một bước . 6. 4 σˆmj2, which is computed as described in Section 3.6.4 . (Hàm R mestse, được mô tả trong Phần 3. 6. 5 , thực hiện phép tính. ) Hãy

wj=1/σˆmj21/σˆm12+1/σˆm22,X˜=w1μˆ1+w2μˆ2,

Tj=μˆj−X˜σˆmj

Áp dụng phép biến đổi chuẩn hóa, bắt nguồn từ Bailey (1980) , cho Tjvalues:

Zj=4νj2+5(2z1−α/22+3)/244νj2+νj+(4z1−α/22+9)/12νj1/2{ln(1+Tj2νj)}1/2,

trong đó z1−α/21−α/2quantile of a standard normal distribution, νj=nj−i1−i2−1, and i1and i2are defined as in Section 3.6.2 liên quan đến phương trình. (3. 25) . Thống kê kiểm tra là

D2=Z12+Z22

Giá trị tới hạn cấp độ α được xác định thông qua phương pháp bootstrap-t như được mô tả trong Phần 5. 3. 2 . Cũng xem phương thức TM trong Phần 7. 6 . Đối với một phương pháp dựa trên kỹ thuật khả năng thực nghiệm, xem Velina et al. (2019) .

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/science/article/pii/B9780128200988000117

Mô hình bệnh tật và sức khỏe cộng đồng, Phần A

Sutirtha Chakraborty,. Susmita Datta, trong Sổ tay thống kê , 2017

4 Ứng dụng cho dữ liệu cấy ghép tủy xương

Chúng tôi minh họa hiệu suất của phương pháp của mình bằng một nghiên cứu cấy ghép tủy xương nổi tiếng ( Copelan et al. , 1991 ). Dữ liệu được thu thập từ nghiên cứu này cung cấp thông tin về tình trạng và thời gian khởi phát tương ứng của chúng đối với một nhóm 137 bệnh nhân mắc bệnh bạch cầu (ALL/AML) đã được theo dõi cho đến chết/tái phát sau khi được ghép tủy xương ban đầu. Bộ dữ liệu này đã được một số tác giả nghiên cứu rộng rãi trước đây với các công thức khác nhau của cấu trúc mô hình cơ bản. Trong phân tích của mình, chúng tôi hình dung quá trình tiến triển của những bệnh nhân này qua các trạng thái trung gian khác nhau dưới dạng một mạng lưới đa trạng thái với bảy trạng thái sau. 1—trạng thái gốc/nút biểu thị việc tiếp nhận ghép tủy xương, 2—phát triển bệnh mô ghép so với vật chủ cấp tính (GVHD), 3—tiểu cầu trở lại mức bình thường (phục hồi tiểu cầu), 4—tiểu cầu trở lại mức bình thường . 1 Fig. 1 ). Sơ đồ biểu thị số lần chuyển đổi nội bộ cho tập dữ liệu này được đưa ra trong Bảng 8 . Cùng với thời gian đến dữ liệu sự kiện cho các trạng thái khác nhau trong mạng, chúng tôi cũng có thông tin về một số đồng biến cho tất cả 137 cá nhân đang được nghiên cứu. Trong số chúng, chúng tôi đã chọn hai hiệp phương sai liên tục. tuổi của bệnh nhân và tuổi của người hiến tặng để chứng minh tính hiệu quả của phương pháp của chúng tôi. Để biết mô tả chi tiết về toàn bộ tập dữ liệu, chúng tôi giới thiệu người đọc đến Klein và Moeschberger (1997) .

Bảng 8 . Ma trận Hiển thị Số lượng Chuyển đổi từ Tiểu bang sang Tiểu bang cho Dữ liệu Cấy ghép Tủy xương

12345671071170011220030223200194434400125211663227783

Datta and Satten (2001) đã chỉ ra rằng đối với tập dữ liệu này, mẫu kiểm duyệt thay đổi theo trạng thái hiện tại. Do đó, chúng tôi sử dụng hiệp phương sai phụ thuộc vào thời gian nội bộ của nghề nghiệp tiểu bang để ước tính trọng số IPCW thông qua mô hình nguy cơ tuyến tính của Aalen. Sử dụng các trọng số ước tính này, chúng tôi tính toán xác suất ước tính pˆj(t. x~) tại vectơ đồng biến trung bình (theo chiều điểm) x~=(28,28) cho mọi trạng thái j . Việc xây dựng khoảng tin cậy được mô tả trong Tài liệu bổ sung trên in the model and plot them in the scale of all the observed transition times in the data along with their corresponding 95% pointwise bootstrap confidence intervals. Construction of the confidence intervals is described in the Supplementary Materials on http. //10. 1016/bs. chủ nhà. 2017. 08. 004 .

Hình. 2 thể hiện bảy ô con thể hiện xác suất nghề nghiệp có điều kiện ước tính của một cá nhân giả định ở độ tuổi 28 (được cấy ghép tủy xương nhận được từ một người hiến tặng cùng độ tuổi) ở mỗi tiểu bang trong số bảy tiểu bang trong đa tiểu bang . Đối với trạng thái 1, chúng ta thấy rõ ràng xác suất nghề nghiệp giảm dần cùng với sự tiến triển của thời gian như mong đợi từ thực tế là với sự gia tăng về khoảng thời gian, ngày càng có nhiều cá nhân rời khỏi trạng thái ban đầu. Mặt khác, xác suất ước tính cho trạng thái cuối 7 (trạng thái hấp thụ) phản ánh xu hướng tăng dần do nguy cơ tích lũy cao hơn của việc chuyển sang trạng thái hấp thụ (tử vong/tái nghiện) theo thời gian. Đối với các trạng thái nhất thời 2–6, chúng tôi quan sát thấy một mô hình hỗn hợp (xác suất nghề nghiệp của trạng thái tăng lên khi bắt đầu cho đến một thời điểm nhất định sau đó là giảm dần) được kiểm soát bởi các vị trí trung gian của chúng trong mô hình dẫn đến dòng cá nhân khác nhau . Ngoài ra, khoảng tin cậy bootstrap 95% được xây dựng như đối với giai đoạn j, j = 0(1)4 trong mạng ( Hình. 3 ). Các giới hạn tin cậy bao trùm các ước tính xác suất nghề nghiệp của tiểu bang ước tính thể hiện rõ ràng độ chính xác khá tốt của phương pháp của chúng tôi về mặt ước tính xác suất nghề nghiệp cho các tiểu bang khác nhau trong mô hình.

Bootstrap có giống với khoảng tin cậy không?

Hình. 2 . Mạng hiển thị các giai đoạn khác nhau và đường chuyển tiếp lẫn nhau của chúng cho dữ liệu cấy ghép tủy xương.

Bootstrap có giống với khoảng tin cậy không?

Hình. 3 . Biểu đồ xác suất nghề nghiệp có điều kiện ước tính từ phương pháp trang bị ngược IPCW ở các giá trị đồng biến trung bình cùng với khoảng tin cậy bootstrap 95% tương ứng của chúng (được biểu thị bằng các đường chấm chấm) cho bảy giai đoạn trong dữ liệu cấy ghép tủy xương.

Để khám phá tác động của từng biến trong số hai đồng biến đối với xác suất nghề nghiệp của tiểu bang, chúng tôi xây dựng hai biểu đồ bổ sung ( Hình. 45 ) cho biết xác suất nghề nghiệp ở giai đoạn có điều kiện ước tính tại một thời điểm cụ thể (105 ngày, tức là . Chúng tôi thấy rằng trong cả hai biểu đồ, xác suất nghề nghiệp ước tính cho các trạng thái khác nhau trong mô hình có các kiểu phụ thuộc khác nhau đáng kể vào hai đồng biến. tuổi của bệnh nhân và tuổi của nhà tài trợ. Từ Hình. 4 chúng ta có thể hiểu tác động của tuổi bệnh nhân đối với xác suất nghề nghiệp ở các tiểu bang khác nhau đối với những người hiến tặng ở độ tuổi 29 (phân vị thứ 55). Từ biểu đồ đầu tiên trong hình này, chúng ta thấy rằng đối với giai đoạn 1, xác suất nghề nghiệp giảm dần từ 0. 035 đến 0 đối với bệnh nhân từ 15 đến 45 tuổi với mức tăng nhẹ lên đến 0. 04 khoảng 24 năm. Điều này ngụ ý rằng về tổng thể, những bệnh nhân được cấy ghép từ người hiến tặng ở độ tuổi 29, có cơ hội chuyển ra khỏi giai đoạn 1 ngày càng cao hơn theo độ tuổi. Cốt truyện cho giai đoạn 2 cho thấy xác suất chiếm đóng là khoảng 1. 2% cho đến 21 tuổi, sau đó giảm xuống rất gần bằng 0. Điều này ngụ ý rằng những bệnh nhân trên 21 tuổi và được cấy ghép từ người hiến tặng 29 tuổi hầu như không có nguy cơ phát triển bệnh GVHD cấp tính. Đối với giai đoạn 3, chúng tôi thấy rằng cơ hội phát triển phục hồi tiểu cầu giảm từ 59. 2% đến 56. 5% cho bệnh nhân từ 15 đến 21 tuổi, sau đó tăng dần lên đến 65. 5% từ 21 đến 32 tuổi và sau đó giảm mạnh xuống 37. 8% sau 45 năm. Trong trường hợp ở giai đoạn 4, chúng tôi quan sát thấy rằng các bệnh nhân trong độ tuổi từ 15 đến 32 hầu như không có cơ hội phục hồi tiểu cầu sau khi phát triển GVHD cấp tính, trong khi tỷ lệ chênh lệch tăng lên sau đó và đạt giá trị 2. 8% khoảng 45 năm. Đối với giai đoạn 5, chúng tôi thấy xu hướng parabol trong xác suất nghề nghiệp ước tính cho thấy cơ hội phát triển GVHD cấp tính sau khi phục hồi tiểu cầu tăng dần từ 10. 2% đến 14. 8% đối với bệnh nhân từ 15 đến 23 tuổi và sau đó giảm xuống 7. 7% cho đến 37 tuổi, sau đó nó lại tăng lên 20% đối với bệnh nhân khoảng 45 tuổi. Đối với giai đoạn 6, chúng tôi thấy rằng nguy cơ phát triển GVHD mãn tính cao hơn nhiều (tối đa là 14. 4%) đối với bệnh nhân trẻ tuổi từ 15 đến 18 tuổi, sau đó giảm dần xuống 7. 3% đến 45 tuổi. Trong trường hợp của giai đoạn 7, chúng tôi thấy rằng khả năng tái phát/tử vong giảm từ 13% xuống còn 10. 2% cho bệnh nhân từ 15 đến 23 tuổi, sau đó tăng dần đến 26 tuổi. 2% đến 45 tuổi.

Bootstrap có giống với khoảng tin cậy không?

Hình. 4 . Biểu đồ ước tính xác suất nghề nghiệp ở giai đoạn có điều kiện tại một thời điểm cụ thể (105 ngày sau khi cấy ghép) là một hàm của tuổi của bệnh nhân được cấy ghép từ người hiến ở một độ tuổi nhất định (29 tuổi).

Bootstrap có giống với khoảng tin cậy không?

Hình. 5 . Biểu đồ ước tính xác suất nghề nghiệp ở giai đoạn có điều kiện tại một thời điểm cụ thể (105 ngày sau khi cấy ghép) như là một hàm của tuổi của người hiến tặng cấy ghép cho bệnh nhân ở một độ tuổi nhất định (30 tuổi).

Từ Hình. 5 chúng ta có thể hiểu tác động của tuổi của người hiến tặng đối với xác suất nghề nghiệp ở các tiểu bang khác nhau đối với bệnh nhân ở độ tuổi 30 (phân vị thứ 55). Đối với giai đoạn 1, chúng tôi thấy rằng rủi ro chuyển ra các tiểu bang khác giảm dần từ 97% xuống 95. 8% với sự gia tăng về độ tuổi của người hiến tặng từ 14 đến 24 tuổi và sau đó tăng lên 100% cho đến 39 tuổi, sau đó giảm xuống 98% sau 44 tuổi. Trong trường hợp của giai đoạn 2, chúng tôi thấy rằng cơ hội phát triển GVHD cấp tính tăng từ 0. 2% ăn 1. 4% đối với những người hiến tặng trong độ tuổi từ 14 đến 24 và sau đó giảm xuống 0 ở độ tuổi 35, sau đó lại tăng lên khoảng 1%. Cốt truyện cho giai đoạn 3 cho thấy cơ hội phục hồi tiểu cầu rất cao (đạt tối đa 73. 9%) đối với bệnh nhân được ghép từ người hiến trẻ (dưới 19 tuổi), giảm dần cho đến 55. 6% từ 21 đến 44 tuổi. Trong trường hợp ở giai đoạn 4, chúng tôi thấy rằng cơ hội bệnh nhân phục hồi tiểu cầu sau khi phát triển GVHD cấp tính là không đối với những người hiến tặng từ 14 đến 32 tuổi, cơ hội này tăng nhẹ lên 0. 9% sau 39 năm và sau đó giảm xuống 0. 5% sau 44 năm. Nhìn chung, có vẻ như đối với bệnh nhân ở độ tuổi 30, cơ hội chiếm giai đoạn 4 không bị ảnh hưởng đáng kể bởi tuổi của người hiến tặng. Đối với giai đoạn 5, chúng tôi thấy rằng cơ hội phát triển GVHD cấp tính sau khi phục hồi tiểu cầu bắt đầu từ 3. 1% ở độ tuổi 14 tuổi và giảm xuống 0. 2% ở tuổi 18, sau đó tăng dần lên 12. 7% đến 30 tuổi rồi giảm dần về 0. 4% từ 32 đến 44 tuổi. Cốt truyện cho giai đoạn 6 cho thấy sự gia tăng dần dần nguy cơ phát triển GVHD mãn tính từ 7. 7% đến 13. 7% với sự gia tăng độ tuổi của người hiến tặng từ 14 đến 44 tuổi. Đối với giai đoạn 7, nguy cơ tái phát/tử vong khá cao (18. 4%) đối với bệnh nhân 30 tuổi, được ghép từ người cho rất trẻ (dưới 15 tuổi) và sau đó giảm dần đến 9. 4% cho đến 24 tuổi, sau đó tăng dần lên 27% khi 44 tuổi.

We construct another plot representing the conditional state occupation probabilities for the individuals on a specified grid of the two covariates (constructed by taking 10 values along each coordinate direction) at a specific time point (105 days) (see Supplementary Fig. S1 trên http. //10. 1016/bs. host. 2017. 08. 004 ). Từ biểu đồ kết quả, chúng ta có thể quan sát thấy sự khác biệt đáng kể giữa các bề mặt xác suất ước tính cùng với các vị trí tọa độ khác nhau của hai đồng biến đối với tất cả các trạng thái trong mô hình. Các biểu đồ tiết lộ các đặc điểm thú vị về bề mặt xác suất nghề nghiệp ở trạng thái có điều kiện ở các kết hợp khác nhau của các giá trị đồng biến.

The following is the Supplementary material related to this chapter

Xem chươngMua sách

Đọc toàn bộ chương

URL.  https. //www. sciencedirect. com/science/article/pii/S0169716117300184

Resampling and Testing in Regression Models with Environmetrical Applications

J. Roca-Pardiñas, . W. González-Manteiga, in Comprehensive Chemometrics , 2009

1. 06. 4. 1 Application to Air Pollution Data

Time-series studies with Poisson regression have been the reference method for analyzing the short-term effects of air pollution on health. To control for the possible confounding effect of unmeasurable variables that generate trend and seasonality in the series, different parametric functions (linear, quadratic, and sinusoidal of varying width) of the variable ‘time’ were initially used. However, these models could prove very ‘rigid’ and unadaptable in the case of confounding variables of seasonal behavior of varying width and frequency. Application of GAM-based nonparametric smoothing methods (smoothing splines or LOESS) has meant a great advance in that it has eradicated the need for researchers to specify the parametric forms of seasonality a priori and enabled flexible adaptation to seasonal behavior. Consequently, most studies published in recent years on the short-term effects of pollution on health have applied this methodology. 42–44

As has already been stated, however, in cases where concurvity is present in the data, asymptotic CIs prove too narrow. 41,45–47 Alternatively, CIs can be obtained using bootstrap resampling techniques. Indeed, a comparative study was undertaken into the coverages obtained with asymptotic and bootstrap CIs, 8 using the time series Yt, denoting the number of deaths per day in the city of Vigo (Spain) in 1996, 1997, and 1998 (t = 1, …, 1096).

For each day t, black smoke (BS) (shown in Figure 1 ) BSt and temperature tempt were recorded. This study considered the Poisson model

(4)Yt∼Poisson(μt)withlog(μt)=α+βBSt+ftrend(t)+ftemp(tempt)

in which ftrend is a partial function that depends on time (seasonal and trend component) and ftemp represents the functional form of the effect of temperature on mortality. The main objective was to obtain valid CIs for the coefficient β, which denoted the log relative rate of Y associated with an increase in BS, based on the sample {(t,tempt,BSt),Yt}t=11996 . Data were analyzed using routine gam of S-Plus-based smoothing splines, with the estimated coefficients αˆ=3. 09 and βˆ=0. 001 being obtained. The estimated effects fˆtrend and fˆtemp are plotted in Figure 2 .

Bootstrap có giống với khoảng tin cậy không?

Figure 1 . Daily mean black smoke (BS) levels in Vigo for 1096 days, in the period 1996–98. Reproduced from Figueiras, A,; Roca-Pardiñas, J. ; Cadarso-Suárez, C. A. Bootstrap Method to Avoid the Effect of Concurvity in Generalized Additive Models in Time-Series Studies of Air Pollution. J. Epidemiol. Community Health 2005 , 59, 881–884, with permission from BMJ Publishing Group Ltd.

Bootstrap có giống với khoảng tin cậy không?

Figure 2 . Estimated seasonal and trend component, and estimated smoothed temperature effect. Reproduced from Figueiras, A,; Roca-Pardiñas, J. ; Cadarso-Suárez, C. A. Bootstrap Method to Avoid the Effect of Concurvity in Generalized Additive Models in Time-Series Studies of Air Pollution. J. Epidemiol. Community Health 2005 , 59, 881–884, with permission from BMJ Publishing Group Ltd.

The concurvity measure proposed by Ramsay et al. 41 was based on the correlation between the fitted values obtained from the GAM, with pollution, BSt, as the response and with time and temperature as the predictors. Specifically, to assess the degree of concurvity in our data, one should (1) fit the GAM BSt = g1(t)+ g2(tempt) + εt, where the partial functionps g1 and g2 are estimated using smoothing splines, and εt is a zero mean error variable, and (2) then compute the squared correlation (R2) between BSt and BSˆt , using the fitted values from model in Equation (4) , namely

concurvity=(correlation(BSt,BSˆt=gˆ1(t)+gˆ2(tempt)))2

In the data, concurvity was 0. 29. To vary the concurvity and thereby assess its influence on CI coverage and bias in the parameter estimate, βˆ , in model (4), the original BS was replaced by a weighted average of the original BSt, the estimated BSˆt , and the difference BSt−BSˆt . Specifically, the new variable BSst was calculated in line with BSst=w1BSt+w2BSˆt+(1−w1−w2)εˆt . Thus, by varying both weights w1 ∈ [0, 1] and w2 ∈ [0, 1], concurvity may easily be modified from 0 (w1 = w2 = 0) to 1 (w1 = 0, w2 = 1).

In the study in question, a number of scenarios were defined by using different values for w1 and w2, with the result that the degree of concurvity varied from 0. 05 to 0. 65. In each of the scenarios, 1000 samples {t,tempt,BSst,Yt•}t=11096 were considered with Yt• generated in accordance with Yt•∼Poisson(μt•) , with

log(μt•)=α•+β•BSt+ftred•(t)+ftemp•(tempt)

where α• = 3. 09, β• = 0. 001, mtrend=fˆtrend and mtemp=fˆtemp , and fˆtrend and fˆtemp were the estimated partial functions obtained with the original data. Lastly, the corresponding bootstrap and asymptotic 95% CIs were calculated for β• = 0. 001. CI coverages were calculated as the proportion of samples in which these included the true β.

In Figure 3 , CI coverages are compared for different degrees of concurvity, using asymptotic GAM and GAM bootstrap. In this figure, the vertical line is that of the true concurvity, 0. 29, obtained with w1 = 1 and w2 = 0. It will be seen that, with the asymptotic approach, increases in concurvity were accompanied by a progressive decline in coverage, which dropped as low as 80% when concurvity was 0. 6. With the bootstrap method, however, coverage remained above 94% throughout, irrespective of the degree of concurvity. Accordingly, the results of our study show that application of bootstrap techniques makes it possible for the CIs of contaminant-related effects to be calculated in time-series studies with optimum coverage, regardless of the degree of concurvity.

Bootstrap có giống với khoảng tin cậy không?

Figure 3 . Effect of concurvity on 95% CI coverage. Reproduced from Figueiras, A,; Roca-Pardiñas, J. ; Cadarso-Suárez, C. Một. Bootstrap Method to Avoid the Effect of Concurvity in Generalized Additive Models in Time-Series Studies of Air Pollution. J. Epidemiol. Community Health 2005 , 59, 881–884, with permission from BMJ Publishing Group Ltd.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780444527011000946

Khoảng tin cậy trong trường hợp một mẫu

Rand Wilcox, trong Giới thiệu về Kiểm định giả thuyết và ước lượng chắc chắn (Ấn bản thứ ba) , 2012

4. 4 phương pháp Bootstrap cơ bản

Phương pháp được sử dụng để tính khoảng tin cậy cho giá trị trung bình đã cắt, được mô tả trong Phần 4. 3 , dựa trên chiến lược cơ bản do Laplace phát triển khoảng hai thế kỷ trước. Khi sử dụng θ^ để ước tính một số tham số quan tâm, θ, hãy ước tính sai số chuẩn của θ^with say ϒ^, and try to approximate the distribution of

θ^−θϒ^

Laplace đã hoàn thành điều này bằng cách sử dụng định lý giới hạn trung tâm mà ông đã công bố vào năm 1810. Nghĩa là, giả sử phương trình cuối cùng này có phân phối chuẩn

Một cách tiếp cận khác là sử dụng một số loại phương thức bootstrap. Có nhiều biến thể; . Here attention is focused on two basic types (with some extensions described in subsequent chapters). Alternative methods are not considered because either they currently seem to have no practical advantage for the problems considered here, in terms of controlling the probability of a type I error or yielding accurate probability coverage, or the practical advantages of these alternative methods have not been adequately investigated when sample sizes are small or moderately large. Efron and Tibshirani (1993), Chernick (1999), Davison and Hinkley (1997), Hall and Hall (1995), Lunneborg (2000), Mooney and Duval (1993), and Shao and Tu (1995). Here attention is focused on two basic types (with some extensions described in subsequent chapters). Alternative methods are not considered because either they currently seem to have no practical advantage for the problems considered here, in terms of controlling the probability of a type I error or yielding accurate probability coverage, or the practical advantages of these alternative methods have not been adequately investigated when sample sizes are small or moderately large.

4. 4. 1 The Percentile Bootstrap Method

The first basic version is the so-called percentile bootstrap. It begins by obtaining a bootstrap sample of size n. That is, values are obtained by randomly sampling with replacement n values from X1, …, Xn yielding X1∗,…,Xn∗ .

Let θ^∗ be an estimate of θ based on this bootstrap sample. Of course, a new bootstrap sample can be generated to yield a new bootstrap estimate of θ. Repeating this process B times yields B bootstrap estimates. θ^1∗,…,θ^B∗ . Let ℓ=α B/2 , rounded to the nearest integer, and let u=B−ℓ . Letting θ^(1)∗≤⋯≤θ^(B)∗ represent the B bootstrap estimates written in ascending order, an approximate 1 − α confidence interval for θ is

θ^(ℓ+1)∗,θ^(u)∗

An outline of the theoretical justification of the method is as follows. Imagine that the goal is to test

H0. θ=θ0,

where θ0 is some given constant. Let p∗=P(θ^∗ . That is, p* is the probability that a bootstrap estimate of θ is less than the hypothesized value, θ0. The value of p* is not known, but it is readily estimated with

p^∗=AB,

where A is the number of bootstrap estimates among θ^(1)∗≤⋯≤θ^(B)∗ that are less than θ0. Under fairly general conditions, if the null hypothesis is true, the distribution of p^∗ approaches a uniform distribution as n and B get large (e. g. , Liu & Singh, 1997 ; Hall, 1988a, 1988bHall, 1988aHall, 1988b ). Điều này gợi ý bác bỏ H0 khi p^∗≤α/2 hoặc p^∗≥1−α/2< . A little algebra shows that this leads to the percentile . A little algebra shows that this leads to the percentile bootstrap confidence interval described in the previous paragraph. A (generalized) p-value is 2min(p^∗,1−p^∗) .

A practical problem is choosing B. If the goal is to control the probability of a type I error, B = 500 suffices for some problems, even with n very small, but B = 2000 or larger might be needed for other situations. And in some instances – such as when making inferences about the population mean, the method performs poorly even when both B and n are fairly large. A rough characterization is that if a location estimator has a low finite sample breakdown point, the percentile method might be unsatisfactory, but with a relatively high finite sample breakdown, it performs reasonably well, even with small sample sizes, and in fact appears to be the method of choice in many situations. More details are provided as we consider various parameters of interest. Also, when dealing with regression, we will see situations where even with a low finite sample breakdown point, a percentile bootstrap method performs relatively well

4. 4. 2 R Function onesampb

The R function

onesampb(x,est=onestep,alpha=0. 05,nboot=500,…)

can be used to compute a percentile bootstrap 1 − α confidence interval when using virtually any estimator available through R. The argument est indicates the estimator to be used, which defaults to the one-step M-estimator. The argument … can be used to supply values for any additional parameters associated with the estimator indicated by the argument est. For example, to compute a 0. 9 confidence interval based on 10% trimmed means, using 1000 bootstrap samples, use the command

onesampb(x,est=mean,alpha=0. 1,nboot=1000,tr=0. 1)

The command

onesampb(x,est=pbvar)

computes a 0. 95 confidence based on the percentage bend midvariance

4. 4. 3 Bootstrap-t Method

The main alternative to the percentile bootstrap is the bootstrap-t method, which also has been called a percentile-t technique. When working with means, for example, the strategy is to use the observed data to approximate the distribution of

T=n(X¯−μ)s

by proceeding as follows

1

Generate a bootstrap sample X1∗,…,Xn∗ .

2

Compute X¯∗ , s* and T∗=n(X¯∗−X¯)/s∗ based on the bootstrap sample generated in step 1.

3

Repeat steps 1 and 2 B times yielding Tb∗ , b = 1, …, B.

The Tb∗ values provide an approximation of the distribution of T and in particular an estimate of the α/2 and 1 − α/2 quantiles.

When testing H0. μ = μ0, there are two variations of the bootstrap-t method that deserve comment. The first is the equal-tailed method. Let T(1)∗≤⋯≤T(B)∗ be the Tb∗ values written in ascending order, let ℓ=α B/2 , rounded to the nearest integer, and let u=B−ℓ . Then H0 is rejected if

T≤T(ℓ)∗orT≥T(u)∗

Rearranging terms, a 1 − α confidence interval for μ is

(4. 5)X¯−T(u)∗sn,X¯−T(ℓ)∗sn.

This last equation might appear to be incorrect because T(u)∗ , the estimate of the 1 − α/2 quantile of the distribution of T, is used to compute the lower end of the confidence interval. Simultaneously, T(ℓ)∗ , an estimate of the α/2 quantile is used to compute the upper end of the confidence interval. It can be seen, however, that this last equation follows from the decision rule that rejects H0. μ = μ0 if T≤T(ℓ)∗ or T≥T(u)∗ . Also, when computing the upper end of the confidence interval, T(ℓ)∗ will be negative, which is why the term T(ℓ)∗sn is subtracted from .

The second variation of the bootstrap-t method, yielding a so-called symmetric confidence interval, uses

T∗=n. X¯∗−X¯. s∗

Let c = (1 − α)B, rounded to the nearest integer. Now a 1 − α confidence interval for μ is

X¯±T(c)∗sn

Asymptotic results ( Hall, 1988a, 1988bHall, 1988aHall, 1988b ) suggest that it tends to have more accurate probability coverage than the equal-tailed confidence interval, but some small-sample exceptions are noted later.

An interesting theoretical property of the bootstrap-t method is that it is second-order correct. Roughly, when using T, as the sample size increases, the discrepancy between the actual probability coverage and the nominal level goes to zero at the rate 1/n as n gets large, meaning that the method is first-order correct. Nhưng khi sử dụng phương pháp bootstrap-t, sự khác biệt về 0 với tốc độ 1/n. That is, the discrepancy goes to zero faster versus methods that rely on the central limit theorem.

Again there is the practical issue of choosing B, the number of bootstrap samples. The default choices for B used by the R functions in this book are based on the goal of achieving reasonably good control over the probability of a type I error. But arguments can be made that perhaps a larger value for B has practical value, the concern being that otherwise there might be some loss of power. Racine and MacKinnon (2007a) discuss this issue at length and proposed a method for choosing the number of bootstrap samples. (Xem thêm Jöckel, 1986) . Davidson and MacKinnon (2000) proposed a pretest procedure for choosing B. Theoretical results derived by Olive (2010) suggest using B ≥ [n log(n)].

4. 4. 4 phương pháp Bootstrap khi sử dụng giá trị trung bình đã cắt

As previously indicated, the 20% trimmed mean can be expected to provide better control over the probability of a type I error and more accurate probability coverage, versus the mean, in various situations. In some cases, however, even better probability coverage and control of type I error probabilities might be desired, particularly when the sample size is small. Some type of bootstrap method can make a substantial difference, with the choice of method depending on how much trimming is done

First it is noted that the bootstrap methods in Sections 4. 4. 1 and 4. 4. 2 are readily applied when using a trimmed mean. When using the percentile bootstrap method, generate a bootstrap sample and compute the sample trimmed mean yielding X¯t1∗ . Repeat this process B times yielding X¯t1∗,…,X¯tB∗ . Then an approximate 1 − α confidence interval for μt is given by

X¯t(ℓ+1)∗,X¯t(u)∗,

where again is α B/2 rounded to the nearest integer, u=B−ℓ , and X¯t(1)∗≤⋯≤X¯t(B)∗ are the B bootstrap trimmed means written in ascending order.

The bootstrap-t extends to trimmed means in a straightforward manner as well, and to be sure the details are clear, they are summarized in Table 4. 4 . In the context of testing H0. μt = μ0 versus H1. μt ≠ μ0, reject if Tt or Tt>Tt(u)∗ , where

(4. 6)Tt∗=(1−2γ)n(X¯t∗−X¯t)sw∗,

As for the symmetric, two-sided confidence interval, now use

(4. 7)Tt∗=(1−2γ)n. X¯t∗−X¯t. sw∗,

in which case a two-sided confidence interval for μt is

(4. 8)X¯t±Tt(c)∗sw(1−2γ)n.

Table 4. 4 . Summary of the Bootstrap-t Method for a Trimmed Mean.

To apply the bootstrap-t (or percentile-t) method when working with a trimmed mean, proceed as follows. 1

Compute the sample trimmed mean, X¯t .

2

Generate a bootstrap sample by randomly sampling with replacement n observations from X1, …, Xn, yielding X1*,…,Xn* .

3

When computing an equal-tailed confidence interval, use the bootstrap sample to compute Tt* given by Eq. (4. 6) . When computing a symmetric confidence interval, compute Tt* using Eq. (4. 7) instead.

4

Repeat steps 2 and 3 yielding Tt1*,…,TtB* . B = 599 appears to suffice in most situations when n ≥ 12.

5

Put the Tt1*,…,TtB* values in ascending order yielding Tt(1)*,…,Tt(B)* .

6

Set ℓ=α B/2, c=(1−α)B round both and c to the nearest integer, and let u=B−ℓ . The equal-tailed 1 − α confidence interval for μt is

(4. 9)(X¯t−Tt(u)*swn, X¯t−Tt(ℓ)*swn).

and the symmetric confidence interval is given by Eq. (4. 9) .

The choice between the percentile bootstrap versus the bootstrap-t, based on the criterion of accurate probability coverage, depends on the amount of trimming. With no trimming, all indications are that the bootstrap-t is preferable (e. g. , Westfall & Young, 1993). Consequently, early investigations based on means suggested using a bootstrap-t when making inferences about a population trimmed mean, but more recent studies indicate that as the amount of trimming increases, at some point the percentile bootstrap method offers an advantage. In particular, simulation studies indicate that when the amount of trimming is 20%, the percentile bootstrap confidence interval should be used rather then the bootstrap-t (e. g. , Wilcox, 2001a ). Perhaps with slightly less trimming the percentile bootstrap continues to give more accurate probability coverage in general, but this issues has not been studied extensively.

One issue is whether Eq. (4. 6) yields a confidence interval with reasonably accurate probability coverage when sampling from a light-tailed, skewed distribution. To address this issue, attention is again turned to the lognormal distribution, which has μt = 1. 111. First consider what happens when the bootstrap-t is not used. With n = 20 and α = 0. 025, the probability of rejecting H0. μt > 1. 111 when using Eq. (4. 4) is approximately . 065, about 2. 6 times as large as the nominal level. In contrast, the probability of rejecting H0. μt < 1. 111 is approximately . 010. Thus, the probability of rejecting H0. μt = 1. 111 when testing at the 0. 05 level is approximately . 065 + . 010 = . 075. If the bootstrap-t method is used instead, with B = 599, the one-sided type I error probabilities are now . 035 and . 020, so the probability of rejecting H0. μt = 1. 111 là xấp xỉ. 055 when testing at the 0. 05 level. (The reason for using B = 599, rather than B = 600, stems from results in Hall, 1986 , showing that B should be chosen so that α is a multiple of (B + 1)−1. On rare occasions this small adjustment improves matters slightly, so it is used here. ) As we move toward heavy-tailed distributions, generally the actual probability of a type I error tends to decrease.

For completeness, when testing a two-sided hypothesis or computing a two-sided confidence interval, asymptotic results reported by Hall (1988a, 1988b)Hall (1988a)Hall (1988b) suggest modifying the bootstrap-t method by replacing Tt∗ with

(4. 10)Tt∗=(1−2γ)n. X¯t∗−X¯t. sw∗.

Now the two-sided confidence interval for μt is

(4. 11)X¯t±Tt(c)∗sw(1−2γ)n,

where c = (1 − α)B, rounded to the nearest integer. This is an example of a symmetric two-sided confidence interval. That is, the confidence interval has the form (X¯t−ĉ,X¯t+ĉ) , where ĉ is determined with the goal that the probability coverage be as close as possible to 1 − α. In contrast, an equal-tailed two-sided confidence interval has the form (X¯t−a^,X¯t+b^) , where â and b^ are determined with the goal that P(μt . The confidence interval given by Eq. (4. 9) is equal-tailed. In terms of testing H0. μt = μ0 versus H1. μt ≠ μ0, Eq. (4. 11) is equivalent to rejecting if Tt , or if Tt>Tt(c)∗ . When Eq. (4. 11) is applied to the lognormal distribution with n = 20, a simulation estimate of the actual probability of a type I error is . 0532 versus . 0537 using (4. 9) . Thus, in terms of type I error probabilities, there is little separating between these two methods for this special case, but in practice, the choice between these two methods can be important, as will be seen.

Table 4. 5 summarizes the values of α^ , an estimate of the probability of a type I error when performing one-sided tests with α = 0. 025, and when the critical value is estimated with one of the three methods described in this section. The first estimate of the critical value is t, the 1 − α/2 quantile of Student's t-distribution with n − 2g − 1 degrees of freedom. That is, reject if Tt is less than −t or greater than t depending on the direction of the test. The second estimate of the critical value is Tt(ℓ)∗ or Tt(u)∗ (again depending on the direction of the test), where Tt(ℓ)∗ and Tt(u)∗ are determined with the equal-tailed bootstrap-t method. Phương pháp cuối cùng sử dụng Tt(c)∗ kết quả từ bootstrap-t đối xứng như được sử dụng trong Eq. (4. 11) . Estimated type I error probabilities are reported for the four g-and-h distributions discussed in Section 4. 2 . For example, when sampling is from a normal distribution (g = h = 0), α = 0. 025, and when H0 is rejected because Tt < −t the actual probability of rejecting is approximately . 031. In contrast, when g = 0. 5 and h = 0, the probability of rejecting is estimated to be . 047, about twice as large as the nominal level. (The estimates in Table 4. 5 are based on simulations with 1000 replications when using one of the bootstrap methods, and 10,000 replications when using Student's t. ) If sampling is from a lognormal distribution, not shown in Table 4. 5 , the estimate increases to 0. 066, which is 2. 64 times as large as the nominal 0. 025 level. For (g, h) = (0. 5, 0. 0) and α = 0. 05, the tail probabilities are . 094 and . 034.

Table 4. 5 . Values of α^ Corresponding to Three Critical Values, n = 12, α = 0. 025.

ghP(Tt < −t)P(Tt > t) P(TtP(Tt>Tt(u)∗)P(Tt<−Tt(c)∗)P(Tt>Tt(c)∗) 0. 00. 0. 031. 028. 026. 030. 020. 0250. 00. 5. 025. 022. 024. 037. 012. 0240. 50. 0. 047. 016. 030. 023. 036. 0170. 50. 5. 040. 012. 037. 028. 025. 011

Note that the choice between Eqs (4. 9) and (4. 11) , the equal-tailed and symmetric bootstrap methods, is not completely clear based on the results in Table 4. 5 . An argument for Eq. (4. 11) is that the largest estimated probability of a type I error in Table 4. 5 , when performing a two-sided test, is . 036 + . 017 =. 053, whereas when using Eq. (4. 9) the largest estimate is . 037 + . 028 = . 065. A possible objection to (4. 11) is that in some cases it is too conservative – the tail probability can be less than half the nominal . 025 level. Also, if one can rule out the possibility that sampling is from a skewed distribution with very heavy tails, Table 4. 5 đề xuất sử dụng Eq. (4. 9) trên Eq. (4. 11) , ít nhất là dựa trên phạm vi xác suất.

Có những kỹ thuật bootstrap khác có thể có lợi thế thực tế hơn phương pháp bootstrap-t, nhưng tại thời điểm này, điều này có vẻ không đúng khi γ gần bằng không. Tuy nhiên, các cuộc điều tra mở rộng chưa được thực hiện, vì vậy các cuộc điều tra trong tương lai có thể thay đổi quan điểm này. Một cách tiếp cận là sử dụng ước tính bootstrap của phạm vi xác suất thực tế khi sử dụng Tt với phân phối t của Student và sau đó điều chỉnh mức α sao cho phạm vi xác suất thực tế gần với mức danh nghĩa hơn ( Loh . Khi lấy mẫu từ một phân phối logic chuẩn với n = 20, các phép thử một phía được xem xét ở trên hiện có xác suất lỗi loại I thực tế xấp xỉ bằng. 011 và. 045, kém hơn một chút so với kết quả với bootstrap-t. Loh, 1987aLoh, 1987b). When sampling from a lognormal distribution with n = 20, the one-sided tests considered above now have actual type I error probabilities approximately equal to .011 and .045, which is a bit worse than the results with the bootstrap-t. Westfall and Young (1993) ủng hộ một phương pháp khác ước tính giá trị p của Tt. Đối với tình huống được xem xét ở đây, các mô phỏng (dựa trên 4000 lần lặp lại và B = 1000) mang lại ước tính về xác suất lỗi loại I bằng. 034 và. 017. Do đó, ít nhất là đối với phân phối logic chuẩn, hai phương pháp thay thế này dường như không có lợi thế thực tế khi γ = 0. 2, nhưng tất nhiên cần có một nghiên cứu dứt khoát hơn. Một khả năng thú vị khác là phương pháp ABC được thảo luận bởi Efron và Tibshirani (1993) . Điểm hấp dẫn của phương pháp này là có thể có khoảng tin cậy chính xác với lựa chọn nhỏ hơn đáng kể cho B, nhưng không có kết quả mẫu nhỏ nào về việc liệu đây có phải là trường hợp của vấn đề hiện tại hay không. Các phương pháp hiệu chuẩn bổ sung được tóm tắt bởi Efron và Tibshirani (1993) .

Thí dụ

Xem xét lại dữ liệu luật trong Bảng 4. 3X¯t=596. 2 dựa trên mức cắt 20%. Khoảng tin cậy bootstrap-t đối xứng, dựa trên Eq. (4. 11) , là (541. 6, 650. 9), được tính toán bằng hàm R trimcibt được mô tả trong Phần 4. 4. 6 . Như đã chỉ ra trước đó, khoảng tin cậy cho μt, dựa trên phân phối t của Student và được đưa ra bởi Eq. (4. 3) , là (561. 8, 630. 6), là tập con của khoảng dựa trên Eq. (4. 11) . Trên thực tế, độ dài của sự tự tin này là 68. 8 so với 109. 3 bằng phương pháp bootstrap-t. Điểm chính ở đây là việc lựa chọn phương pháp có thể tạo ra sự khác biệt đáng kể về độ dài của khoảng tin cậy, tỷ lệ giữa các độ dài là 68. 8/109. 3=0. 63. Điều này dường như gợi ý rằng sử dụng phân phối t của Student là thích hợp hơn, vì khoảng tin cậy ngắn hơn. Tuy nhiên, như đã lưu ý trước đó, có vẻ như việc lấy mẫu là từ một phân phối lệch, đuôi nhẹ và đây là tình huống khi sử dụng phân phối t của Student có thể tạo ra một khoảng tin cậy không có phạm vi xác suất danh nghĩa – khoảng có thể quá . số 0. 95 khoảng tin cậy cho μ là (577. 1, 623. 4), thậm chí còn ngắn hơn và có thể rất không chính xác về phạm vi xác suất. Nếu thay vào đó, phương thức bootstrap-t có đuôi bằng nhau được sử dụng, được cung cấp bởi (4. 9) , kết quả. Khoảng tin cậy 95 cho giá trị trung bình được cắt bớt 20% là (523. 0, 626. 3), cũng dài hơn đáng kể so với khoảng tin cậy dựa trên phân phối t của Student. Xin nhắc lại, tất cả các dấu hiệu cho thấy việc cắt xén, so với không cắt xén, thường cải thiện phạm vi xác suất khi sử dụng Eq. (4. 3) và việc lấy mẫu là từ phân phối lệch, nhẹ, nhưng phương pháp bootstrap phần trăm hoặc bootstrap-t có thể cho kết quả tốt hơn, ít nhất là khi n nhỏ.

4. 4. 5 Sửa đổi của Singh

Hãy xem xét một mẫu ngẫu nhiên trong đó có 15% quan sát là ngoại lệ. Tất nhiên, nếu sử dụng giá trị trung bình đã cắt 20%, thì các ngoại lệ này không có ảnh hưởng quá mức đến ước tính cũng như sai số chuẩn. Tuy nhiên, lưu ý rằng khi tạo mẫu bootstrap, số lượng giá trị ngoại lệ có thể vượt quá 20%, điều này có thể dẫn đến khoảng tin cậy tương đối dài. Singh (1998) kết quả lý thuyết thu được cho thấy vấn đề này có thể được giải quyết bằng cách Winsorizing dữ liệu trước khi lấy mẫu bootstrap, miễn là lượng Winsorizing không vượt quá . Vì vậy, nếu thực hiện các suy luận dựa trên mức cắt xén 20%, thì lý thuyết cho phép lấy các mẫu bootstrap từ dữ liệu Winsorized với điều kiện là lượng Winsorizing không vượt quá 20%. Ví dụ: khi sử dụng phương pháp bootstrap phần trăm, khoảng tin cậy được tính theo cách thông thường. Đó là điểm khác biệt duy nhất so với phương pháp bootstrap phân vị cơ bản trong Phần 4. 4. 1 là các quan sát được lấy mẫu lại với sự thay thế từ dữ liệu Winsorized.

Mặc dù lý thuyết cho phép số lượng Winsorizing lớn bằng số lượng cắt bớt, nhưng nếu chúng tôi Winsorize nhiều như chúng tôi cắt, thì phạm vi xác suất có thể không đạt yêu cầu, ít nhất là với cỡ mẫu nhỏ đến trung bình ( Wilcox, 2001a). However, if for example 10% Winsorizing is done when making inferences based on a 20% trimmed mean, good probability coverage is obtained.

Kết quả của Singh mở rộng đến phương pháp bootstrap-t. Nhưng tất cả các dấu hiệu cho thấy việc đạt được phạm vi xác suất chính xác là khó khăn. Có lẽ vấn đề này trở nên không đáng kể khi kích thước mẫu tăng lên, nhưng mẫu phải lớn đến mức nào để có được phạm vi xác suất chính xác hợp lý vẫn chưa được biết

4. 4. 6 R Chức năng trimpb và trimcibt

Hàm R trimpb (được viết cho cuốn sách này) tính 0. Khoảng tin cậy 95 sử dụng phương pháp bootstrap phân vị. Nó có dạng chung

trimpb(x,tr=0. 2,alpha=0. 05,nboot=2000,WIN=F,plotit=F,win=0. 1,pop=1),

trong đó x là bất kỳ vectơ R nào chứa dữ liệu, tr lại biểu thị mức độ cắt xén, alpha là α và nboot là B, giá trị mặc định là 2.000. Đối số WIN kiểm soát việc Winsorizing có được thực hiện hay không. Nếu đối số plotit=TRUE, thì một biểu đồ của phương tiện đã cắt bootstrap được tạo và loại biểu đồ được tạo được kiểm soát bởi đối số pop. Các lựa chọn là

Khoảng tin cậy bootstrap là gì?

Khoảng thời gian bootstrap phần trăm chỉ là khoảng thời gian giữa phần trăm 100×(α2) và 100×(1-α2) của phân phối ước tính θ thu được từ việc lấy mẫu lại, where θ represents a parameter of interest and α is the level of significance (e.g., α = 0.05 for 95% CIs) (Efron, 1982).

How does bootstrap affect confidence interval?

The bootstrap in action It creates multiple resamples (with replacement) from a single set of observations, and computes the effect size of interest on each of these resamples . The bootstrap resamples of the effect size can then be used to determine the 95% CI.

What does bootstrap mean in statistics?

Phương pháp bootstrap là kỹ thuật thống kê để ước tính số lượng về tổng thể bằng cách lấy trung bình các ước tính từ nhiều mẫu dữ liệu nhỏ . Importantly, samples are constructed by drawing observations from a large data sample one at a time and returning them to the data sample after they have been chosen.

Chức năng nào được sử dụng để có được khoảng tin cậy trong bootstrapping?

Có thể tìm thấy khoảng tin cậy bootstrap bằng cách sử dụng hàm khởi động . Bootstrapping là một phương pháp tìm số liệu thống kê suy luận với sự trợ giúp của dữ liệu mẫu. Nó được thực hiện bằng cách vẽ một số lượng lớn các mẫu với sự thay thế từ các giá trị giống nhau.