Báo cáo t-test bootstrapped

Shi Zhao,1,2 Zuyao Yang,1 Salihu S. Musa,3 Jinjun Ran,4 Marc K. C. Chong,1,2 Mohammad Javanbakht,5 Daihai He,3,* và Maggie H. Vương1,2,*

Shi Zhao

1JC Trường Y tế Công cộng và Chăm sóc Ban đầu, Đại học Trung Hoa Hồng Kông, Shatin, Hồng Kông

2Viện nghiên cứu Thâm Quyến của Đại học Trung Quốc Hồng Kông, Thâm Quyến, Trung Quốc

Tìm bài viết của Shi Zhao

Zuyao Yang

1JC Trường Y tế Công cộng và Chăm sóc Ban đầu, Đại học Trung Hoa Hồng Kông, Shatin, Hồng Kông

Find articles by Zuyao Yang

Salihu S. Musa

3Khoa Toán ứng dụng, Đại học Bách khoa Hong Kong, Hung Hom, Hong Kong

Tìm bài viết của Salihu S. Musa

Jinjun Ran

4Trường Y tế Công cộng, Đại học Y khoa Thượng Hải Jiao Tong, Thượng Hải, Trung Quốc

Tìm bài viết của Jinjun Ran

Marc K. C. chong

1JC Trường Y tế Công cộng và Chăm sóc Ban đầu, Đại học Trung Hoa Hồng Kông, Shatin, Hồng Kông

2Viện nghiên cứu Thâm Quyến của Đại học Trung Quốc Hồng Kông, Thâm Quyến, Trung Quốc

Tìm bài viết của Marc K. C. chong

Mohammad Javanbakht

5Trung tâm Nghiên cứu Thận và Tiết niệu, Đại học Khoa học Y khoa Baqiyatallah, Tehran, Iran

Tìm bài viết của Mohammad Javanbakht

Đại Hải Hà

3Khoa Toán ứng dụng, Đại học Bách khoa Hong Kong, Hung Hom, Hong Kong

Tìm bài viết của Daihai He

Maggie H. Vương

1JC Trường Y tế Công cộng và Chăm sóc Ban đầu, Đại học Trung Hoa Hồng Kông, Shatin, Hồng Kông

2Viện nghiên cứu Thâm Quyến của Đại học Trung Quốc Hồng Kông, Thâm Quyến, Trung Quốc

Tìm bài viết của Maggie H. Vương

từ chối trách nhiệm

1JC Trường Y tế Công cộng và Chăm sóc Ban đầu, Đại học Trung Hoa Hồng Kông, Shatin, Hồng Kông

2Viện nghiên cứu Thâm Quyến của Đại học Trung Quốc Hồng Kông, Thâm Quyến, Trung Quốc

3Khoa Toán ứng dụng, Đại học Bách khoa Hong Kong, Hung Hom, Hong Kong

4Trường Y tế Công cộng, Đại học Y khoa Thượng Hải Jiao Tong, Thượng Hải, Trung Quốc

5Trung tâm Nghiên cứu Thận và Tiết niệu, Đại học Khoa học Y khoa Baqiyatallah, Tehran, Iran

Tác giả cho thư từ. Shi Zhao, E-mail. mộc. lamg@asmc. ihsoahz; . kh. bạn. uylop@eh. iahiad

* Các tác giả cao cấp chung

Nhận 2020 ngày 21 tháng 9;

Bản quyền © The Author(s) 2021

Bài viết này được cung cấp thông qua Tập hợp con truy cập mở PMC để sử dụng lại không hạn chế và phân tích dưới bất kỳ hình thức nào hoặc bằng bất kỳ phương tiện nào tùy thuộc vào sự thừa nhận của nguồn ban đầu. Các quyền này được cấp trong suốt thời gian xảy ra đại dịch COVID-19 hoặc cho đến khi các quyền bị thu hồi bằng văn bản. Khi các quyền này hết hạn, PMC được cấp giấy phép vĩnh viễn để cung cấp bài viết này thông qua PMC và PMC Châu Âu, phù hợp với các biện pháp bảo vệ bản quyền hiện có

Dữ liệu liên quan

Đối với tài liệu bổ sung đi kèm với bài báo này, hãy truy cập https. //doi. tổ chức/10. 1017/S0950268821001047

S0950268821001047sup001. xlsx (13K)

HƯỚNG DẪN. 1FE3E9D4-1225-4DEF-B5AF-C6F6E6B3AB0B

Dữ liệu COVID-19 được sử dụng trong nghiên cứu này có sẵn thông qua các tài liệu bổ sung

trừu tượng

Bài kiểm tra t của sinh viên có giá trị đối với suy luận thống kê theo giả định về tính chuẩn tắc hoặc tiệm cận. Ngược lại, mặc dù thử nghiệm bootstrap t đã được đề xuất vào năm 1993, nhưng nó hiếm khi được áp dụng trong nghiên cứu y học. Chúng tôi mong muốn chứng minh rằng bài kiểm tra t bootstrap vượt trội hơn bài kiểm tra t của Sinh viên theo quy tắc dữ liệu. Sử dụng các mẫu dữ liệu ngẫu nhiên từ các bản phân phối bình thường, chúng tôi đã đánh giá hiệu suất xét nghiệm, xét về tỷ lệ dương tính thật (TPR) và tỷ lệ dương tính giả và khả năng chẩn đoán, xét về diện tích dưới đường cong (AUC), của xét nghiệm bootstrap t . Chúng tôi khám phá AUC của cả hai thử nghiệm với kích thước mẫu và hệ số biến thiên khác nhau. Chúng tôi so sánh kết quả xét nghiệm bằng cách sử dụng dữ liệu khoảng thời gian nối tiếp (SI) COVID-19 ở Thâm Quyến và Hồng Kông, Trung Quốc, để minh họa. Với TPR cố định, bài kiểm tra t bootstrap duy trì độ chính xác tương đương trong TPR, nhưng cải thiện đáng kể tỷ lệ âm tính thực từ bài kiểm tra t của Sinh viên. Với TPR khác nhau, khả năng chẩn đoán của bài kiểm tra t bootstrap vượt trội hoặc được thực hiện tương đương như bài kiểm tra t của Sinh viên xét về AUC. Các màn trình diễn tương đương là có thể nhưng hiếm khi xảy ra trong thực tế. Chúng tôi nhận thấy rằng thử nghiệm bootstrap t hoạt động tốt hơn bằng cách phát hiện thành công sự khác biệt trong COVID-19 SI, được định nghĩa là khoảng thời gian giữa các thế hệ lây truyền liên tiếp, do can thiệp tình dục và phi dược phẩm đối với thử nghiệm t của Sinh viên. Chúng tôi đã chứng minh rằng thử nghiệm bootstrap t vượt trội so với thử nghiệm t của Sinh viên và nên thay thế thử nghiệm t của Sinh viên trong phân tích dữ liệu y tế bất kể kích thước mẫu

Từ khóa. Thử nghiệm Bootstrap t, dịch tễ học lâm sàng, COVID-19, khoảng thời gian nối tiếp, thử nghiệm giả thuyết thống kê

Giới thiệu

Kiểm tra giả thuyết thống kê là một phương pháp thiết yếu được áp dụng để phân tích dữ liệu y tế và chăm sóc sức khỏe []. Bài kiểm tra t của sinh viên là một trong những bài kiểm tra quan trọng được sử dụng rộng rãi để tiến hành suy luận thống kê cho tập dữ liệu phân phối bình thường (hoặc xấp xỉ bình thường) hoặc những tập dữ liệu có cỡ mẫu đủ lớn khi áp dụng định lý giới hạn trung tâm (CLT) [, ]. Bài kiểm tra t của học sinh có thể mang lại kết quả kiểm tra không đạt yêu cầu khi các mẫu bị lệch [], hầu hết có khả năng với cỡ mẫu nhỏ. Các phương pháp Bootstrap đã được đề xuất vào những năm 1970 và đã được sử dụng để phân tích chẳng hạn như dữ liệu không được phân phối thông thường [, ]. Nó chính xác hơn (tiệm cận) so với các ước tính tiêu chuẩn sử dụng phương sai mẫu và dựa trên các giả định về tính quy tắc [, ]. Mặc dù thử nghiệm bootstrap t được đề xuất bởi Efron và Tibshirani vào năm 1993 [], nhưng nó được coi là phần trăm của các mẫu thống kê thử nghiệm bootstrap ở mức đáng kể. Để tránh lặp lại, chúng tôi bỏ qua thuật toán kiểm tra bootstrap t trong nghiên cứu này vì thuật toán chi tiết đã được giới thiệu trong []. Phiên bản thử nghiệm t cải tiến này hiếm khi được áp dụng trong nghiên cứu y học

mục tiêu

Như đã đề cập, thường được chấp nhận sử dụng bài kiểm tra t của Sinh viên khi tính quy tắc của dữ liệu là đủ, trong khi phương pháp bootstrap có thể được áp dụng để giải quyết tình huống không có tính quy tắc. Trong nghiên cứu này, chúng tôi đã chứng minh rằng đối với dữ liệu từ dân số bình thường, bài kiểm tra t bootstrap vượt trội hơn bài kiểm tra t của Sinh viên về các biện pháp khác nhau về độ chính xác của bài kiểm tra. Chúng tôi đã khám phá các tính năng chung của mẫu dữ liệu mà các thử nghiệm bootstrap t có thể có kết quả thử nghiệm hợp lý hơn

phương pháp

Chi tiết về quy trình thử nghiệm của thử nghiệm bootstrap t có thể được tìm thấy trong []. Thử nghiệm t hai mẫu theo cặp được thực hiện dựa trên giả thuyết không, H0, giả định rằng phương tiện của hai quần thể bằng nhau. Các mẫu dữ liệu được tạo ngẫu nhiên từ các quần thể phân phối bình thường, sẽ được sử dụng để so sánh kết quả thử nghiệm dựa trên các mẫu dữ liệu và dữ kiện của các quần thể. Chúng tôi đã đánh giá hiệu suất thử nghiệm trong hai tình huống bao gồm

  • kịch bản (tôi). H0 là đúng;

  • kịch bản (ii). H0 là sai

Khi đó, khả năng H0 không bị từ chối trong kịch bản (i) là tỷ lệ dương tính thực (TPR), i. e. nhạy cảm. Khả năng H0 bị bác bỏ ở kịch bản (ii) là tỷ lệ âm thực (TNR), i. e. đặc thù. Về mặt lý thuyết, TPR là (1 − α), trong đó α được gọi là tỷ lệ lỗi loại I, i. e. tỷ lệ cảnh báo sai và tương tự, TNR là (1 − β), trong đó β là tỷ lệ lỗi loại II, i. e. tỷ lệ bỏ lỡ. Một thông lệ phổ biến là đặt α ở mức 5% và thử nghiệm được xây dựng với mục đích giảm thiểu β [, ]

TPR cố định

Với TPR = (1 − α) = 95%, i. e. α = 5%, chúng tôi đã đánh giá

  • (i) tính nhất quán trong TPR,
  • (ii) mức độ TNR và
  • (iii) thông tin (i. e. thống kê J của Youden)

của hai loại thử nghiệm t với cỡ mẫu và hệ số biến thiên (CV) khác nhau =  s. d. /sự khác biệt về giá trị trung bình trong các mẫu []. Ở đây, độ tin cậy = TPR + TNR − 1, nằm trong khoảng từ 0 đến 1 (bao gồm), là một thống kê duy nhất ước tính xác suất của một quyết định sáng suốt [], đánh giá hiệu suất của các xét nghiệm chẩn đoán. Mức độ tin cậy là 0 khi xét nghiệm chẩn đoán cho tỷ lệ kết quả dương tính như nhau đối với cả nhóm đúng và sai, điều này có nghĩa là kết quả xét nghiệm hoàn toàn không được hiểu rõ. Mức độ đầy đủ thông tin 1 cho biết một tình huống lý tưởng mà TPR = TNR = 1, nghĩa là kết quả thử nghiệm được cung cấp đầy đủ thông tin. Do thống kê thử nghiệm của thử nghiệm t chủ yếu được xác định bởi CV và cỡ mẫu, do đó, hai yếu tố này được đưa vào đánh giá hiệu suất thử nghiệm.

TPR thay đổi

Với TPR khác nhau, tôi. e. (1 − α), chúng tôi có thể đo hiệu suất chẩn đoán của cả hai thử nghiệm bằng cách sử dụng TPR và TNR theo cặp. Với tất cả các cặp TPR và TNR, chúng tôi có thể xây dựng đường cong đặc tính hoạt động của máy thu (ROC) để minh họa khả năng chẩn đoán của hai thử nghiệm t về diện tích dưới đường cong (AUC)

Kiểm tra đánh giá hiệu suất

Đối với mỗi nhóm kích thước mẫu, CV và α, chúng tôi đã thử nghiệm 10.000 cặp mẫu dữ liệu được tạo ngẫu nhiên để ước tính TPR và TNR, sau đó để tính mức độ thông tin và AUC. Chúng tôi đã chạy 1000 mẫu bootstrap để tiến hành thử nghiệm bootstrap t. Chúng tôi cũng đã chạy 1000 mẫu bootstrap trong kết quả thử nghiệm của hai thử nghiệm t để tạo khoảng tin cậy (CI) 95% cho các chỉ số ước tính

Để minh họa, chúng tôi so sánh kết quả thử nghiệm bằng cách sử dụng khoảng thời gian nối tiếp COVID-19 (SI), được định nghĩa là khoảng thời gian giữa các thế hệ truyền liên tiếp, dữ liệu ở Thâm Quyến và Hồng Kông, Trung Quốc. Ví dụ minh họa này được coi là một phần của kết quả (thay vì phương pháp luận), và do đó được trình bày chi tiết trong phần tiếp theo

kết quả và thảo luận

Chúng tôi nhận thấy rằng tính đầy đủ của bài kiểm tra t bootstrap vượt trội so với bài kiểm tra t của Sinh viên đối với nhiều loại cỡ mẫu và CV khác nhau, xem Hình 1(a) and (b). Since the TPRs were consistently stabilised at 95%, see Hình 1(c ) và (d), the difference in the informedness was due to the differences in the TNRs, see Figure 1(e) and (f). With fixed α, the bootstrap t test maintained the equivalent accuracy in TPR, but significantly improved the TNR compared to the Student's t test, see Hình 1(c . Điều này có thể được hiểu là bài kiểm tra t bootstrap có nhiều khả năng loại trừ giả thuyết không thực tế, khi H0 sai, so với bài kiểm tra t của Sinh viên và trong khi đó vẫn duy trì phán đoán của nó đối với mệnh đề đúng, khi H0 đúng. Vì giả thuyết không được biết trước là sai [], H0 thường được cho là sẽ bị bác bỏ dựa trên bằng chứng (thống kê) đầy đủ [, , ]. Do đó, sự cải thiện trong TNR là đáng mong đợi. (f). This can be interpreted as the bootstrap t test is more likely to exclude the unrealistic hypothesis, when H0 is false, compared to the Student's t test and meanwhile maintained its judgement to the true statement, when H0 is true. Since the null hypothesis is known a priori to be false [], H0 is commonly expected to be rejected based on sufficient (statistical) evidence [, , ]. Thus, the improvement in TNR was remarkably desirable.

Báo cáo t-test bootstrapped

Mở trong cửa sổ riêng

Quả sung. 1

Mối quan hệ giữa độ chính xác thử nghiệm của thử nghiệm t bootstrap (màu xanh lam) và thử nghiệm t của Sinh viên (màu đen), bao gồm mức độ hiểu biết, TPR và TNR cũng như các tính năng của mẫu dữ liệu bao gồm kích thước mẫu và CV. Bảng (a) và (b) hiển thị mối quan hệ giữa mức độ hiểu biết ( = TPR + TNR − 1) với cỡ mẫu và CV tương ứng. Các bảng (c) và (d) lần lượt hiển thị các mối quan hệ giữa TPR và cỡ mẫu và CV. Các bảng (e) và (f) lần lượt hiển thị mối quan hệ giữa TNR và cỡ mẫu và CV. CV (của các mẫu dữ liệu) được xác định bởi

Báo cáo t-test bootstrapped
, trong đó n biểu thị kích thước mẫu, t* là lượng phân vị của phân phối t và 'df' là bậc tự do, tính bằng bảng ( . Kích thước mẫu được cố định là 30 trong các bảng (b), (d) và (f). Mức độ của α đã được cố định là 5% trong tất cả các bảng. Các thanh dọc trong mỗi bảng đại diện cho 95% TCTD.

Trong Hình 2 , khả năng chẩn đoán của bài kiểm tra t bootstrap vượt trội hoặc được thực hiện tương đương như bài kiểm tra t của Sinh viên xét về AUC. Khả năng chẩn đoán của bootstrap t test vượt trội so với Student's t test không chỉ khi cỡ mẫu nhỏ, e. g. xem Hình 2(b)(c) , cũng như khi . g. xem Hình 2(i ) và (k) . Mặc dù kiểm tra t của Sinh viên có thể được tiến hành với cỡ mẫu đủ lớn khi CLT được áp dụng [, ], chúng tôi nhận thấy rằng kiểm tra t bootstrap hoạt động tốt hơn hoặc được thực hiện tương đương với kiểm tra t của Sinh viên bất kể cỡ mẫu.

Báo cáo t-test bootstrapped

Mở trong cửa sổ riêng

Quả sung. 2

Các đường cong ROC và AUC của bài kiểm tra t bootstrap (màu xanh) và bài kiểm tra t của Sinh viên (màu đen) với các cỡ mẫu, n và CV khác nhau của các mẫu dữ liệu. Các đường đứt nét chéo cho thấy hiệu suất thử nghiệm của một bộ phân loại ngẫu nhiên

Một mặt, AUC của bài kiểm tra t của Sinh viên tiệm cận với bài kiểm tra t bootstrap, i. e. hiệu suất tương đương, khi kích thước mẫu trở nên lớn hơn và CV trở nên nhỏ hơn, e. g. xem Hình 2(e ) và (j) . Trong những trường hợp này, sự phân bố của các mẫu cần kiểm tra được phân tách rõ ràng và do đó, rõ ràng là hai thử nghiệm có thể mang lại kết quả 'bác bỏ H0' như nhau. Phát hiện này chỉ ra rằng với kích thước mẫu đủ lớn, bài kiểm tra t của Sinh viên có khả năng đạt được khả năng chẩn đoán tương đương như bài kiểm tra t bootstrap khi hai bộ dữ liệu phân biệt theo xu hướng trung tâm và có độ phân tán thấp. Một điều thú vị cần lưu ý là hiệu suất tương đương chỉ xuất hiện khi giá trị AUC của hai thử nghiệm bằng 0. 5, tôi. e. phân loại ngẫu nhiên, hoặc 1, tôi. e. phân loại hoàn hảo. AUC = 0. 5 hoặc AUC = 1 sẽ hiếm khi xảy ra do các tính năng bất thường của bộ dữ liệu thử nghiệm, e. g. cỡ mẫu cực lớn và CV nhỏ hoặc cỡ mẫu cực nhỏ và CV lớn.

Mặt khác, khi cỡ mẫu nhỏ và CV lớn, e. g. xem Hình 2(b) , (c) , (d), (g) and (h), the distributions of samples to be tested are difficult to differentiate. In these situations, the diagnostic ability of bootstrap t test outperformed Student's t test in terms of the AUC.

Tóm lại, đối với các mẫu dữ liệu từ các quần thể được phân phối bình thường, cả hiệu suất thử nghiệm và khả năng chẩn đoán của thử nghiệm bootstrap t đều vượt trội so với thử nghiệm t của Sinh viên bất kể cỡ mẫu và CV khác nhau. Chúng tôi đã tóm tắt những phát hiện của mình và tình huống khi tính quy tắc không thành công trong Bảng 1 . Đặc biệt, đối với các mẫu nhỏ, khi dữ liệu không đáp ứng giả định về tính chuẩn, các kiểm định phi tham số khác và các phiên bản bootstrap của chúng cũng được khuyến nghị để phù hợp với mục đích nghiên cứu.

Bảng 1

Tổng hợp các tình huống cần test và đề xuất test của Student hoặc Bootstrap t

Tính bình thườngKích thước mẫuPhân tánKiểm tra của sinh viên hoặc Bootstrap Nhận xétTham khảoKhôngNhỏNhỏKiểm tra Bootstrap t cũng được ưu tiên, LớnLớnNhỏKhôngLớnKhôngCóCóNhỏNhỏKiểm tra Bootstrap khôngKhông Nghiên cứu nàyLớnKiểm tra Bootstrap KhôngKhôngLớnNhỏCả hai AUC tương đươngKiểm tra Bootstrap lớnKhông có

Mở trong cửa sổ riêng

Ghi chú. Sự 'phân tán' trong nghiên cứu này được đo bằng CV

Ví dụ minh họa về COVID-19

Chúng tôi chứng minh hiệu suất của thử nghiệm bootstrap t so với thử nghiệm t của Sinh viên bằng cách sử dụng bộ dữ liệu SI COVID-19 từ các đợt bùng phát ban đầu ở Thâm Quyến và Hồng Kông, hai thành phố lân cận trên bờ biển phía đông nam của Trung Quốc. Trong lây truyền bệnh truyền nhiễm, SI được định nghĩa là sự khác biệt giữa ngày khởi phát của ca bệnh thứ cấp và ngày của ca bệnh chính có liên quan trong chuỗi lây truyền liên tiếp []. Với khả năng lây truyền của mầm bệnh là cố định, SI ngắn hơn ngụ ý rằng bệnh có thể lây truyền nhanh hơn xét về kết quả dịch tễ học ở quy mô dân số, ví dụ:. g. số trường hợp. SI là một trong những thông số dịch tễ học quan trọng để mô tả quá trình lây truyền bệnh và có tầm quan trọng trong việc xác định các mô hình thay đổi của đường cong dịch bệnh [–]. SI có thể được suy ra từ dữ liệu giám sát theo dõi dấu vết tiếp xúc và tái cấu trúc chuỗi truyền dẫn, được nghiên cứu kỹ trong các nghiên cứu trước đây [–] và được áp dụng rộng rãi trong phân tích mô hình [–]

Dữ liệu SI được thu thập qua các miền công cộng cho đến ngày 22 tháng 2 năm 2020 đối với Thâm Quyến và đến ngày 15 tháng 2 năm 2020 đối với Hồng Kông. Các giai đoạn nghiên cứu bao gồm làn sóng dịch bệnh lớn ở Thâm Quyến và làn sóng dịch bệnh đầu tiên ở Hồng Kông. Bộ dữ liệu này đã được xuất bản trước đây trong [, ] cũng như được nghiên cứu trong []. Chúng tôi trích xuất các cặp truyền, tôi. e. một ca bệnh phụ có liên quan về mặt dịch tễ với một và chỉ một ca bệnh chính, không thiếu thông tin về giới tính của ca bệnh chính. Chúng tôi đã thu được tổng cộng 34 cặp lây truyền bao gồm 22 (14 ca nam và 8 ca nữ) từ Thâm Quyến và 12 (6 ca nam và 6 ca nữ) từ Hồng Kông. Có 33 (trong tổng số 34) cặp lây truyền có ngày khởi phát triệu chứng của ca bệnh chính vào tháng 1 năm 2020, xem Hình 3 .

Báo cáo t-test bootstrapped

Mở trong cửa sổ riêng

Quả sung. 3

SI của các cặp lây truyền COVID-19 tại Thâm Quyến và Hồng Kông, Trung Quốc, trong những đợt bùng phát sớm. SI với trường hợp chính là nam hoặc nữ được biểu thị bằng tam giác hướng lên hoặc hướng xuống tương ứng. Hình tam giác rỗng hoặc đầy (màu đỏ đối với nữ và màu xanh lam đối với nam) tương ứng biểu thị dữ liệu SI được loại trừ hoặc bao gồm trong các thử nghiệm t. Khu vực bóng xanh làm nổi bật CLNY

Chúng tôi đánh giá hai xét nghiệm t bằng cách kiểm tra xem liệu chúng có thể xác định được sự khác biệt về COVID-19 SI do giới tính và các biện pháp can thiệp phi dược phẩm (NPI) hay không. Vì vậy, chúng tôi tiến hành thử nghiệm t trên hai nhóm mẫu SI được tách ra từ bộ dữ liệu gốc dựa trên hai bằng chứng dịch tễ học. Chúng bao gồm

  • bằng chứng (i). theo các nghiên cứu trước đây [, ], trường hợp mắc COVID-19 chính là nữ có khả năng mắc SI lâu hơn nam;

  • bằng chứng (ii). do phi NPI, e. g. giãn cách xã hội, đóng cửa thành phố, đình chỉ đi lại, đeo khẩu trang, khử trùng thường xuyên, SI được rút ngắn, tôi. e. trở nên nhỏ hơn, theo thời gian [, ]

Do đó, chúng tôi chia các mẫu SI COVID-19 dựa trên giới tính của ca bệnh chính và Tết Nguyên đán (CLNY) từ ngày 23 đến ngày 26 tháng 1 năm 2020 [], sau đó hầu hết các NPI (bao gồm cả phong tỏa thành phố) đã được triển khai và tăng cường. Hai nhóm mẫu SI được chọn cho các thử nghiệm t. họ đang

  • các mẫu từ quần thể (i). Các mẫu SI với ca bệnh chính là nữ có triệu chứng khởi phát trước CLNY (cỡ mẫu là 3, xem các chấm đỏ trong Hình. 3 ), và

  • các mẫu từ quần thể (ii). Các mẫu SI với các ca bệnh nam giới khởi phát triệu chứng sau CLNY (cỡ mẫu là 10, xem các chấm màu xanh lam trong Hình. 3 ).

Nói một cách đơn giản, SI trung bình của dân số (i) dự kiến ​​sẽ cao hơn SI trung bình của dân số (ii), điều này cũng được hỗ trợ bởi bằng chứng tìm thấy trong các nghiên cứu trước đây [, , ]

Đối với kết quả từ các thử nghiệm t, chúng tôi báo cáo rằng thử nghiệm t bootstrap một phía mang lại giá trị P = 0. 04 có ý nghĩa thống kê, trong khi bài kiểm tra t của Sinh viên một phía mang lại giá trị P = 0. 05. Do đó, chúng tôi chứng minh rằng thử nghiệm bootstrap t vượt trội so với thử nghiệm t của Sinh viên bằng cách phát hiện thành công sự khác biệt về COVID-19 SI do giới tính và NPI

Hạn chế

Nghiên cứu phân tích so sánh này có những hạn chế. Là một trong những nhược điểm cổ điển được đề cập trong [], đối với bootstrap trên các mẫu từ dân số không có phương sai hữu hạn, bootstrap sẽ khó có khả năng hội tụ. Tuy nhiên, các mẫu dữ liệu y tế (thường) là từ các mẫu trong thế giới thực và do đó phương sai được cho là hữu hạn. Mặc dù chúng tôi đã chứng minh hiệu suất thử nghiệm bằng cách sử dụng các tập hợp lớn các mẫu dữ liệu được tạo ngẫu nhiên, nghiên cứu sẽ được hưởng lợi từ các ví dụ trong thế giới thực có kết luận khác với thử nghiệm bootstrap t và thử nghiệm t của Sinh viên, tương ứng

kết luận

Chúng tôi đã chứng minh rằng thử nghiệm bootstrap t vượt trội so với thử nghiệm t của Sinh viên và nên thay thế thử nghiệm t của Sinh viên trong phân tích dữ liệu y tế bất kể kích thước mẫu

Nhìn nhận

Các tác giả cảm ơn G. Dương và Y. Han, cả hai đều đến từ Đại học Chinese University of Hong Kong, vì những thảo luận hữu ích của họ ở giai đoạn đầu của nghiên cứu này

Sự đóng góp của tác giả

SZ lên ý tưởng cho nghiên cứu, tiến hành phân tích, soạn thảo bản thảo và sửa đổi nghiêm túc nội dung. SZ, ZY và DH đã thảo luận về kết quả. Tất cả các tác giả có toàn quyền truy cập dữ liệu, đóng góp cho nghiên cứu, phê duyệt phiên bản cuối cùng để xuất bản và chịu trách nhiệm về tính chính xác và toàn vẹn của nó

Hỗ trợ tài chính

DH được hỗ trợ bởi Quỹ nghiên cứu chung (Số tài trợ 15205119) của Hội đồng tài trợ nghiên cứu (RGC) của Hồng Kông, Trung Quốc và Công ty Alibaba (Trung Quốc). , Ltd. tài trợ nghiên cứu hợp tác

Chuẩn mực đạo đức

Không có thí nghiệm nào được tiến hành. Nghiên cứu này dựa trên mô phỏng máy tính và bộ dữ liệu có sẵn công khai. Do đó, phê duyệt đạo đức không được áp dụng

tài liệu bổ sung

Đối với tài liệu bổ sung đi kèm với bài báo này, hãy truy cập https. //doi. tổ chức/10. 1017/S0950268821001047

bấm vào đây để xem tài liệu bổ sung (13K, xlsx)

Xung đột lợi ích

DH nhận hỗ trợ từ Công ty Alibaba (Trung Quốc). , Ltd. tài trợ nghiên cứu hợp tác. MHW là cổ đông của Beth Bioinformatics Co. , Ltd. Các tác giả khác không có xung đột lợi ích

Tuyên bố về tính khả dụng của dữ liệu

Dữ liệu COVID-19 được sử dụng trong nghiên cứu này có sẵn thông qua các tài liệu bổ sung

Người giới thiệu

1. Guyatt G và cộng sự. (1995) Số liệu thống kê cơ bản dành cho bác sĩ lâm sàng. 1. Kiểm định giả thuyết . Tạp chí Hiệp hội Y khoa Canada 152 , 27. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

2. Bland M (2015) Giới thiệu về thống kê y tế . Oxford, Vương quốc Anh. Nhà xuất bản Đại học Oxford. [Google Scholar]

3. Kirkwood BR và Sterne JA (2010) Số liệu thống kê y tế cơ bản . Malden, Massachusetts, Hoa Kỳ. John Wiley & Các Con. [Google Scholar]

4. Wilcox R (2017) Thống kê hiện đại cho khoa học xã hội và hành vi. Giới thiệu thực tế . Boca Raton, Florida, Mỹ. Chapman và Hall/CRC. [Google Scholar]

5. Phương pháp Bootstrap của Efron B (1992). một cái nhìn khác về jackknife. Trong Kotz S và Johnson N (eds), Đột phá trong thống kê . Thành phố New York, New York, Hoa Kỳ. mùa xuân, trang. 569–593. [Google Scholar]

6. Dwivedi AK, Mallawaarachchi I và Alvarado LA (2017) Phân tích các nghiên cứu cỡ mẫu nhỏ sử dụng thử nghiệm bootstrap phi tham số với phương pháp lấy mẫu lại gộp. Thống kê trong y học 36 , 2187–2205. [PubMed] [Google Scholar]

7. DiCiccio TJ và Efron B (1996) Khoảng tin cậy Bootstrap . Khoa học Thống kê 11 , 189–212. [Google Scholar]

8. Carpenter J và Bithell J (2000) Khoảng tin cậy Bootstrap. khi nào, cái nào, cái gì? . . Thống kê trong y học 19 , 1141–1164. [PubMed] [Google Scholar]

9. Efron B và Tibshirani RJ (1994) Giới thiệu về Bootstrap . Boca Raton, Florida, Mỹ. Chapman và Hall/CRC Press. [Google Scholar]

10. Anderson DR, Burnham KP và Thompson WL (2000) Kiểm định giả thuyết không. vấn đề, mức độ phổ biến và giải pháp thay thế . Tạp chí Quản lý Động vật Hoang dã 64 , 912–923. [Google Scholar]

11. Schisterman EF và cộng sự. (2005) Điểm giới hạn tối ưu và chỉ số Youden tương ứng của nó để phân biệt các cá nhân sử dụng mẫu máu tổng hợp . Dịch tễ học (Cambridge, Mass. ) 16 , 73–81. [PubMed] [Google Scholar]

12. Youden WJ (1950) Chỉ số để đánh giá các xét nghiệm chẩn đoán . Ung thư 3 , 32–35. [PubMed] [Google Scholar]

13. Dushoff J, Kain MP và Bolker BM (2018) Bây giờ tôi có thể nhìn rõ. diễn giải lại ý nghĩa thống kê . Các phương pháp tiến hóa trong hệ sinh thái 10 ( 6), 756–759. [Google Scholar]

14. Adèr HJ (2008) Tư vấn về phương pháp nghiên cứu. Bạn đồng hành của nhà tư vấn . BV, Rosmalen, Hà Lan. Nhà xuất bản Johannes van Kessel. [Google Scholar]

15. Goodhue DL, Lewis W và Thompson R (2012) PLS có lợi thế đối với cỡ mẫu nhỏ hoặc dữ liệu không bình thường không? MIS Quarterly 36, 981–1001. [Google Scholar]

16. Fine PEM (2003) Khoảng thời gian giữa các trường hợp mắc bệnh truyền nhiễm liên tiếp . Tạp chí Dịch tễ học Hoa Kỳ 158 , 1039–1047. [PubMed] [Google Scholar]

17. Wallinga J và Lipsitch M (2007) Cách các thế hệ định hình mối quan hệ giữa tốc độ tăng trưởng và số lượng sinh sản . Kỷ yếu. Khoa học sinh học 274 , 599–604. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

18. Zhao S và cộng sự. (2020) Khoảng thời gian nối tiếp trong việc xác định ước tính số lần sinh sản của bệnh do vi-rút corona mới (COVID-19) trong đợt bùng phát sớm . Tạp chí Y học Du lịch 27 , taaaa033. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

19. Grassly NC và Fraser C (2008) Các mô hình toán học về sự lây truyền bệnh truyền nhiễm . Nature Reviews Microbiology 6 , 477–487. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

20. Nishiura H và cộng sự. (2010) Ưu và nhược điểm của việc ước tính số lượng sinh sản từ tốc độ phát triển dịch sớm của cúm A (H1N1) 2009 . Sinh học lý thuyết và mô hình y học 7 , 1. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

21. Xu XK và cộng sự. (2020) Tái lập các cặp lây truyền bệnh vi-rút corona mới 2019 (COVID-19) ở Trung Quốc đại lục. ước tính các sự kiện siêu lây lan, khoảng thời gian nối tiếp và nguy cơ lây nhiễm . Bệnh truyền nhiễm lâm sàng 71 , 3163–3167. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

22. Tindale LC và cộng sự. (2020) Bằng chứng về sự lây truyền của COVID-19 trước khi khởi phát triệu chứng . eLife 9 , e57149. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

23. Du Z và cộng sự. (2020) Khoảng thời gian mắc COVID-19 liên tiếp giữa các trường hợp được xác nhận được báo cáo công khai . Bệnh truyền nhiễm mới nổi 26 , 1341–1343. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

24. Ganyani T và cộng sự. (2020) Ước tính khoảng thời gian phát sinh bệnh do vi-rút corona (COVID-19) dựa trên dữ liệu khởi phát triệu chứng, tháng 3 năm 2020 . Giám sát Châu Âu 25 , 2000257. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

25. Zhao S và cộng sự. (2020) Ước tính khoảng thời gian nối tiếp của bệnh do vi-rút corona mới (COVID-19). một phân tích thống kê sử dụng dữ liệu công khai ở Hồng Kông từ ngày 16 tháng 1 đến ngày 15 tháng 2 năm 2020 . Ranh giới trong Vật lý 8 , 347. [Google Scholar]

26. Bạn C và cộng sự. (2020) Ước tính số lần tái sản xuất thay đổi theo thời gian của đợt bùng phát COVID-19 ở Trung Quốc . Tạp chí Quốc tế về Vệ sinh và Sức khỏe Môi trường 228 , 113555. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

27. Nishiura H, Linton NM và Akhmetzhanov AR (2020) Chuỗi các đợt nhiễm vi-rút corona mới (COVID-19) . Tạp chí quốc tế về bệnh truyền nhiễm 93 , 284–286. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

28. Ma S và cộng sự. (2020) Các thông số dịch tễ học của COVID-19. nghiên cứu hàng loạt trường hợp . Tạp chí Nghiên cứu Internet Y khoa 22 , e19994. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

29. Li Q và cộng sự. (2020) Động lực lây truyền ban đầu ở Vũ Hán, Trung Quốc, bệnh viêm phổi do vi-rút corona mới . Tạp chí Y học New England 382 , 1199–1207. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

30. Adam DC và cộng sự. (2020) Khả năng lây nhiễm SARS-CoV-2 theo cụm và siêu lây lan ở Hồng Kông . Y học tự nhiên 26 , 1714–1719. [PubMed] [Google Scholar]

31. Ali ST và cộng sự. (2020) Khoảng cách giữa các đợt lây truyền SARS-CoV-2 được rút ngắn theo thời gian nhờ các biện pháp can thiệp phi dược phẩm . Khoa học (New York, N. Y. ) 369 , 1106–1109. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

32. Ferretti L và cộng sự. (2020) Định lượng khả năng lây truyền SARS-CoV-2 đề xuất kiểm soát dịch bệnh bằng truy vết tiếp xúc kỹ thuật số . Khoa học (New York, N. Y. ) 368 , eabb6936. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

33. Cowling BJ và cộng sự. (2009) Ước tính khoảng thời gian nối tiếp của bệnh cúm . Dịch tễ học (Cambridge, Mass. ) 20 , 344–347. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

34. Chinazzi M và cộng sự. (2020) Ảnh hưởng của việc hạn chế đi lại đối với sự lây lan của đợt bùng phát vi-rút corona mới 2019 (COVID-19) . Khoa học (New York, N. Y. ) 368 , 395–400. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

35. Chong KC và cộng sự. (2020) Theo dõi khả năng lây truyền bệnh của bệnh do vi-rút corona chủng mới 2019 ở Chiết Giang, Trung Quốc . Tạp chí quốc tế về bệnh truyền nhiễm 96 , 128–130. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

36. Kucharski AJ và cộng sự. (2020) Động lực ban đầu của quá trình lây truyền và kiểm soát COVID-19. một nghiên cứu về mô hình toán học . Bệnh truyền nhiễm Lancet 20 , 553–558. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

37. Leung K và cộng sự. (2020) Mức độ lây lan và mức độ nghiêm trọng của COVID-19 đợt đầu tiên ở Trung Quốc bên ngoài Hồ Bắc sau các biện pháp kiểm soát và lập kế hoạch cho kịch bản đợt thứ hai. đánh giá tác động của mô hình hóa . Lancet (London, Anh) 395 , 1382–1393. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

38. Mizumoto K và Chowell G (2020) Khả năng lây truyền của vi-rút corona chủng mới (COVID-19) trên tàu Diamond Princess Cruises, 2020. Mô hình bệnh truyền nhiễm 5 , 264–270. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

39. Musa SS và cộng sự. (2020) Ước tính tốc độ tăng trưởng theo cấp số nhân và số lần sinh sản cơ bản của bệnh vi-rút corona 2019 (COVID-19) ở Châu Phi . Bệnh truyền nhiễm của Nghèo đói 9 , 96. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

40. Nishiura H và cộng sự. (2020) Tỷ lệ không xác định được khả năng nhiễm vi-rút corona mới (2019-nCoV). ước tính sử dụng dữ liệu hành khách Nhật Bản trên các chuyến bay sơ tán . Tạp chí Y học Lâm sàng 9 , 419. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

41. Ran J và cộng sự. (2020) Phân tích lại trong việc khám phá mối liên hệ giữa nhiệt độ và khả năng lây truyền COVID-19. một nghiên cứu sinh thái với 154 thành phố của Trung Quốc . Tạp chí Hô hấp Châu Âu 56 , 2001253. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

42. Riou J và Althaus CL (2020) Mô hình lây truyền sớm từ người sang người của chủng vi rút corona mới Vũ Hán 2019 (2019-nCoV), tháng 12 năm 2019 đến tháng 1 . . Giám sát Châu Âu 25 , 2000058. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

43. Tuite AR và Fisman DN (2020) Số liệu báo cáo, tốc độ phát triển và sinh sản của dịch bệnh do vi-rút corona chủng mới 2019 (2019-nCoV). Biên niên sử nội khoa 172 , 567–568. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

44. Volz E và cộng sự. (2021) Đánh giá tác động của đột biến tăng đột biến D614G của SARS-CoV-2 đối với khả năng lây truyền và khả năng gây bệnh . Ô 184 , 64–75, e11. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

45. Wu JT và cộng sự. (2020) Ước tính mức độ nghiêm trọng lâm sàng của COVID-19 từ động lực lây truyền ở Vũ Hán, Trung Quốc . Thuốc tự nhiên 26 , 506–510. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

46. Zhao S và cộng sự. (2020) Ước tính số ca mắc vi-rút corona mới (2019-nCoV) chưa được báo cáo ở Trung Quốc trong nửa đầu tháng 1 năm 2020. phân tích mô hình dựa trên dữ liệu về đợt bùng phát sớm . Tạp chí Y học lâm sàng 9 , 388. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

47. Zhao S và cộng sự. (2020) Các động lực bắt chước trong việc giảm thiểu đợt bùng phát bệnh do vi-rút corona mới (COVID-19) ở Vũ Hán, Trung Quốc từ năm 2019 đến năm 2020 . Biên niên sử y học chuyển dịch 8 , 448. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

48. Wang K và cộng sự. (2020) Ước tính khoảng thời gian nối tiếp của bệnh do vi-rút corona chủng mới (COVID-19) dựa trên dữ liệu giám sát công khai ở Thâm Quyến, Trung Quốc từ ngày 19 tháng 1 đến ngày 22 tháng 2 năm 2020. Các bệnh xuyên biên giới và mới nổi 67 ( 6), 2818–2822. [Bài viết miễn phí của PMC] [PubMed] [Google Scholar]

49. Zhao S và cộng sự. (2020) Ước tính khoảng thời gian nối tiếp của bệnh do vi-rút corona mới (COVID-19). một phân tích thống kê sử dụng dữ liệu công khai ở Hồng Kông từ ngày 16 tháng 1 đến ngày 15 tháng 2 năm 2020 . Ranh giới trong Vật lý 8 , 347. [Google Scholar]

50. Zhao S và cộng sự. (2020) COVID-19 và sự khác biệt theo giới tính. phân tích dữ liệu giám sát công cộng ở Hồng Kông và Thâm Quyến, Trung Quốc, từ ngày 10 tháng 1 đến ngày 15 tháng 2 năm 2020

bootstrapped t là gì

Bootstrapping là bất kỳ thử nghiệm hoặc số liệu nào sử dụng lấy mẫu ngẫu nhiên có thay thế (e. g. bắt chước quá trình lấy mẫu) và thuộc nhóm phương pháp lấy mẫu lại rộng hơn. Bootstrapping chỉ định các biện pháp đo lường độ chính xác (độ lệch, phương sai, khoảng tin cậy, lỗi dự đoán, v.v. ) để ước tính mẫu.

Làm cách nào để giải thích kết quả bootstrap?

Ý tưởng trực quan đằng sau bootstrap là đây. nếu tập dữ liệu ban đầu của bạn được lấy ngẫu nhiên từ toàn bộ tổng thể, thì nếu bạn lấy mẫu con từ mẫu (có thay thế), thì điều đó cũng đại diện cho một lần rút ra từ toàn bộ tổng thể. You can then estimate your model on all of those bootstrapped datasets.

bootstrap có tốt hơn t không

Và lý thuyết kiểm định t không áp dụng cho một số tham số/thống kê quan tâm, e. g. phương tiện cắt, độ lệch chuẩn, lượng tử, v.v. Ưu điểm của bootstrap là nó có thể ước tính phân phối lấy mẫu mà không cần nhiều giả định theo phương pháp tham số .

Khi nào không sử dụng số liệu thống kê bootstrap?

Nó không thực hiện hiệu chỉnh sai lệch, v.v. Không có cách chữa trị cho cỡ mẫu nhỏ. Bootstrap rất mạnh, nhưng nó không phải là ma thuật — nó chỉ có thể hoạt động với thông tin có sẵn trong mẫu ban đầu. Nếu các mẫu không đại diện cho toàn bộ tổng thể thì bootstrap sẽ không chính xác lắm.