Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Phân tích thành phần có cấu trúc tổng quát (GSCA) là một cách tiếp cận có cơ sở về mặt lý thuyết đối với mô hình phương trình cấu trúc dựa trên thành phần (SEM). Cách tiếp cận này sử dụng phương pháp bootstrap để ước tính khoảng tin cậy của các ước tính tham số của nó mà không cần viện đến các giả định phân phối, chẳng hạn như tính quy tắc đa biến. Nó hiện chỉ cung cấp khoảng tin cậy phần trăm bootstrap. Gần đây, tính hữu ích tiềm năng của khoảng tin cậy (CIs) bootstrap (BCa) được điều chỉnh sai lệch và tăng tốc so với phương pháp phân vị đã thu hút sự chú ý đối với một phương pháp SEM dựa trên thành phần khác—mô hình đường dẫn bình phương tối thiểu một phần. Do đó, trong nghiên cứu này, chúng tôi đã triển khai phương pháp BCa CI vào GSCA và tiến hành mô phỏng nghiêm ngặt để đánh giá hiệu suất của ba phương pháp CI bootstrap, bao gồm phương pháp percentile, BCa và Student's t, xét về mức độ phù hợp và cân bằng. Chúng tôi thấy rằng phương pháp phân vị tạo ra các TCTD gần với mức độ bao phủ mong muốn hơn so với các phương pháp khác, trong khi phương pháp BCa ít bị mất cân bằng hơn so với hai phương pháp còn lại. Kết quả nghiên cứu và ý nghĩa được thảo luận, cũng như những hạn chế và định hướng cho nghiên cứu trong tương lai

Giới thiệu

Phân tích thành phần có cấu trúc tổng quát (GSCA; , ) là một cách tiếp cận mô hình phương trình cấu trúc dựa trên thành phần (SEM), trong đó các cấu trúc được biểu diễn bằng các tổ hợp có trọng số hoặc các thành phần của chỉ số (các biến quan sát; ;). Kể từ khi hoàn thiện, khả năng phân tích dữ liệu của GSCA đã được cải thiện rõ rệt, cho phép các nhà nghiên cứu ứng dụng, ví dụ, xử lý tính không đồng nhất của người trả lời ở cấp độ cụm (), mô hình hóa đa cấp (; ), kiểm duyệt tác động của cấu trúc () và dữ liệu theo chiều dọc và

GSCA sử dụng thuật toán bình phương nhỏ nhất xen kẽ () để giảm thiểu một hàm bình phương nhỏ nhất cho ước tính tham số mà không yêu cầu các giả định phân phối như tính quy tắc đa biến. Vì vậy, nó là một cách tiếp cận không phân phối. Tuy nhiên, như một sự đánh đổi, nó không thể ước tính sai số chuẩn hoặc khoảng tin cậy của các ước tính tham số của nó dựa trên các xấp xỉ tiệm cận (lý thuyết thông thường) (, trang. 24–25). Thay vào đó, nó sử dụng phương thức bootstrap () để lấy sai số chuẩn và khoảng tin cậy không theo tham số. Trong bước đầu tiên, các mẫu ngẫu nhiên có kích thước n (bằng kích thước của tập dữ liệu gốc) được lấy mẫu lặp lại từ tập dữ liệu gốc bằng cách thay thế. Trong bước thứ hai, các tham số được ước tính bằng cách sử dụng từng mẫu bootstrap. Cuối cùng, các lỗi tiêu chuẩn và khoảng tin cậy được lấy từ phân phối tần suất tương đối của các ước tính trên các mẫu lại được coi là xấp xỉ theo kinh nghiệm của phân phối lấy mẫu của nó. Các lỗi tiêu chuẩn bootstrap và khoảng tin cậy có thể được sử dụng để kiểm tra ý nghĩa thống kê của các ước tính tham số. Ví dụ: thống kê bootstrap t, còn được gọi là tỷ lệ tới hạn (CR), có thể được tính bằng cách chia ước tính tham số cho sai số chuẩn bootstrap của nó. Nếu giá trị bootstrap t bằng hoặc lớn hơn giá trị tới hạn của phân phối t, thì ước tính tham số được coi là có ý nghĩa thống kê ở mức alpha danh nghĩa với giả định rằng phân phối lấy mẫu theo kinh nghiệm của tham số xấp xỉ phân phối t. GSCA hiện cung cấp khoảng tin cậy phần trăm (; ). Khoảng tin cậy (CI) được định nghĩa là khoảng giữa giới hạn dưới và giới hạn trên của ước tính tham số ở mức độ tin cậy được chỉ định trước (e. g. , khoảng tin cậy 95%). Việc sử dụng CI phần trăm được khuyến nghị trên các tỷ lệ tới hạn vì CI phần trăm cung cấp thêm thông tin về các thuộc tính của ước tính tham số, bao gồm độ chính xác và ý nghĩa thống kê mà không cần giả định về tính chuẩn của các ước tính ()

Gần đây, CI bootstrap (BCa) tăng tốc và hiệu chỉnh sai lệch đã được đề xuất sử dụng với mô hình đường dẫn bình phương nhỏ nhất một phần (, pp. 155–159), một cách tiếp cận khác đối với SEM dựa trên thành phần (). Gần đây hơn, đã tiến hành một nghiên cứu mô phỏng nghiêm ngặt và chỉ ra rằng, về tổng thể, phương pháp phân vị có xu hướng tạo ra các TCTD thận trọng hơn—bao phủ quá mức (i. e. , các CI rộng hơn), trong khi phương pháp BCa có xu hướng cung cấp các CI quá hẹp—bảo hiểm ngầm (i. e. , CI hẹp hơn). Tuy nhiên, nghiên cứu này đã khuyến nghị sử dụng phương pháp phân vị thay vì phương pháp BCa để lập mô hình đường dẫn bình phương nhỏ nhất một phần vì giá trị dân số thường không đủ bao phủ bởi các TCTD BCa. Chưa có nghiên cứu nào điều tra hiệu suất của các phương pháp CI bootstrap cho GSCA. Do đó, trong nghiên cứu này, chúng tôi triển khai phương pháp BCa CI vào GSCA và tiến hành mô phỏng nghiêm ngặt để kiểm tra hiệu suất của các phương pháp CI bootstrap khác nhau cho GSCA, bao gồm các phương pháp centile, BCa và Student's t

Bố cục bài viết như sau. chúng tôi bắt đầu bằng cách cung cấp một mô tả về các phương pháp CI bootstrap khác nhau. Sau đó, chúng tôi thảo luận về quy trình thiết kế và phân tích của nghiên cứu mô phỏng Monte Carlo và báo cáo kết quả của nó. Phần cuối cùng tóm tắt những phát hiện và ý nghĩa của nghiên cứu cũng như thảo luận về những hạn chế và hướng nghiên cứu trong tương lai

Phương pháp khoảng tin cậy Bootstrap

Như đã nêu, chúng tôi tập trung vào ba phương pháp CI bootstrap phổ biến nhất trong thực tế. phần trăm, CI được điều chỉnh sai lệch và tăng tốc và t (; ) của Sinh viên

Phương pháp Bootstrap phần trăm

Khoảng bootstrap phân vị chỉ là khoảng giữa các phân vị 100×(α2) và 100×(1-α2) của phân phối ước tính θ thu được từ lấy mẫu lại, trong đó θ đại diện cho một tham số quan tâm và α là mức ý nghĩa (e. g. , a = 0. 05 cho 95% TCTD) (). Có thể thu được CI phân vị bootstrap của θ^ (công cụ ước tính của θ) như sau. (1) B mẫu bootstrap ngẫu nhiên được tạo, (2) ước tính tham số được tính toán từ mỗi mẫu bootstrap, (3) tất cả ước tính tham số B bootstrap được sắp xếp từ thấp nhất đến cao nhất và (4) CI được xây dựng như sau,

[θ^giới hạn dưới, θ^giới hạn trên]=[θ^j*, θ^k*],

trong đó θ^j* biểu thị phân vị thứ j (giới hạn dưới) và θ^k* biểu thị phân vị thứ k (giới hạn trên); . Ví dụ: CI bootstrap phân vị 95% với 1.000 mẫu bootstrap là khoảng giữa giá trị lượng tử thứ 25 và giá trị lượng tử thứ 975 của 1.000 ước tính tham số bootstrap

Phương pháp Bootstrap hiệu chỉnh sai lệch và tăng tốc

Để khắc phục các vấn đề về vùng phủ sóng quá mức trong CI bootstrap phần trăm (), phương pháp BCa hiệu chỉnh cả độ lệch và độ lệch của ước tính tham số bootstrap bằng cách kết hợp hệ số hiệu chỉnh độ lệch và hệ số gia tốc (; ). Hệ số hiệu chỉnh sai lệch ẑ0 được ước tính là tỷ lệ ước tính bootstrap nhỏ hơn ước tính tham số ban đầu θ^,

ẑ0=Φ-1(#{θ^*< θ^}B),

trong đó Φ−1 là hàm nghịch đảo của hàm phân phối tích lũy chuẩn tắc chuẩn (e. g. , Φ−1 (0. 975) = 1. 96). Hệ số gia tốc â được ước tính thông qua lấy mẫu lại jackknife (i. e. , lấy mẫu lại "bỏ một"), bao gồm tạo ra n bản sao của mẫu ban đầu, trong đó n là số lượng quan sát trong mẫu. Bản sao jackknife đầu tiên thu được bằng cách loại bỏ trường hợp đầu tiên (i = 1) của mẫu ban đầu, lần thứ hai bằng cách loại bỏ trường hợp thứ hai (i = 2), v.v., cho đến khi thu được n mẫu có kích thước n−1. Đối với mỗi mẫu lại của jackknife, thu được θ^(-i). Giá trị trung bình của các ước tính này là,

θ^(·)=∑i=1nθ^(-i)n

Sau đó, hệ số gia tốc â được tính như sau,

â=∑i=1n(θ^(·)-θ^(-i))36 {∑i=1n(θ^(·)-θ^(-i))2 }3/2

Với các giá trị của ẑ0 và â, các giá trị α1 và α2 được tính toán,

α1=Φ{ẑ0+ẑ0+ z(α/2)1-â(ẑ0+ z(α/2))}α2=Φ{ẑ0+ẑ0+ z(1-α/2)1-â(ẑ0+ z(1-

Ở đây, z(α/2) là điểm phân vị thứ 100×(α2) của phân phối chuẩn chuẩn (e. g. , z(. 05/2) = −1. 96). Sau đó, một CI [θ^j*, θ^k* ] được tạo với các giá trị của α1 và α2 nhân với số mẫu bootstrap, j = α1 × B và k = α2 × B

Bootstrap Phương pháp t của sinh viên

Phương pháp t của sinh viên giả định rằng θ^-θse^ xấp xỉ phân phối t, trong đó θ là tham số, θ^ là ước tính của tham số và se^ là sai số chuẩn của tham số. Bootstrap Student's t CI cho một cấp độ alpha nhất định (e. g. , a = 0. 05 cho 95% TCTD) được xây dựng như sau,

[θ^-tn-1(a2)·se^, θ^+tn-1(1-a2)·se^ ]

Lỗi chuẩn bootstrap của mỗi ước tính, se^(θ^*), được sử dụng cho se^. Lưu ý rằng khoảng tin cậy t của Học sinh không có tính năng điều chỉnh khoảng tin cậy, tính đến bất kỳ loại sai lệch nào khác so với phân phối t

Thiết kế mô phỏng

Chúng tôi đánh giá hiệu suất của ba phương pháp bootstrap (percentile, BCa và Student's t) trong GSCA, sử dụng mô phỏng Monte Carlo. mô tả bố cục cấu trúc của mô hình tạo dữ liệu (i. e. , mô hình dân số), trước đây cũng được sử dụng trong. Mô hình cấu trúc chứa bốn biến tiềm ẩn ngoại sinh và hai nội sinh, và một số đường hồi quy được chỉ định giữa chúng với các giá trị hệ số đường dẫn nằm trong khoảng từ −0. 75 đến 0. 55. Phương sai của các biến tiềm ẩn nội sinh được giải thích bởi các biến tiềm ẩn ngoại sinh (R2) là 0. 168 cho γ5 và 0. 383 cho γ6. Phần đo lường của mô hình dân số (i. e. , mô hình đo lường) là đồng nhất cho các biến tiềm ẩn. Nghĩa là, mỗi biến tiềm ẩn có ba chỉ báo trong đó tải chuẩn hóa bằng 0. 7, 0. 8 hoặc 0. 9. Lưu ý rằng các ký hiệu cho các thuật ngữ sai số trong các mô hình đo lường và cấu trúc được bỏ qua trong hình để đơn giản

HÌNH 1

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 1. Mô hình phương trình cấu trúc dân số được chỉ định cho nghiên cứu mô phỏng

Chúng tôi đã xem xét hai cách phân phối khác nhau cho các chỉ số—thường được phân phối với giá trị trung bình bằng 0 và phương sai đơn vị so với. không phân phối chuẩn thông qua phép biến đổi logarit của các chỉ số phân phối chuẩn. Đối với các chỉ báo không có phân phối chuẩn, các biến ngẫu nhiên bình thường độc lập được tạo ra và chúng được chuyển đổi thành các biến ngẫu nhiên logic thông thường bằng phép lũy thừa, sau đó các biến ngẫu nhiên bị thao túng này được chuẩn hóa. Cấu trúc tương quan mong muốn thu được bằng cách nhân ma trận dữ liệu với hệ số Cholesky của ma trận hiệp phương sai xác định trước (). Đối với các chỉ số không bình thường, độ lệch trung bình dao động từ 1. 41 đến 2. 53, và độ nhọn trung bình dao động từ 6. 32 đến 18. 28. Lưu ý rằng độ lệch và độ nhọn của phân phối chuẩn lần lượt là 0 và 3. Chúng tôi cũng đã xem xét bốn cỡ mẫu khác nhau. N = 50, 100, 200 và 500. Năm trăm mẫu ngẫu nhiên được rút ra theo từng điều kiện trong số tám điều kiện (hai phân phối × bốn cỡ mẫu), thu được tổng cộng 4.000 lần lặp lại. Chúng tôi đã áp dụng GSCA để điều chỉnh mô hình cho phù hợp với từng mẫu và sau đó, thu được các CI phần trăm, BCa và Student's t cho các ước tính hệ số tải và đường dẫn dựa trên 1.000 mẫu bootstrap (B = 1.000). Cụ thể, chúng tôi đã sửa đổi gói gesca R (; ) với các hàm R mới của các phương thức bootstrap. Các mã MATLAB được sử dụng để tạo dữ liệu và các hàm R cho ba phép tính CI có sẵn dưới dạng. Xem thêm và để biết thêm chi tiết về quy trình tạo dữ liệu của SEM dựa trên thành phần. Không có trường hợp mô hình không hội tụ hoặc giải pháp không được chấp nhận trong mô phỏng hiện tại

Tiêu chí đánh giá

Chúng tôi đã đánh giá hai thuộc tính của CI trong mô phỏng. (a) bảo hiểm và (b) số dư (). Mức độ phù hợp của một CI là tỷ lệ mà giá trị tham số được bao gồm trong CI trên các mẫu được sao chép. Các giá trị bảo hiểm phải gần với mức độ tin cậy được xác định trước của khoảng thời gian. Ví dụ: lý tưởng nhất là 95% CI (độ bao phủ danh nghĩa) nên bao gồm tham số quan tâm 95% thời gian qua các lần sao chép. Nói cách khác, trong 5% số lần lặp lại, khoảng thời gian sẽ không nắm bắt được giá trị tham số “đúng” trong tổng thể

Số dư của một CI đề cập đến cách phân chia "không bảo hiểm". Tức là giá trị tổng thể lớn hơn giới hạn trên của khoảng bao nhiêu lần và giá trị tổng thể nhỏ hơn giới hạn dưới của khoảng bao nhiêu lần. Trong một tình huống lý tưởng, CI nên được cân bằng sao cho giá trị tổng thể lớn hơn giới hạn trên hoặc nhỏ hơn giới hạn dưới ở cùng số lần lặp lại (e. g. , 2. 5% số lần đối với 95% CI), đồng thời đạt được mức độ bao phủ mong muốn

Kết quả

Phần này cung cấp kết quả của nghiên cứu mô phỏng, hiển thị một loạt biểu đồ cho thấy hiệu suất của ba phương pháp CI bootstrap về phạm vi bao phủ và số dư trung bình trên sáu biến tiềm ẩn. Trong các biểu đồ này, trục x biểu thị kích thước mẫu (N = 50, 100, 200, 500) và trục y biểu thị tỷ lệ tải (0. 7, 0. 8, 0. 9) hoặc hệ số đường đi (−0. 75, −0. 25, −0. 2, −0. 15, 0. 35, 0. 55) ở trên giới hạn trên hoặc dưới giới hạn dưới của CI. Đối với khoảng tin cậy 95%, điều này không nên xảy ra quá 5%. Hơn nữa, giá trị tham số dự kiến ​​sẽ ở trên (dưới) giới hạn trên (dưới) của CI một cách cân bằng—i. e. , không quá 2. 5% trong mỗi trường hợp. Đường đứt nét ngang biểu thị phạm vi bao phủ lý thuyết của khoảng tin cậy 95% cân bằng hoàn hảo. Do đó, đường biểu thị phương pháp CI bootstrap càng gần với đường đứt nét thì phương pháp cụ thể đó càng gần với phạm vi bao phủ và cân bằng lý tưởng mà CI nên thể hiện

Tải cho các chỉ số phân phối thông thường

hiển thị phạm vi bao phủ và sự cân bằng của phân vị, BCa và t 95% CIs của Sinh viên trong các tải nằm trong khoảng từ 0. 7 đến 0. 9 theo phân phối bình thường. Trong trường hợp 0. 9 đang tải, mỗi phương pháp tạo ra các TCTD bao gồm giá trị dân số này hơn 95% thời gian, ngụ ý phạm vi bảo hiểm rộng hơn thận trọng với tỷ lệ lỗi thấp hơn mức danh nghĩa là 5%. Kết quả tương tự đã được tìm thấy trong 0. 8 điều kiện tải, ngoại trừ một mẫu nhỏ (N = 50). Khi tải là 0. 7, T CIs của sinh viên loại trừ giá trị dân số này hơn 5% thời gian nếu chúng được xây dựng bằng cách sử dụng một mẫu nhỏ (N = 100). Đối với một mẫu lớn hơn (i. e. , >200), về tổng thể, mỗi TCTD t của phân vị, BCa và Sinh viên đều cách xa mức bao phủ mong muốn (thấp hơn đường đứt nét ngang ở mức 5%), cho thấy các TCTD rộng hơn là θ^. Xu hướng này trở nên lớn hơn khi kích thước tải lớn hơn. Nói chung, phương pháp phân vị tạo ra phạm vi bảo hiểm tốt hơn trong các TCTD (i. e. , gần với đường nét đứt ngang) hơn so với hai phương pháp còn lại

HÌNH 2

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 2. Mức độ phù hợp và cân bằng của bootstrap phân vị, điều chỉnh sai lệch và tăng tốc (BCa) và khoảng tin cậy t 95% (CIs) của Student là 0. 7, 0. 8 và 0. 9 lần tải cho các chỉ số bình thường

Tất cả ba phương pháp bootstrap đều có xu hướng dịch chuyển CI của chúng lên trên và việc dịch chuyển như vậy có vấn đề đặc biệt với các tải nhỏ hơn (0. 7, 0. 8) và cỡ mẫu nhỏ hơn (N = 50, 100). Do đó, các TCTD bị mất cân bằng sao cho giới hạn dưới lớn hơn giá trị dân số thường xuyên hơn mong muốn (2. 5%), trong khi giới hạn trên nhỏ hơn giá trị dân số ít thường xuyên hơn mong muốn (2. 5%). Đối với việc tải 0. 7, sự cân bằng trong các TCTD được cải thiện khi cỡ mẫu tăng lên (i. e. , gần với mức danh nghĩa là 2. 5%). Trong các điều kiện của 0. 9 và cỡ mẫu > 100, giá trị tổng thể nhỏ hơn giới hạn dưới hoặc lớn hơn giới hạn trên ít hơn so với mong muốn chủ yếu do phạm vi bao phủ bị thổi phồng (i. e. , >95%) của các TCTD rộng. Nhìn chung, phạm vi bảo hiểm không cân bằng và tăng cao đã được quan sát trên tất cả các phương pháp

Tải cho các chỉ số phân phối không bình thường

trình bày mức độ phù hợp và cân bằng của phân vị, BCa và T 95% TCTD của Sinh viên là 0. 7, 0. 8 và 0. 9 lần tải cho các chỉ số không phân phối bình thường. Các kết quả tương tự như kết quả với các chỉ số được phân phối bình thường, cho thấy rằng việc phân phối các chỉ số ít ảnh hưởng đến các TCTD bootstrap của một tải. Hơn 95% thời gian, giá trị dân số được bao gồm trong các TCTD bất kể kích thước tải và tỷ lệ này trở nên lớn hơn khi kích thước mẫu tăng lên. Nói chung, mức độ phù hợp có thể so sánh được qua ba phương pháp, mặc dù các TCTD t của phần trăm và của Sinh viên gần với mức danh nghĩa hơn các TCTD BCa trong trường hợp tải nhỏ hơn (0. 7, 0. số 8). Nói chung, phương pháp phân vị tạo ra phạm vi bảo hiểm tốt hơn trong các TCTD so với hai phương pháp kia

HÌNH 3

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 3. Mức độ phù hợp và cân bằng của bootstrap phân vị, điều chỉnh sai lệch và tăng tốc (BCa) và khoảng tin cậy t 95% (CIs) của Student là 0. 7, 0. 8 và 0. 9 lần tải cho các chỉ số không phân phối bình thường

Các CI của mỗi phương pháp được dịch chuyển lên trên đặc biệt là khi tải tương đối nhỏ (0. 7, 0. 8) được ước tính với một mẫu nhỏ (N = 50, 100). Trong các điều kiện của 0. 7 và cỡ mẫu lớn hơn (N = 200, 500), giới hạn dưới của CIs gần với phạm vi bao phủ lý thuyết—nếu được so sánh, gần với mức mong muốn hơn nhiều (2. 5%) trong phương pháp phân vị và t của Sinh viên. cho 0. 9 đang tải, các CI rất rộng (i. e. (2. 5%). Nhìn chung, số dư tại các TCTD không có sự khác biệt đáng kể giữa ba phương pháp

Hệ số đường dẫn với các chỉ số phân phối thông thường

Kết quả mô phỏng cho các hệ số đường dẫn giống nhau hơn trên các giá trị tải khác nhau (0. 7, 0. 8, 0. 9), gợi ý rằng kích thước tải có ảnh hưởng tối thiểu đến các CI bootstrap. Do đó, kết quả được tổng hợp theo ba điều kiện tải dân số và kết quả tổng hợp được báo cáo tại đây. Một phạm vi đầy đủ của các kết quả mô phỏng sẽ có sẵn theo yêu cầu

trình bày mức độ bao phủ của phân vị phần trăm, BCa và T 95% TCTD của Sinh viên về các hệ số đường dẫn ở các kích thước khác nhau (−0. 75, −0. 25, −0. 20, −0. 15, 0. 35, 0. 55). Đầu tiên, phương pháp phân vị tạo ra mức độ phù hợp rõ ràng tốt hơn trong các TCTD (i. e. , gần với đường nét đứt ngang) hơn so với hai phương pháp còn lại, bất kể kích thước của hệ số đường dẫn nhưng ngoại trừ hệ số đường dẫn lớn nhất (−0. 75). Thứ hai, các phương pháp BCa và Student's t tạo ra các CI rộng hơn mức độ bao phủ mong muốn và xu hướng này rõ ràng hơn khi giá trị tuyệt đối của hệ số đường dẫn tăng lên. Thứ ba, các TCTD trở nên rộng hơn (i. e. , độ bao phủ tăng cao) khi kích thước mẫu tăng lên. Nói chung, các TCTD phần trăm gần với phạm vi bao phủ lý thuyết hơn so với hai phương pháp còn lại

HINH 4

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

hinh 4. Phạm vi bao phủ của phân vị phần trăm, hiệu chỉnh sai lệch và bootstrap tăng tốc (BCa) và khoảng tin cậy (CIs) t 95% của Student đối với các hệ số đường dẫn trong điều kiện chỉ báo bình thường

, cho thấy rằng các CI của các hệ số đường dẫn nhỏ đến trung bình (−0. 25, −0. 20, −0. 15, 0. 35) được cân đối hợp lý—i. e. , giới hạn trên và dưới gần với mức mong muốn (2. 5%). Ngược lại, đối với các hệ số đường dẫn tương đối lớn (−0. 75, 0. 55), giá trị tổng thể nhỏ hơn giới hạn dưới hoặc lớn hơn giới hạn trên ít hơn nhiều lần so với mong muốn. Nhìn chung, phương pháp BCa ít bị mất cân bằng hơn so với phương pháp centile và Student's t

HÌNH 5

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 5. Các giới hạn dưới của phân vị, hiệu chỉnh sai lệch và bootstrap tăng tốc (BCa) và khoảng tin cậy (CIs) t 95% của Student của các hệ số đường dẫn trong điều kiện chỉ báo bình thường

HÌNH 6

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 6. Các giới hạn trên của phân vị phần trăm, hiệu chỉnh sai lệch và bootstrap tăng tốc (BCa) và khoảng tin cậy (CIs) t 95% của Student của các hệ số đường dẫn trong điều kiện chỉ báo bình thường

Hệ số đường dẫn với các chỉ số phân phối không bình thường

trình bày mức độ bao phủ của bách phân vị, BCa và T 95% CIs của Sinh viên về các hệ số đường dẫn khi các chỉ số không được phân phối bình thường. Kết quả hơi khác so với những gì chúng tôi tìm thấy với các chỉ số phân phối bình thường. Cụ thể, các TCTD của từng phương pháp vẫn gần với phạm vi bao phủ lý thuyết (95%) khi giá trị dân số của các hệ số đường dẫn tương đối nhỏ đến trung bình (−0. 25, −0. 20, −0. 15), trong khi các TCTD bao gồm giá trị tổng thể của các hệ số đường dẫn lớn (−0. 75, 0. 35, 0. 55) có CI rộng hơn nhiều (i. e. , nhiều hơn 95% thời gian). Lạm phát như vậy trong phạm vi bảo hiểm trở nên tồi tệ hơn khi kích thước mẫu tăng lên. Chẳng hạn, khi hệ số đường dẫn là −0. 75 và cỡ mẫu >100, cả ba phương pháp đều tạo ra các TCTD bao gồm giá trị dân số hầu như luôn luôn qua các lần sao chép. Tuy nhiên, nhìn chung, các TCTD phần trăm ít nhạy cảm hơn với giá trị dân số và cỡ mẫu, cho thấy gần với mức danh nghĩa là 95%, so với hai phương pháp còn lại

HÌNH 7

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 7. Mức độ bao phủ của phân vị, BCa và T 95% CI của Student của các hệ số đường dẫn trong điều kiện chỉ báo không phân phối chuẩn

, cho thấy rằng các CI của các hệ số đường dẫn nhỏ đến trung bình (−0. 25, −0. 20, −0. 15) hơi dịch xuống dưới—i. e. , giới hạn dưới thấp hơn mức mong muốn (2. 5%), và giới hạn trên cao hơn mức mong muốn (2. 5%). Sự cân bằng phần nào được cải thiện khi kích thước mẫu tăng lên (i. e. , gần với mức danh nghĩa là 2. 5%). Ngược lại, đối với các hệ số đường dẫn tương đối lớn (−0. 75, 0. 55), giá trị tổng thể nhỏ hơn giới hạn dưới hoặc lớn hơn giới hạn trên ít hơn nhiều lần so với mong muốn, có thể là do phạm vi bao phủ bị thổi phồng (i. e. , CI rộng) được quan sát trước đó. Tương tự như những phát hiện trong điều kiện chỉ báo bình thường, phương pháp BCa ít bị mất cân bằng hơn so với phương pháp phân vị và t của Sinh viên

HÌNH 8

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 8. Các giới hạn dưới của phần trăm, bootstrap hiệu chỉnh sai lệch và tăng tốc (BCa) và khoảng tin cậy (CIs) t 95% của Student của các hệ số đường dẫn trong điều kiện chỉ báo không phân phối chuẩn

HÌNH 9

Bootstrap ảnh hưởng đến khoảng tin cậy như thế nào?

Hình 9. Giới hạn trên của phân vị phần trăm, bootstrap hiệu chỉnh sai lệch và tăng tốc (BCa) và khoảng tin cậy (CIs) t 95% của Student của các hệ số đường dẫn trong điều kiện chỉ báo không phân phối chuẩn

Thảo luận

Nghiên cứu hiện tại đã triển khai thành công các phương pháp phần trăm, BCa và Student's t CI vào GSCA, khám phá thêm khả năng suy luận thống kê với GSCA và điều tra hiệu suất của các phương pháp bootstrap khác nhau về phạm vi bao phủ và cân bằng của các CI của họ. Một số phát hiện quan trọng xuất hiện từ công việc mô phỏng của chúng tôi. Đầu tiên, việc phân phối các chỉ số có ít tác động đến các CI bootstrap của một tải. Thứ hai, cả ba phương pháp đều tạo ra các CI rộng hơn bao gồm giá trị tải dân số thường xuyên hơn mong muốn. Lạm phát như vậy trong phạm vi bảo hiểm lớn hơn khi các TCTD được xây dựng với một mẫu lớn hơn. Thứ ba, TCTD của tải bị dịch chuyển lên trên gây mất cân bằng TCTD. Thứ tư, kích thước của các tải chỉ báo ít ảnh hưởng đến các TCTD bootstrap của một hệ số đường dẫn, nhưng việc phân phối các chỉ số có tác động đáng kể, mang lại hiệu suất khá khác nhau của các TCTD. Khi các chỉ số được phân phối bình thường, các TCTD phần trăm được tạo ra gần với phạm vi bao phủ lý thuyết hơn so với BCa và TCTD của Student, trong khi các TCTD của phương pháp BCa được cân bằng tốt hơn so với hai phương pháp còn lại. Khi các chỉ số không bình thường thay vì bình thường, các CI của mỗi phương pháp bao gồm giá trị dân số của các hệ số đường dẫn lớn thường xuyên hơn mong muốn (i. e. , phạm vi bao phủ tăng cao), trong khi các CI của hệ số đường dẫn nhỏ cho thấy mức độ bao phủ và cân bằng lý tưởng. Cuối cùng, phạm vi bao phủ của các TCTD phần trăm ít nhạy cảm hơn với giá trị dân số và cỡ mẫu so với TCTD BCa và TCTD t Student, trong khi phương pháp BCa ít bị mất cân bằng hơn so với hai phương pháp kia

Các kết quả nghiên cứu hiện tại có ý nghĩa quan trọng đối với các nhà nghiên cứu trong các lĩnh vực suy luận thống kê thực chất bằng cách sử dụng các CI bootstrap trong GSCA. Việc lựa chọn các phương pháp CI khác nhau cần được xem xét cẩn thận, đặc biệt khi cỡ mẫu nhỏ (e. g. , 50 hoặc 100). Kết quả kích thích của chúng tôi cho thấy hiệu quả vượt trội của phương pháp phân vị so với cả BCa và Student's t đối với phạm vi bao phủ mong muốn của các TCTD. Phương pháp BCa có xu hướng tạo ra các TCTD cân bằng tốt hơn một chút so với hai phương pháp còn lại, nhưng nhìn chung, nó bị suy yếu do các TCTD hẹp hơn so với mức độ bao phủ mong muốn. Đối với nghiên cứu thực nghiệm, hiệu quả tính toán của ba phương pháp cũng sẽ được xem xét. Phương pháp phân vị hiệu quả hơn về tốc độ tính toán so với phương pháp BCa vì phương pháp BCa có thêm các bước tính toán cho các tham số hiệu chỉnh gia tốc và sai lệch. Một thuật toán hiệu quả là mong muốn, đặc biệt là trong các tình huống mà các giải pháp phải được lặp đi lặp lại, như nghiên cứu mô phỏng hiện tại. Do đó, chúng tôi khuyên bạn nên áp dụng phương pháp phân vị làm quy trình chuẩn cho GSCA do phạm vi bao phủ CI tốt hơn ở mức danh nghĩa và hiệu quả tính toán của nó

Các nghiên cứu trong tương lai sẽ mở rộng phạm vi mô phỏng hiện tại sang các phương pháp ước tính GSCA khác và các mô hình GSCA nâng cao khác nhau để so sánh giữa các phương pháp CI khác nhau. Một hướng cho các nghiên cứu trong tương lai là so sánh các phương pháp CI khởi động khác nhau trong một phần mở rộng được chuẩn hóa của GSCA (rGSCA; ), kết hợp một loại chính quy hóa sườn vào GSCA trong một khung thống nhất, từ đó xử lý các vấn đề đa cộng tuyến tiềm ẩn hiệu quả hơn. Trong một nghiên cứu mô phỏng, rGSCA đã được phát hiện là cung cấp các ước tính tham số tốt bằng hoặc tốt hơn so với các tham số từ GSCA ban đầu trong các điều kiện khác nhau của dữ liệu được phân phối thông thường. Hơn nữa, chúng ta cũng có thể xem xét một nghiên cứu mô phỏng để so sánh các phương pháp CI trong GSCA với các thuật ngữ duy nhất để hỗ trợ lỗi đo lường (GSCAM; ), đã được đề xuất để mở rộng GSCA ban đầu để tính đến các lỗi trong các chỉ số một cách rõ ràng. Tiện ích mở rộng này dự tính cả các phần chung và riêng của các chỉ báo và ước tính tổng hợp các chỉ báo có trọng số đã loại bỏ các phần riêng biệt của chúng. Không giống như GSCA ban đầu, GSCAM có phương pháp hiệu chỉnh sai lệch, xử lý các lỗi đo lường trong các chỉ số. Do đó, cần xem xét mô phỏng Monte Carlo về hiệu suất tương đối của các phương pháp CI khác nhau với GSCAM cũng như rGSCA

Một hướng khác cho các nghiên cứu trong tương lai là so sánh các phương pháp CI khác nhau trong một loạt các điều kiện và mô hình để điều tra nghiêm ngặt hơn. Cụ thể, cần phải kiểm tra hiệu suất tương đối của từng phương pháp CI với các mô hình GSCA biến thể như GSCA theo cụm mờ để xử lý tính không đồng nhất của người trả lời ở cấp độ cụm, GSCA đa cấp, GSCA với các tương tác tiềm ẩn và GSCA động và chức năng cho dữ liệu theo chiều dọc và . Nghiên cứu hiện tại tập trung vào độ tin cậy 95% và cỡ mẫu ≤ 500 vì chúng thường gặp nhất trong thực tế. Nghiên cứu trong tương lai về việc sử dụng các mức độ tin cậy khác nhau và các mẫu lớn hơn (e. g. , 1.000–3.000) cũng được đảm bảo mang lại nhiều ý nghĩa thiết thực hơn cho nghiên cứu ứng dụng. Những cuộc điều tra nghiêm ngặt này trong khung mô hình nâng cao sẽ cung cấp cho các nhà nghiên cứu ứng dụng thông tin về phương pháp CI nào sẽ tốt hơn trong các điều kiện và mô hình thử nghiệm khác nhau. Điều này sẽ xác định lợi ích tương đối của từng phương pháp CI

Tuyên bố về tính khả dụng của dữ liệu

Mã MATLAB để tạo dữ liệu có sẵn trong

Sự đóng góp của tác giả

KJ, JL và VG đã đóng góp vào sự phát triển kỹ thuật, phân tích thực nghiệm và viết bản thảo. GC đã góp phần phát triển kỹ thuật và viết bản thảo

Xung đột lợi ích

Các tác giả tuyên bố rằng nghiên cứu được thực hiện trong trường hợp không có bất kỳ mối quan hệ thương mại hoặc tài chính nào có thể được hiểu là xung đột lợi ích tiềm tàng

Tài liệu bổ sung

Tài liệu bổ sung cho bài viết này có thể được tìm thấy trực tuyến tại.

chú thích

1. Không giống như , các thuật ngữ lỗi cấu trúc được coi là độc lập với nhau để đơn giản

2. Chúng tôi đã sử dụng thay thế cho nhau các thuật ngữ biến tiềm ẩn và tổng hợp/thành phần bởi vì, trong GSCA, biến tiềm ẩn được định nghĩa là tổng hợp có trọng số hoặc thành phần của các biến quan sát

Người giới thiệu

Aguirre-Urreta, M. Tôi. , và Rönkkö, M. (2018). Suy luận thống kê với PLSc sử dụng khoảng tin cậy bootstrap. MIS Q. 42, 1001–1020. doi. 10. 25300/MISQ/2018/13587

CrossRef Toàn văn. Google học giả

Chernick, M. r. (2011). Phương pháp Bootstrap. Hướng dẫn cho các học viên và nhà nghiên cứu, Tập. 619. Hoboken, New Jersey. John Wiley và các con

Google học giả

Cho, G. , Jung, K. , và Hwang, H. (2019). Lỗi dự đoán hết túi. một chỉ số xác thực chéo để phân tích thành phần có cấu trúc tổng quát. Hành vi đa biến. độ phân giải. 54, 505–513. doi. 10. 1080/00273171. 2018. 1540340

Tóm tắt PubMed. CrossRef Toàn văn. Google học giả

De Leeuw, J. , Trẻ , F. W. , và Takane, Y. (1976). Cấu trúc cộng trong dữ liệu định tính. một phương pháp bình phương nhỏ nhất xen kẽ với các tính năng chia tỷ lệ tối ưu. Tâm lý học 41, 471–503. doi. 10. 1007/BF02296971

CrossRef Toàn văn. Google học giả

Dijkstra, T. K. (2017). “Một sự kết hợp hoàn hảo giữa một mô hình và một chế độ,” trong Partial Least Squares Path Modeling. Các khái niệm cơ bản, các vấn đề về phương pháp luận và ứng dụng, eds H. Latan và R. Noonan (Chăm. Springer Verlag), 55–80. doi. 10. 1007/978-3-319-64069-3_4

CrossRef Toàn văn. Google học giả

Ép-rôn, B. (1982). “Jackknife, bootstrap, và các kế hoạch lấy mẫu lại khác,” trong Chuỗi hội nghị khu vực CBMS-NSF về Toán ứng dụng, Chuyên khảo 38 (Philadelphia, PA. SAM). doi. 10. 1137/1. 9781611970319

CrossRef Toàn văn. Google học giả

Ép-rôn, B. (1987). Khoảng tin cậy bootstrap tốt hơn. J. Là. thống kê. PGS. 82, 171–185. doi. 10. 1080/01621459. 1987. 10478410

CrossRef Toàn văn. Google học giả

Ép-rôn, B. , và Tibshirani, R. J. (1993). Giới thiệu về Bootstrap. New York, NY. Chapman và hội trường. doi. 10. 1007/978-1-4899-4541-9

CrossRef Toàn văn. Google học giả

Tóc, J. F. Jr. , Hult, G. t. m. , Ringle , C. , và Sarstedt, M. (2016). Sơ lược về Mô hình phương trình cấu trúc bình phương nhỏ nhất một phần (PLS-SEM). Nghìn Oaks, CA. ấn phẩm hiền triết. doi. 10. 15358/9783800653614

CrossRef Toàn văn. Google học giả

Hoàng, H. (2009). Phân tích thành phần có cấu trúc tổng quát hóa chính quy. Tâm lý học 74, 517–530. doi. 10. 1007/s11336-009-9119-y

CrossRef Toàn văn. Google học giả

Hoàng, H. , Hồ , M. h. r. , và Lee, J. (2010). Phân tích thành phần có cấu trúc tổng quát với các tương tác tiềm ẩn. Tâm lý học 75, 228–242. doi. 10. 1007/s11336-010-9157-5

CrossRef Toàn văn. Google học giả

Hoàng, H. , Jung, K. và Kim, S. (2019). WEB GESCA (Phiên bản 1. 5). Có sẵn trực tuyến tại. http. //sem-gesca. com/webgesca/ (truy cập ngày 30 tháng 9 năm 2019)

Hoàng, H. , Kim , S. , Lee, S. , và Park, T. (2016). gesca. Phân tích thành phần có cấu trúc tổng quát (GSCA). Gói R phiên bản 1. 0. 3. Có sẵn trực tuyến tại. https. // CRAN. dự án R. tổ chức/gói=gesca

Hoàng, H. , và Takane, Y. (2004), Phân tích thành phần cấu trúc tổng quát. Tâm lý học 69, 81–99. doi. 10. 1007/BF02295841

CrossRef Toàn văn. Google học giả

Hoàng, H. , và Takane, Y. (2014). Phân tích thành phần có cấu trúc tổng quát. Phương pháp tiếp cận dựa trên thành phần đối với mô hình phương trình kết cấu. Boca Raton, Florida. Chapman và Hall/CRC Press

Google học giả

Hoàng, H. , Takane, Y. và DeSarbo, S. W. (2007a). Các mô hình đường cong tăng trưởng theo cụm mờ thông qua các phương trình ước lượng tổng quát. một ứng dụng cho hành vi chống đối xã hội của trẻ em. đa năng. cư xử. độ phân giải. 42, 233–259. doi. 10. 1080/00273170701360332

Tóm tắt PubMed. CrossRef Toàn văn. Google học giả

Hoàng, H. , Takane, Y. , và Jung, K. (2017). Phân tích thành phần có cấu trúc tổng quát với các thuật ngữ duy nhất để hỗ trợ lỗi đo lường. Đổi diện. tâm thần. số 8. 2137. doi. 10. 3389/khung hình/giây. 2017. 02137

Tóm tắt PubMed. CrossRef Toàn văn. Google học giả

Hoàng, H. , Takane, Y. , và Malhotra, N. (2007b). Phân tích thành phần có cấu trúc tổng quát đa cấp. Đo lường hành vi 34, 95–109. doi. 10. 2333/bhmk. 34. 95

CrossRef Toàn văn. Google học giả

Jung, K. , Takane, Y. , Hwang, H. và Woodward, T. S. (2012). GSCA động (Phân tích thành phần có cấu trúc tổng quát) với các ứng dụng để phân tích kết nối hiệu quả trong dữ liệu thần kinh chức năng. Tâm lý học 77, 827–848. doi. 10. 1007/s11336-012-9284-2

CrossRef Toàn văn. Google học giả

Jung, K. , Takane, Y. , Hwang, H. và Woodward, T. S. (2016). Phân tích thành phần có cấu trúc tổng quát động đa cấp để phân tích kết nối não trong dữ liệu hình ảnh thần kinh chức năng. Tâm lý học 81, 565–581. doi. 10. 1007/s11336-015-9440-6

CrossRef Toàn văn. Google học giả

Kim, S. , Cardwell, R. , và Hwang, H. (2017). Sử dụng R Package gesca để phân tích thành phần có cấu trúc tổng quát. Đo lường hành vi 44, 3–23. doi. 10. 1007/s41237-016-0002-8

CrossRef Toàn văn. Google học giả

Nhóm R Core (2017). r. Ngôn ngữ và môi trường cho tính toán thống kê. Quỹ R cho tính toán thống kê, Vienna. Có sẵn trực tuyến tại. https. //www. dự án R. tổ chức/

Rigdon, E. e. (2012). Suy nghĩ lại về mô hình đường dẫn bình phương tối thiểu một phần. ca ngợi những phương pháp đơn giản. Kế hoạch tầm xa. 45, 341–358. doi. 10. 1016/j. lrp. 2012. 09. 010

CrossRef Toàn văn. Google học giả

chuông, C. m. , Sarstedt, M. và Schlittgen, R. (2014). Phân đoạn thuật toán di truyền trong mô hình phương trình cấu trúc bình phương nhỏ nhất một phần. HOẶC Quang phổ 36, 251–276. doi. 10. 1007/s00291-013-0320-0

CrossRef Toàn văn. Google học giả

Suk, H. W. , và Hwang, H. (2016). Phân tích thành phần cấu trúc tổng quát chức năng. Tâm lý học 81, 940–968. doi. 10. 1007/s11336-016-9521-1

Tóm tắt PubMed. CrossRef Toàn văn. Google học giả

Tenenhaus, M. (2008). Mô hình phương trình cấu trúc dựa trên thành phần. Tổng chất lượng. Quản lý. Xe buýt. xuất sắc. 19, 871–886. doi. 10. 1080/14783360802159543

CrossRef Toàn văn. Google học giả

Wold, H. (1982). “Mô hình mềm. thiết kế cơ bản và một số phần mở rộng,” trong Phần 2 Hệ thống dưới sự quan sát gián tiếp. Quan hệ nhân quả, Cấu trúc, Dự đoán, eds K. g. Joreskog và H. Wold (Amsterdam. Bắc Hà Lan), 1–54

Khoảng tin cậy bootstrap cho chúng ta biết điều gì?

Mức chênh lệch trong các ước tính bootstrap này cho chúng ta biết (xấp xỉ) mức độ ảnh hưởng của lỗi ngẫu nhiên trong mẫu ban đầu đối với sự thay đổi trong ước tínhˆθ. The approximation improves as n increases. Suppose we want to set a 95% confidence interval on θ, the true parameter value for the real population f.

Các bản phân phối bootstrap có được sử dụng cho khoảng tin cậy không?

Bootstrap là phương pháp ước tính sai số chuẩn và tính khoảng tin cậy . Bootstrapping bắt đầu vào năm 1970 bởi Bradley Efron; .

Bootstrap có giống như khoảng tin cậy không?

Bootstrap cũng là một cách thích hợp để kiểm soát và kiểm tra tính ổn định của kết quả. Mặc dù đối với hầu hết các vấn đề, không thể biết khoảng tin cậy thực sự, bootstrap chính xác hơn về mặt tiệm cận so với các khoảng chuẩn thu được bằng cách sử dụng phương sai mẫu và các giả định về tính quy tắc .