Bootstrapping tham số là gì?

Xem thêm. Giới thiệu về Bootstrap, Phân tích và sử dụng dữ liệu, Bootstrap phi tham số, VoseNBoot

Nội dung chính Show

1. Ước tính phân phối từ dữ liệu
2. Mô phỏng việc thu thập dữ liệu
3. Tính thống kê mẫu
Sự khác biệt giữa bootstrap tham số và không tham số là gì?
Tham số bootstrap là gì?
Tại sao sử dụng bootstrap không tham số?
Các loại bootstrapping là gì?

Bootstrap không tham số không đưa ra giả định nào về dạng phân phối của tổng thể hoặc phân phối xác suất (cha mẹ). Tuy nhiên, sẽ có nhiều lúc chúng ta sẽ biết phân phối mẹ thuộc họ phân phối nào. Ví dụ, số trận động đất mỗi năm và số nang Giardia trong lít nước lấy từ hồ về mặt logic sẽ xấp xỉ phân phối Poisson;

Bootstrap tham số cung cấp cho chúng tôi phương tiện để sử dụng thông tin bổ sung mà chúng tôi có về phân bố dân số. Quy trình này giống như phương pháp Bootstrap không tham số ngoại trừ giai đoạn ước tính phân phối

1. Ước tính phân phối từ dữ liệu

Đối với Bootstrap tham số, chúng tôi chọn loại phân phối mà chúng tôi tin rằng dữ liệu đến từ đó và sau đó tìm các tham số MLE cho phân phối đó. Điều này có nghĩa là, chúng tôi tìm thấy các giá trị tham số cho phân phối mang lại xác suất cao nhất để quan sát các giá trị dữ liệu mà chúng tôi có

Sử dụng VoseDistributionFitP để trả về các tham số MLE của tập dữ liệu hoặc trực tiếp xây dựng đối tượng phân phối bằng các tham số MLE bằng cách sử dụng VoseDistributionFitObject

2. Mô phỏng việc thu thập dữ liệu

Giống như với Bootstrap không tham số, giờ đây chúng tôi thay thế từng quan sát bằng một mẫu được lấy ngẫu nhiên từ phân phối dân số phù hợp. Sử dụng VoseSimulate để mô phỏng các giá trị ngẫu nhiên từ phân phối được tạo ở bước 1

3. Tính thống kê mẫu

Bây giờ chúng tôi chạy một số lượng lớn các lần lặp lại, mỗi lần tạo ra một bản sao Bootstrap mới và đối với mỗi bản sao Bootstrap, chúng tôi tính toán ước tính mẫu của thống kê được đề cập.

Tóm lại, Bootstrap tham số tiến hành như sau

Thu thập tập dữ liệu của n mẫu {x1,. xn}
Xác định (các) tham số của phân phối phù hợp nhất với dữ liệu từ họ phân phối đã biết bằng cách sử dụng các công cụ ước tính khả năng tối đa (MLE)
Tạo B mẫu Bootstrap {x1*,. xn*} bằng cách lấy mẫu ngẫu nhiên từ phân phối phù hợp này
Đối với mỗi mẫu Bootstrap {x1*,. xn*} tính toán thống kê cần thiết
. Phân phối của các ước tính B này của q biểu thị ước tính Bootstrap về độ không đảm bảo về giá trị thực của q.

Thí dụ

Giả sử chúng ta muốn mô hình hóa sự không chắc chắn về trung bình dân số bằng cách sử dụng bootstrapping tham số. Giả sử chúng ta có lý do để tin rằng dữ liệu (được lưu trữ trong một mảng có kích thước n có tên là Dữ liệu) đến từ một bản phân phối LogNormal

Xây dựng phân phối phù hợp bằng cách viết =VoseLogNormalFitObject(Data) trong ô bảng tính. Đặt tên cho ô này là FittedDistribution
Viết =VoseSimulate(FittedDistribution) vào n ô, tạo một mẫu ngẫu nhiên từ phân phối LogNormal phù hợp trên mỗi lần tính toán lại
Tính thống kê mong muốn của mẫu này (E. g. sử dụng hàm AVERAGE từ Excel). Điều này cho chúng ta phân phối không chắc chắn của thống kê dân số

Về nguyên tắc, có ba cách khác nhau để thu thập và đánh giá ước tính bootstrap. phi tham số, tham số và bán tham số. Trong thực tế, bởi vì các khoảng không theo tham số tạo ra các giả định tham số, sự phân chia này khá tùy ý. Mặc dù các thuật ngữ này có thể cung cấp một số thông tin chi tiết, nhưng chúng không phải là cách phân loại hữu ích lắm. Tuy nhiên, vì các khoảng 'không tham số' rất phổ biến nên chúng ta hãy xem xét chúng trước
1. Khoảng tin cậy bootstrap không tham số
- Giới hạn tin cậy đuôi bằng nhau
  Khoảng tin cậy phần trăm đơn giản của Efron, mặc dù đơn giản về mặt số học và tương đối đơn giản để giải thích, nhưng lại gây tranh cãi một cách đáng ngạc nhiên. Để hiểu các điểm mạnh, hạn chế và phần mở rộng của bootstrap phi tham số chung hoặc vườn, trước tiên chúng ta nên tóm tắt lý luận cơ bản
  1. Để đơn giản, giả sử bạn có một tập hợp (n) quan sát mà từ đó bạn đã tính toán một số thống kê (
    ), mà bạn không có công thức để ước tính sai số chuẩn, nhưng .
  2. Bạn không thể giả định một cách hợp lý rằng mẫu của bạn (hoặc thống kê mẫu của bạn) đại diện cho một phân bố tần số đã biết, nhưng có thể cho rằng nó phản ánh đầy đủ dân số rộng hơn mà nó được rút ra
  3. Sử dụng mẫu của bạn làm mô hình dân số của nó, bạn lấy B mẫu của n quan sát (có thay thế), từ đó bạn tính toán ước tính bootstrap B (trình cắm thêm) cho thống kê mẫu của bạn. - Điều này đôi khi được gọi là một bootstrap cơ bản
  4. Giả sử các thống kê bootstrap này thay đổi theo cách tương tự với thống kê mẫu của bạn, khi thu được tương tự, thì 95% thống kê bootstrap điển hình nhất đó sẽ có giới hạn tin cậy 95% kèm theo tham số dân số, Θ - trong đó thống kê mẫu của bạn là tốt nhất . - Ngược lại, 95% ước tính bootstrap của bạn sẽ nằm trong giới hạn độ tin cậy 95% về thống kê mẫu của bạn
  Là một xấp xỉ đầu tiên thô và sẵn sàng, ước tính khoảng này có vẻ đủ chấp nhận được, thật không may, nó che giấu một số giả định quan trọng - không phải tất cả đều hợp lý
  1. Giới hạn tin cậy 2 phía thông thường giả sử thống kê của bạn được phân phối đều đặn và đối xứng
  2. Họ cũng cho rằng số liệu thống kê là không thiên vị và đồng nhất
  3. Bởi vì tính quy tắc là một chất lượng tiệm cận, các khoảng được tính từ các mẫu hữu hạn quá hẹp - và luôn bị che giấu
  Vì những giả định này đặt ra một số vấn đề, chúng ta hãy xem xét chúng chi tiết hơn.
  1. Hàm chuẩn hóa chưa biết
{Quả sung. 1}
- Khoảng 2 bên thay thế
Hall đã đề xuất hai lựa chọn thay thế
1. khoảng thời gian ngắn nhất
2. khoảng đối xứng
{Quả sung. 2}
1. Khởi động tham số
2. Khoảng thời gian bootstrap được làm mịn
{Quả sung. 3}
1. Khoảng thời gian thử nghiệm-đảo ngược

programming bootstrap

Bootstrapping tham số là gì?

1. Ước tính phân phối từ dữ liệu

2. Mô phỏng việc thu thập dữ liệu

3. Tính thống kê mẫu

Thí dụ

Sự khác biệt giữa bootstrap tham số và không tham số là gì?

Tham số bootstrap là gì?

Tại sao sử dụng bootstrap không tham số?

Các loại bootstrapping là gì?

Bài Viết Liên Quan

Quảng Cáo

Có thể bạn quan tâm

Toplist được quan tâm

Quảng cáo

Xem Nhiều

Quảng cáo

Chúng tôi

Điều khoản

Trợ giúp

Mạng xã hội