Bootstrap giá trị P Python

Câu trả lời cho câu hỏi này không yêu cầu biết bất cứ điều gì về phương thức bootstrap. Một công thức tương đương [đối với giá trị p một phía] là "Làm cách nào để đếm số lượng giá trị trong một vectơ lớn hơn một giá trị đã cho?"

Bạn có thể tìm thấy một ví dụ hoạt động đầy đủ về tính toán bootstrap cho thử nghiệm t được ghép nối trên các trang 11–14 của bài viết về Diễn đàn toàn cầu SAS của tôi, "Khám phá lại phần mềm SAS/IML. Phân tích dữ liệu hiện đại cho nhà thống kê thực hành. " Giá trị p thực nghiệm được tính ở trang 14

Đây là một cách suy nghĩ về vấn đề này. Giả sử một vectơ, s, chứa các giá trị ngẫu nhiên từ phân phối null. Trong tình huống bootstrap, điều này có nghĩa là s1, s2,. , sN là thống kê bootstrap, trong đó si là thống kê được tính toán trên mẫu bootstrap thứ i và trong đó mỗi mẫu bootstrap được lấy mẫu từ phân phối null [nghĩa là theo giả thuyết null]. Gọi s0 là giá trị của thống kê kiểm định. Sau đó, giá trị p theo kinh nghiệm một phía cho s0 được tính như sau

  • Tính toán đơn giản nhất là áp dụng định nghĩa của giá trị p. Để thực hiện việc này, hãy đếm số lượng giá trị [số liệu thống kê] lớn hơn hoặc bằng giá trị được quan sát và chia cho số lượng giá trị. Trong mã, pval = sum[s >= s0]/N;
  • Công thức trước đó có độ lệch do lấy mẫu hữu hạn. Một số tác giả đề nghị sửa đổi pval = [1+sum[s >= s0]]/[N+1]; . 141. Rõ ràng, hai công thức về cơ bản giống nhau khi số lượng giá trị, N, lớn

Xem thêm bài viết của tôi về tính toán các ước tính theo kinh nghiệm từ dữ liệu

Ngẫu nhiên, nếu bạn muốn tự chạy tính toán bootstrap, bạn có thể tải xuống dữ liệu hãng hàng không mà tôi đã sử dụng trong bài báo về Diễn đàn toàn cầu SAS của mình

Dhruv B

Theo dõi

7 Tháng một, 2019

·

5 phút đọc

Thống kê thực tế với Python. Thử nghiệm giả thuyết

Kiểm tra giả thuyết thường có thể gây nhầm lẫn. Có lẽ bài đăng này xóa nó lên

Cũng thấy. Phân phối, Định lý và Khoảng tin cậy

Kiểm tra giả thuyết là gì?

Ý tưởng với các bài kiểm tra giả thuyết rất đơn giản

  • Bạn có câu hỏi về tập dữ liệu của mình
  • Bạn tạo ra các giả thuyết từ các câu hỏi của bạn
  • Bạn kiểm tra các giả thuyết của mình và bác bỏ hoặc không bác bỏ chúng

Có hai loại giả thuyết

  1. Không [H0]. 'kiểm soát'. Giả thuyết được giả định là đúng trước khi chúng tôi thu thập dữ liệu. Thường có một số loại dấu bằng [≥, ≤, =]
  2. Thay thế [H1]. Cuộc thí nghiệm'. Những gì chúng tôi muốn chứng minh là đúng, có thể được chứng minh bằng dữ liệu thu thập được. Thường có dấu ngược lại với giả thuyết không

Ví dụ, hãy xem xét câu lệnh sau. “Chiều cao trung bình của một con khỉ đột nhỏ hơn hoặc bằng 6 feet”

  • H0. Chiều cao trung bình của khỉ đột là ≤ 6 feet
  • ________số 8. Chiều cao trung bình của khỉ đột là > 6 feet

xem xét khác. “Bánh mì kẹp thịt này là ngon nhất thế giới”

  • H0. Bánh mì kẹp thịt này là. = tốt nhất trên thế giới
  • ________số 8. Bánh mì kẹp thịt này = ngon nhất thế giới

Lưu ý rằng thay thế là dấu hiệu ngược lại với null và null luôn có dấu '=' ở đâu đó trong đó. Một cách khác để suy nghĩ về nó

  • ________số 8. Nêu giả thuyết bạn muốn chứng minh là đúng
  • H0. Nêu rõ điều gì sẽ xảy ra nếu người thay thế/bạn sai

Lỗi trong kết luận

Luôn có khả năng mắc lỗi trong thử nghiệm của chúng tôi và thật tốt khi biết loại lỗi nào chúng tôi có thể mắc phải

  • Loại I [Dương tính giả]. Điều này xảy ra khi chúng ta quyết định rằng H1 là đúng, trong khi thực tế thì H0 là đúng. Lỗi nghiêm trọng hơn
  • Loại II [Âm tính giả]. Điều này xảy ra khi chúng ta quyết định rằng H0 là đúng, trong khi thực tế thì H1 là đúng

Ví dụ, hãy nghĩ về một thẩm phán trong phòng xử án, quyết định bản án đối với người A

H0. Một. = có tội

H1. A = có tội

Nếu chúng tôi quyết định H1 là đúng và A không thực sự có tội, thì chúng tôi đang phạm lỗi Loại I. Nếu chúng tôi quyết định H0 là đúng và anh ấy thực sự có tội, thì chúng tôi đang phạm lỗi Loại II. Tất nhiên hầu hết sẽ đồng ý rằng lỗi Loại I cần được giảm thiểu — đây là những lỗi có hại nhất mà chúng tôi gặp phải

Kiểm tra giả thuyết

Có hai cách chúng ta có thể kiểm tra các giả thuyết

  1. Mô phỏng - với bootstrapping và khoảng tin cậy - một thống kê và kiểm tra xem các giả thuyết của chúng tôi đang được đề cập có nhất quán với những gì chúng tôi quan sát được trong phân phối lấy mẫu hay không
  2. Mô phỏng giả thuyết không và kiểm tra xem dữ liệu có phù hợp với giả thuyết không. Cái này được dùng phổ biến hơn

Chúng ta sẽ thấy một ví dụ về điều này sau

Giá trị P

Đây là một cái gì đó đã cho tôi rắc rối. Một định nghĩa tiêu chuẩn cho giá trị p có thể như thế này

Trong kiểm định giả thuyết thống kê, giá trị p hoặc giá trị xác suất hoặc ý nghĩa tiệm cận là xác suất đối với một mô hình thống kê nhất định mà khi giả thuyết không là đúng, tóm tắt thống kê [chẳng hạn như chênh lệch trung bình mẫu giữa hai mô hình được so sánh
— [wiki]

Đây là một định nghĩa dễ dàng hơn

Nếu giả thuyết khống là đúng, giá trị P là xác suất thu được dữ liệu mẫu của bạn.
— Tại sao những hiểu lầm về giá trị P lại phổ biến như vậy?

Vì vậy, nếu giá trị P là xác suất thu được dữ liệu mẫu của bạn nếu H0 là đúng, thì có nghĩa là qua một thời điểm nhất định, chúng ta phải thừa nhận rằng giả thuyết khống của mình là sai

Điểm này được gọi là mức ý nghĩa, ký hiệu là α. Mức ý nghĩa có thể được coi là mức độ bạn sẵn sàng phạm lỗi. Ví dụ, α = 0. 05 có nghĩa là bạn sẵn sàng có tỷ lệ lỗi 5%. 5% là tỷ lệ lỗi rất thường được sử dụng

Nếu Giá trị P từng xuống dưới ngưỡng này, chúng tôi từ chối giả thuyết khống của mình

#reject the null hypothesis
p α

Mức ý nghĩa được đặt trước khi thống kê được tính toán, do đó bạn không thể thay đổi nó một cách thuận tiện sau khi xem kết quả

Hãy tập hợp tất cả những thứ này lại với nhau

Kiểm tra giả thuyết với Python

Chúng tôi sẽ nghiên cứu tập dữ liệu về những người uống cà phê, với các giả thuyết sau

  • H0. Chiều cao trung bình của người uống cà phê = Chiều cao trung bình của người không uống cà phê
  • H1. Chiều cao trung bình của người uống cà phê. = Chiều cao trung bình của người không uống cà phê

Chúng tôi sẽ thực hiện các bước này

  1. Mô phỏng các giá trị cho chiều cao bằng cách sử dụng bootstrapping
  2. Tính toán giá trị thực tế cho độ cao bằng cách sử dụng toàn bộ tập dữ liệu bằng cách “lấy mẫu từ giá trị rỗng”
  3. So sánh [1] & [2] bằng cách tính giá trị p
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
full_data = pd.read_csv['coffee_dataset.csv']
sample_data = full_data.sample[200]
# 1. Lets bootstrap using a subset of the data and note down means for coffee and non-coffee drinkers, as well as the differences in both.means = []
no_coffee_means = []
coffee_means = []
for _ in range [10000]:
bootstrap = sample_data.sample[200, replace=True]
coffeemean = bootstrap[bootstrap.drinks_coffee == True].height.mean[]
nocoffeemean = bootstrap[bootstrap.drinks_coffee == False] .height.mean[]
no_coffee_means.append[nocoffeemean]
coffee_means.append[coffeemean]
means.append[coffeemean - nocoffeemean]
#Lets plot this
plt.hist[coffee_means, alpha=0.5];
plt.hist[no_coffee_means, alpha=0.5];

Phương tiện phân phối thông thường

Điều này cho thấy cả hai bản phân phối đều bình thường. Nếu chúng ta vẽ sự khác biệt trong các phương tiện

Sự khác biệt phân phối bình thường trong phương tiện

Điều này cũng được phân phối bình thường. Nếu chúng ta muốn kiểm tra giả thuyết không thì sao?

# 2. Lets' pick samples from the null.
null_val = np.random.normal[0, np.std[means], 10000]
plt.hist[null_val];

Lưu ý rằng biểu đồ này được căn giữa ở khoảng 0 để dễ đọc. Chúng ta cũng có thể căn giữa nó xung quanh giá trị trung bình cho mảng phương tiện trong ví dụ của chúng ta. Bằng cách đó, chúng ta có thể thấy cách phân phối nhìn vào giá trị trung bình thay vì 0.
# 3. Lets compare! Since our alternate hypothesis was: 
H1: Average height for coffee drinkers != Average height for non-coffee drinkers
#well test to see what proportion of the samples from #[2] are not equal to our sample mean.[null_val != sample_mean].mean[]
> 1.0

kết quả của 1 là gì. 0 nghĩa là gì? . Giá trị p càng cao, càng có nhiều khả năng chúng ta không bác bỏ giả thuyết không. Trong ví dụ này, chúng ta có 1. 0, có nghĩa là H0 của chúng tôi là chính xác. chiều cao trung bình là như nhau

Để chứng minh điều này, ta cũng có thể kiểm tra ngược lại. Hãy trao đổi các giả thuyết của chúng tôi

  • H0. Chiều cao trung bình của người uống cà phê. = Chiều cao trung bình của người không uống cà phê
  • H1. Chiều cao trung bình của người uống cà phê = Chiều cao trung bình của người không uống cà phê

Hãy kiểm tra tỷ lệ với tập hợp các giả thuyết mới này

[null_val == sample_mean].mean[]
> 0.0

Lần này chúng tôi nhận được 0, điều đó có nghĩa là H0 của chúng tôi có thể bị từ chối và phù hợp với những phát hiện trước đó của chúng tôi [vì chúng tôi chỉ hoán đổi các giả thuyết, kết quả cũng sẽ được hoán đổi]

p là gì

Giá trị p thu được bằng cách khởi động tham số là 0. 0142 [tôi. e. , 142 trên 10.000 ước tính z. Hệ số WST có giá trị tuyệt đối lớn hơn 1. 15], giá trị thu được bằng cách khởi động bán tham số là 0. 0124, trong khi giá trị p dựa trên phân phối t là 0. 012.

thế nào là p

Một cách để lấy giá trị p là bằng cách sử dụng kiểm tra T . Đây là phép thử hai mặt cho giả thuyết không rằng giá trị kỳ vọng [trung bình] của một mẫu quan sát độc lập 'a' bằng với trung bình dân số đã cho, trung bình cộng. Chúng ta hãy xem xét ví dụ sau. Chương trình trên sẽ tạo ra đầu ra sau.

Giá trị bootstrap được tính như thế nào?

Các giá trị bootstrap trong cây phát sinh gen cho biết rằng trong số 100, có bao nhiêu lần cùng một nhánh được quan sát thấy khi lặp lại quá trình tạo cây phát sinh gen trên một tập hợp dữ liệu được lấy mẫu lại. If we get this observation 100 times out of 100, then this supports our result.

p là gì

Trong thử nghiệm giả thuyết thống kê, giá trị p hoặc giá trị xác suất, đối với một mô hình thống kê nhất định, xác suất mà khi giả thuyết không là đúng, tóm tắt thống kê [chẳng hạn như giá trị tuyệt đối của chênh lệch trung bình mẫu giữa hai nhóm được so sánh]

Chủ Đề