Hướng dẫn what is 95 confidence interval in python? - khoảng tin cậy 95 trong python là gì?
A & nbsp; Khoảng tin cậy cho giá trị trung bình & nbsp; là một loạt các giá trị có khả năng chứa một dân số có nghĩa là với một mức độ tin cậy nhất định.confidence interval for a mean is a range of values that is likely to contain a population mean with a certain level of confidence. Show Nó được tính là: Khoảng tin cậy = & nbsp; x & nbsp; +/-& nbsp; t*(s/√n)x +/- t*(s/√n) where:
Hướng dẫn này giải thích cách tính toán khoảng tin cậy trong Python. Khoảng tin cậy sử dụng phân phối TNếu chúng tôi làm việc với một mẫu nhỏ (n Ví dụ sau đây cho thấy cách tính khoảng tin cậy cho chiều cao trung bình dân số thực (tính bằng inch) của một loài thực vật nhất định, sử dụng mẫu 15 cây: import numpy as np import scipy.stats as st #define sample data data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29] #create 95% confidence interval for population mean weight st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (16.758, 24.042) Khoảng tin cậy 95% cho chiều cao trung bình dân số thực sự là & nbsp; (16.758, 24.042).(16.758, 24.042). Bạn sẽ nhận thấy rằng mức độ tin cậy càng lớn, khoảng tin cậy càng rộng. Ví dụ, ở đây, cách tính toán 99% C.I. Đối với cùng một dữ liệu: #create 99% confidence interval for same sample st.t.interval(alpha=0.99, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (15.348, 25.455) Khoảng tin cậy 99% cho chiều cao trung bình dân số thực sự là & nbsp; (15.348, 25.455). Lưu ý rằng khoảng thời gian này rộng hơn khoảng tin cậy 95% trước đó.(15.348, 25.455). Notice that this interval is wider than the previous 95% confidence interval. Khoảng tin cậy sử dụng phân phối bình thườngNếu chúng tôi làm việc với các mẫu lớn hơn (N≥30), chúng tôi có thể giả sử rằng phân phối lấy mẫu của giá trị trung bình mẫu thường được phân phối (nhờ định lý giới hạn trung tâm) và thay vào đó có thể sử dụng hàm định mức.Interval () từ scipy .Stats Thư viện. Ví dụ sau đây cho thấy cách tính khoảng tin cậy cho chiều cao trung bình dân số thực (tính bằng inch) của một loài thực vật nhất định, sử dụng mẫu 50 cây: import numpy as np import scipy.stats as st #define sample data np.random.seed(0) data = np.random.randint(10, 30, 50) #create 95% confidence interval for population mean weight st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data)) (17.40, 21.08) Khoảng tin cậy 95% cho chiều cao trung bình dân số thực sự là & nbsp; (17,40, 21,08).(17.40, 21.08). Và tương tự như phân phối T, mức độ tin cậy lớn hơn dẫn đến khoảng tin cậy rộng hơn. Ví dụ, ở đây, cách tính toán 99% C.I. Đối với cùng một dữ liệu: #create 99% confidence interval for same sample st.norm.interval(alpha=0.99, loc=np.mean(data), scale=st.sem(data)) (16.82, 21.66) Khoảng tin cậy 95% cho chiều cao trung bình dân số thực sự là & nbsp; (17,82, 21,66).(17.82, 21.66). Cách diễn giải khoảng tin cậyGiả sử khoảng tin cậy 95% của chúng ta đối với chiều cao trung bình dân số thực sự của một loài thực vật là: Khoảng tin cậy 95% = (16.758, 24.042) Cách để giải thích khoảng tin cậy này như sau:
Một cách khác để nói điều tương tự là chỉ có 5% cơ hội rằng dân số thực sự có nghĩa là nằm ngoài khoảng tin cậy 95%. Đó là, chỉ có 5% cơ hội rằng chiều cao trung bình của dân số thực sự của cây dưới 16,758 inch hoặc lớn hơn 24.042 inch. Dựa trên bản gốc nhưng với một số ví dụ cụ thể:
output:
Tôi nghĩ rằng num_samples của num_datasets là đúng nhưng nếu nó không cho tôi biết trong phần bình luận. Đối với loại dữ liệu nào nó hoạt động cho?Tôi nghĩ rằng nó có thể được sử dụng cho bất kỳ dữ liệu nào vì những điều sau đây:
Vì vậy, nó có thể được sử dụng để hồi quy và phân loại tôi tin. Như một phần thưởng, một triển khai ngọn đuốc gần như chỉ sử dụng ngọn đuốc:
Một số nhận xét về CI (hoặc xem https://stats.stackexchange.com/questions/554332/confidence-pterval-given-the-population-mean-and-standard-deviation?noredirect=1&lq=1):
Khoảng tin cậy 95% có nghĩa là gì?Nói đúng, khoảng tin cậy 95% có nghĩa là nếu chúng ta lấy 100 mẫu khác nhau và tính khoảng tin cậy 95% cho mỗi mẫu, thì khoảng 95 trong số 100 khoảng tin cậy sẽ chứa giá trị trung bình thực (μ).if we were to take 100 different samples and compute a 95% confidence interval for each sample, then approximately 95 of the 100 confidence intervals will contain the true mean value (μ).
Mức độ tự tin trong Python là gì?Cách tiếp cận này được sử dụng để tính toán khoảng tin cậy cho bộ dữ liệu nhỏ trong đó n trong đó n trong đócall the t. interval() function from the scipy. stats library to get the confidence interval for a population means of the given dataset in python. |