Tại sao chia cho n-1 thay vì N trong bước thứ ba ở trên? . Bạn không biết ý nghĩa thực sự của dân số; . Ngoại trừ một số trường hợp hiếm hoi khi trung bình mẫu bằng với trung bình tổng thể, dữ liệu sẽ gần với trung bình mẫu hơn là trung bình tổng thể thực. Vì vậy, giá trị bạn tính toán ở bước 2 có thể sẽ nhỏ hơn một chút [và không thể lớn hơn] so với giá trị nếu bạn sử dụng trung bình dân số thực ở bước 1. Để bù đắp cho điều này, chúng tôi chia cho n-1 thay vì n
Nhưng tại sao n-1? . Các nhà thống kê nói rằng có n-1 bậc tự do
Tìm hiểu thêm về n so với. n-1
Nhưng tôi đã thấy các phương trình có n, không phải n-1, ở mẫu số
Phương trình n-1 được sử dụng trong tình huống phổ biến khi bạn đang phân tích một mẫu dữ liệu và muốn đưa ra kết luận tổng quát hơn. SD được tính theo cách này [với N-1 ở mẫu số] là dự đoán tốt nhất của bạn về giá trị của SD trong tổng thể
Nếu bạn chỉ muốn định lượng biến thể trong một tập hợp dữ liệu cụ thể và không có ý định ngoại suy để đưa ra kết luận rộng hơn, hãy tính SD bằng cách sử dụng N ở mẫu số. SD kết quả là SD của các giá trị cụ thể đó, nhưng rất có thể sẽ đánh giá thấp SD của dân số mà các điểm đó được rút ra
Mục tiêu của khoa học luôn là khái quát hóa, vì vậy không nên sử dụng phương trình có n ở mẫu số khi phân tích dữ liệu khoa học. Ví dụ duy nhất tôi có thể nghĩ về việc sử dụng n [không phải n-1] trong mẫu số có thể hợp lý là định lượng sự khác biệt giữa các điểm thi. Nhưng sẽ tốt hơn nhiều nếu hiển thị biểu đồ phân tán của mọi điểm số hoặc biểu đồ phân phối tần số
Lăng kính luôn tính toán SD bằng n-1
Bạn cần bao nhiêu giá trị để tính một SD?
SD định lượng phân tán, vì vậy rõ ràng bạn cần nhiều hơn một giá trị. Là hai giá trị đủ? . Nhưng điều đó là sai. Phương trình tính toán SD chỉ hoạt động tốt khi bạn chỉ có dữ liệu trùng lặp [n=2]
Kết quả có hợp lệ không? . Tôi đã mô phỏng mười nghìn bộ dữ liệu với n=2 và mỗi điểm dữ liệu được chọn ngẫu nhiên từ phân phối Gaussian. Vì tất cả các bài kiểm tra thống kê thực sự dựa trên phương sai [bình phương của SD], tôi đã so sánh phương sai được tính từ các giá trị trùng lặp với phương sai thực. Trung bình của 10.000 phương sai của dữ liệu mô phỏng nằm trong phạm vi 1% của phương sai thực mà dữ liệu được mô phỏng. Điều này có nghĩa là SD được tính toán từ dữ liệu trùng lặp là đánh giá hợp lệ về độ phân tán trong dữ liệu của bạn. Nó có khả năng quá cao hoặc quá thấp như nhau, nhưng có khả năng cách khá xa so với SD thực
Tính SD bằng Excel
Excel có thể tính toán SD từ một loạt các giá trị bằng cách sử dụng hàm STDEV[]. Ví dụ: nếu bạn muốn biết độ lệch chuẩn của các giá trị trong các ô từ B1 đến B10, hãy sử dụng công thức này trong Excel
=STDEV[B1. B10]
Hàm đó tính toán SD bằng cách sử dụng n-1 ở mẫu số. Nếu bạn muốn tính toán SD bằng cách sử dụng N ở mẫu số [xem bên trên], hãy sử dụng hàm STDEVP[] của Excel
Ngoài số lượng tùy chọn kiểm tra t, kiểm tra t cũng thường bị nhầm lẫn với các kỹ thuật hoàn toàn khác. Đây là cách để giữ cho tất cả chúng thẳng
Tương quan và hồi quy được sử dụng để đo mức độ hai yếu tố di chuyển cùng nhau. Mặc dù các bài kiểm tra t là một phần của phân tích hồi quy, nhưng chúng chỉ tập trung vào một yếu tố bằng cách so sánh các phương tiện trong các mẫu khác nhau
ANOVA được sử dụng để so sánh các phương tiện giữa ba nhóm trở lên. Ngược lại, kiểm định t so sánh trung bình giữa chính xác hai nhóm
Cuối cùng, các bảng dự phòng so sánh số lượng quan sát trong các nhóm thay vì trung bình được tính toán. Vì kiểm tra t so sánh giá trị trung bình của biến liên tục giữa các nhóm, bảng dự phòng sử dụng các phương pháp như chi bình phương thay vì kiểm tra t
Giả định của kiểm tra t
Vì có một số phiên bản thử nghiệm t, điều quan trọng là phải kiểm tra các giả định để tìm ra giả định nào phù hợp nhất cho dự án của bạn. Dưới đây là danh sách kiểm tra phân tích của chúng tôi cho các bài kiểm tra t không ghép đôi và bài kiểm tra t cặp đôi, đây là hai bài kiểm tra phổ biến nhất. Những điều này [và hướng dẫn cuối cùng cho các bài kiểm tra t] đi sâu vào chi tiết về các giả định cơ bản làm cơ sở cho bất kỳ bài kiểm tra t nào.
- Đúng hai nhóm
- Mẫu được phân phối bình thường
- quan sát độc lập
- Phương sai không bằng nhau hay bằng nhau?
- Dữ liệu được ghép nối hoặc chưa ghép nối?
Giải thích kết quả
Ba tùy chọn khác nhau cho các bài kiểm tra t có cách hiểu hơi khác nhau, nhưng tất cả đều xoay quanh việc kiểm tra giả thuyết và giá trị P. Bạn cần chọn ngưỡng ý nghĩa cho giá trị P của mình [thường là 0. 05] trước khi làm bài kiểm tra
Mặc dù các giá trị P có thể dễ hiểu sai, nhưng chúng là phương pháp được sử dụng phổ biến nhất để đánh giá liệu có bằng chứng về sự khác biệt giữa mẫu dữ liệu được thu thập và giả thuyết không. Khi bạn đã chạy thử nghiệm t chính xác, hãy xem giá trị P kết quả. Nếu kết quả kiểm tra thấp hơn ngưỡng của bạn, bạn có đủ bằng chứng để kết luận rằng dữ liệu có sự khác biệt đáng kể
Nếu kết quả kiểm tra lớn hơn hoặc bằng ngưỡng của bạn, bạn không thể kết luận rằng có sự khác biệt. Tuy nhiên, bạn không thể kết luận rằng chắc chắn không có sự khác biệt. Có thể một tập dữ liệu có nhiều quan sát hơn sẽ dẫn đến một kết luận khác
Tùy thuộc vào thử nghiệm mà bạn chạy, bạn có thể thấy các thống kê khác được sử dụng để tính giá trị P, bao gồm chênh lệch trung bình, thống kê t, bậc tự do và sai số chuẩn. Khoảng tin cậy và đánh giá tập dữ liệu của bạn cũng được đưa ra trên trang kết quả
Vẽ đồ thị kiểm tra t
Máy tính này không cung cấp biểu đồ hoặc đồ thị của các phép thử t, tuy nhiên, đồ thị là một phần quan trọng của phân tích vì nó có thể giúp giải thích kết quả của phép thử t và làm nổi bật bất kỳ giá trị ngoại lai tiềm năng nào. Xem hướng dẫn Lăng kính của chúng tôi để biết một số mẹo vẽ đồ thị cho cả bài kiểm tra t ghép đôi và ghép đôi
Prism được xây dựng cho đồ họa và biểu đồ chất lượng xuất bản, tùy chỉnh. Đối với các thử nghiệm t, chúng tôi khuyên bạn chỉ cần vẽ biểu đồ chính các điểm dữ liệu và giá trị trung bình hoặc biểu đồ ước tính. Một cách tiếp cận phổ biến khác là sử dụng một âm mưu violon, giống như những âm mưu có sẵn trong Prism
Để biết thêm thông tin
Hướng dẫn cuối cùng của chúng tôi về các bài kiểm tra t bao gồm các ví dụ, liên kết và giải thích trực quan về chủ đề này. Nó khá đơn giản là nơi tốt nhất để bắt đầu nếu bạn đang tìm kiếm thêm về các bài kiểm tra t
Nếu bạn thích máy tính này, bạn sẽ thích sử dụng Prism để phân tích. Hãy dùng thử miễn phí 30 ngày để làm được nhiều việc hơn với dữ liệu của bạn, chẳng hạn như
- Hướng dẫn rõ ràng để chọn bài kiểm tra phù hợp và tóm tắt kết quả chi tiết
- Đồ họa thử nghiệm tùy chỉnh, chất lượng xuất bản, âm mưu vĩ cầm, v.v.
- Nhiều tùy chọn kiểm tra t hơn, bao gồm kiểm tra tính quy tắc cũng như kiểm tra t lồng nhau và nhiều lần
- Các lựa chọn thay thế kiểm tra phi tham số như Wilcoxon, Mann-Whitney và Kolmogorov-Smirnov
Hãy xem video của chúng tôi về cách thực hiện thử nghiệm t trong Prism, ví dụ từ đầu đến cuối
Hãy nhớ rằng, trang này chỉ dành cho hai bài kiểm tra t mẫu. Nếu bạn chỉ có một mẫu, bạn cần sử dụng máy tính này để thay thế