programming php

Cách tính sem trong lăng kính graphpad

Tại sao chia cho n-1 thay vì N trong bước thứ ba ở trên? . Bạn không biết ý nghĩa thực sự của dân số; . Ngoại trừ một số trường hợp hiếm hoi khi trung bình mẫu bằng với trung bình tổng thể, dữ liệu sẽ gần với trung bình mẫu hơn là trung bình tổng thể thực. Vì vậy, giá trị bạn tính toán ở bước 2 có thể sẽ nhỏ hơn một chút [và không thể lớn hơn] so với giá trị nếu bạn sử dụng trung bình dân số thực ở bước 1. Để bù đắp cho điều này, chúng tôi chia cho n-1 thay vì n

Nhưng tại sao n-1? . Các nhà thống kê nói rằng có n-1 bậc tự do

Tìm hiểu thêm về n so với. n-1

Nhưng tôi đã thấy các phương trình có n, không phải n-1, ở mẫu số

Phương trình n-1 được sử dụng trong tình huống phổ biến khi bạn đang phân tích một mẫu dữ liệu và muốn đưa ra kết luận tổng quát hơn. SD được tính theo cách này [với N-1 ở mẫu số] là dự đoán tốt nhất của bạn về giá trị của SD trong tổng thể

Nếu bạn chỉ muốn định lượng biến thể trong một tập hợp dữ liệu cụ thể và không có ý định ngoại suy để đưa ra kết luận rộng hơn, hãy tính SD bằng cách sử dụng N ở mẫu số. SD kết quả là SD của các giá trị cụ thể đó, nhưng rất có thể sẽ đánh giá thấp SD của dân số mà các điểm đó được rút ra

Mục tiêu của khoa học luôn là khái quát hóa, vì vậy không nên sử dụng phương trình có n ở mẫu số khi phân tích dữ liệu khoa học. Ví dụ duy nhất tôi có thể nghĩ về việc sử dụng n [không phải n-1] trong mẫu số có thể hợp lý là định lượng sự khác biệt giữa các điểm thi. Nhưng sẽ tốt hơn nhiều nếu hiển thị biểu đồ phân tán của mọi điểm số hoặc biểu đồ phân phối tần số

Lăng kính luôn tính toán SD bằng n-1

Bạn cần bao nhiêu giá trị để tính một SD?

SD định lượng phân tán, vì vậy rõ ràng bạn cần nhiều hơn một giá trị. Là hai giá trị đủ? . Nhưng điều đó là sai. Phương trình tính toán SD chỉ hoạt động tốt khi bạn chỉ có dữ liệu trùng lặp [n=2]

Kết quả có hợp lệ không? . Tôi đã mô phỏng mười nghìn bộ dữ liệu với n=2 và mỗi điểm dữ liệu được chọn ngẫu nhiên từ phân phối Gaussian. Vì tất cả các bài kiểm tra thống kê thực sự dựa trên phương sai [bình phương của SD], tôi đã so sánh phương sai được tính từ các giá trị trùng lặp với phương sai thực. Trung bình của 10.000 phương sai của dữ liệu mô phỏng nằm trong phạm vi 1% của phương sai thực mà dữ liệu được mô phỏng. Điều này có nghĩa là SD được tính toán từ dữ liệu trùng lặp là đánh giá hợp lệ về độ phân tán trong dữ liệu của bạn. Nó có khả năng quá cao hoặc quá thấp như nhau, nhưng có khả năng cách khá xa so với SD thực

Tính SD bằng Excel

Excel có thể tính toán SD từ một loạt các giá trị bằng cách sử dụng hàm STDEV[]. Ví dụ: nếu bạn muốn biết độ lệch chuẩn của các giá trị trong các ô từ B1 đến B10, hãy sử dụng công thức này trong Excel

=STDEV[B1. B10]

Hàm đó tính toán SD bằng cách sử dụng n-1 ở mẫu số. Nếu bạn muốn tính toán SD bằng cách sử dụng N ở mẫu số [xem bên trên], hãy sử dụng hàm STDEVP[] của Excel

Ngoài số lượng tùy chọn kiểm tra t, kiểm tra t cũng thường bị nhầm lẫn với các kỹ thuật hoàn toàn khác. Đây là cách để giữ cho tất cả chúng thẳng

Tương quan và hồi quy được sử dụng để đo mức độ hai yếu tố di chuyển cùng nhau. Mặc dù các bài kiểm tra t là một phần của phân tích hồi quy, nhưng chúng chỉ tập trung vào một yếu tố bằng cách so sánh các phương tiện trong các mẫu khác nhau

ANOVA được sử dụng để so sánh các phương tiện giữa ba nhóm trở lên. Ngược lại, kiểm định t so sánh trung bình giữa chính xác hai nhóm

Cuối cùng, các bảng dự phòng so sánh số lượng quan sát trong các nhóm thay vì trung bình được tính toán. Vì kiểm tra t so sánh giá trị trung bình của biến liên tục giữa các nhóm, bảng dự phòng sử dụng các phương pháp như chi bình phương thay vì kiểm tra t

Giả định của kiểm tra t

Vì có một số phiên bản thử nghiệm t, điều quan trọng là phải kiểm tra các giả định để tìm ra giả định nào phù hợp nhất cho dự án của bạn. Dưới đây là danh sách kiểm tra phân tích của chúng tôi cho các bài kiểm tra t không ghép đôi và bài kiểm tra t cặp đôi, đây là hai bài kiểm tra phổ biến nhất. Những điều này [và hướng dẫn cuối cùng cho các bài kiểm tra t] đi sâu vào chi tiết về các giả định cơ bản làm cơ sở cho bất kỳ bài kiểm tra t nào.

Đúng hai nhóm
Mẫu được phân phối bình thường
quan sát độc lập
Phương sai không bằng nhau hay bằng nhau?
Dữ liệu được ghép nối hoặc chưa ghép nối?

Giải thích kết quả

Ba tùy chọn khác nhau cho các bài kiểm tra t có cách hiểu hơi khác nhau, nhưng tất cả đều xoay quanh việc kiểm tra giả thuyết và giá trị P. Bạn cần chọn ngưỡng ý nghĩa cho giá trị P của mình [thường là 0. 05] trước khi làm bài kiểm tra

Mặc dù các giá trị P có thể dễ hiểu sai, nhưng chúng là phương pháp được sử dụng phổ biến nhất để đánh giá liệu có bằng chứng về sự khác biệt giữa mẫu dữ liệu được thu thập và giả thuyết không. Khi bạn đã chạy thử nghiệm t chính xác, hãy xem giá trị P kết quả. Nếu kết quả kiểm tra thấp hơn ngưỡng của bạn, bạn có đủ bằng chứng để kết luận rằng dữ liệu có sự khác biệt đáng kể

Nếu kết quả kiểm tra lớn hơn hoặc bằng ngưỡng của bạn, bạn không thể kết luận rằng có sự khác biệt. Tuy nhiên, bạn không thể kết luận rằng chắc chắn không có sự khác biệt. Có thể một tập dữ liệu có nhiều quan sát hơn sẽ dẫn đến một kết luận khác

Tùy thuộc vào thử nghiệm mà bạn chạy, bạn có thể thấy các thống kê khác được sử dụng để tính giá trị P, bao gồm chênh lệch trung bình, thống kê t, bậc tự do và sai số chuẩn. Khoảng tin cậy và đánh giá tập dữ liệu của bạn cũng được đưa ra trên trang kết quả

Vẽ đồ thị kiểm tra t

Máy tính này không cung cấp biểu đồ hoặc đồ thị của các phép thử t, tuy nhiên, đồ thị là một phần quan trọng của phân tích vì nó có thể giúp giải thích kết quả của phép thử t và làm nổi bật bất kỳ giá trị ngoại lai tiềm năng nào. Xem hướng dẫn Lăng kính của chúng tôi để biết một số mẹo vẽ đồ thị cho cả bài kiểm tra t ghép đôi và ghép đôi

Prism được xây dựng cho đồ họa và biểu đồ chất lượng xuất bản, tùy chỉnh. Đối với các thử nghiệm t, chúng tôi khuyên bạn chỉ cần vẽ biểu đồ chính các điểm dữ liệu và giá trị trung bình hoặc biểu đồ ước tính. Một cách tiếp cận phổ biến khác là sử dụng một âm mưu violon, giống như những âm mưu có sẵn trong Prism

Để biết thêm thông tin

Hướng dẫn cuối cùng của chúng tôi về các bài kiểm tra t bao gồm các ví dụ, liên kết và giải thích trực quan về chủ đề này. Nó khá đơn giản là nơi tốt nhất để bắt đầu nếu bạn đang tìm kiếm thêm về các bài kiểm tra t

Nếu bạn thích máy tính này, bạn sẽ thích sử dụng Prism để phân tích. Hãy dùng thử miễn phí 30 ngày để làm được nhiều việc hơn với dữ liệu của bạn, chẳng hạn như

Hướng dẫn rõ ràng để chọn bài kiểm tra phù hợp và tóm tắt kết quả chi tiết
Đồ họa thử nghiệm tùy chỉnh, chất lượng xuất bản, âm mưu vĩ cầm, v.v.
Nhiều tùy chọn kiểm tra t hơn, bao gồm kiểm tra tính quy tắc cũng như kiểm tra t lồng nhau và nhiều lần
Các lựa chọn thay thế kiểm tra phi tham số như Wilcoxon, Mann-Whitney và Kolmogorov-Smirnov

Hãy xem video của chúng tôi về cách thực hiện thử nghiệm t trong Prism, ví dụ từ đầu đến cuối

Hãy nhớ rằng, trang này chỉ dành cho hai bài kiểm tra t mẫu. Nếu bạn chỉ có một mẫu, bạn cần sử dụng máy tính này để thay thế

SEM trong GraphPad Prism là gì?

SEM sai số chuẩn của giá trị trung bình [SEM] định lượng độ chính xác của giá trị trung bình. Đó là thước đo xem trung bình mẫu của bạn có thể khác bao xa so với trung bình dân số thực. Nó được thể hiện theo cùng đơn vị với dữ liệu. GraphPad Prism sử dụng chữ viết tắt SEM, nhưng một số thích [nhấn mạnh] chữ viết tắt SE [1, 2].

Prism tính toán sai số chuẩn như thế nào?

Giải thích các lỗi tiêu chuẩn của tham số . Việc tính toán các lỗi tiêu chuẩn phụ thuộc vào tổng bình phương, khoảng cách của các giá trị X, lựa chọn phương trình và số lần lặp lại .

SEM có giống như độ lệch chuẩn không?

Trong các tạp chí y sinh, Lỗi chuẩn của giá trị trung bình [SEM] và Độ lệch chuẩn [SD] được sử dụng thay thế cho nhau để thể hiện độ biến thiên ; . SEM định lượng độ không đảm bảo trong ước tính giá trị trung bình trong khi SD chỉ ra sự phân tán của dữ liệu từ giá trị trung bình.

Là lỗi tiêu chuẩn giống như SEM?

Sai số Chuẩn là độ lệch chuẩn của phân phối lấy mẫu của một thống kê. Thật khó hiểu, ước tính của đại lượng này thường được gọi là "lỗi tiêu chuẩn". Giá trị trung bình của [mẫu] là một thống kê và do đó, lỗi tiêu chuẩn của nó được gọi là Lỗi tiêu chuẩn của giá trị trung bình [SEM] .