Kiểm tra t một mẫu Excel

Excel có thể thực hiện các phân tích thống kê khác nhau, bao gồm kiểm tra t. Đây là một lựa chọn tuyệt vời vì gần như mọi người đều có thể truy cập Excel. Bài đăng này là phần giới thiệu tuyệt vời để thực hiện và diễn giải các bài kiểm tra t ngay cả khi Excel không phải là gói phần mềm thống kê chính của bạn

Trong bài đăng này, tôi cung cấp hướng dẫn từng bước để sử dụng Excel để thực hiện kiểm tra t. Điều quan trọng là tôi cũng chỉ cho bạn cách chọn đúng hình thức kiểm tra t, chọn các tùy chọn phù hợp và diễn giải kết quả. Tôi cũng bao gồm các liên kết đến các tài nguyên bổ sung mà tôi đã viết, trình bày các giải thích rõ ràng về các khái niệm kiểm tra t có liên quan mà bạn sẽ không tìm thấy trong tài liệu của Excel. Và, tôi sử dụng một bộ dữ liệu mẫu để chúng ta cùng nhau giải thích và giải thích

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel
T-test là các bài kiểm tra giả thuyết đánh giá phương tiện của một hoặc hai nhóm. Các thử nghiệm giả thuyết sử dụng dữ liệu mẫu để suy ra các thuộc tính của toàn bộ quần thể. Để có thể sử dụng t-test, bạn cần lấy một mẫu ngẫu nhiên từ quần thể mục tiêu của mình. Tùy thuộc vào kiểm tra t và cách bạn định cấu hình, kiểm tra có thể xác định xem

  • Hai nhóm có nghĩa là khác nhau
  • Phương tiện được ghép nối là khác nhau
  • Một giá trị trung bình khác với giá trị mục tiêu

Để biết thêm thông tin về các loại thử nghiệm t bạn có thể sử dụng, hãy đọc bài đăng của tôi về Thử nghiệm t 1 mẫu, 2 mẫu và Ghép đôi. Tìm hiểu cách so sánh với Bài kiểm tra Z



Cài đặt Data Analysis ToolPak trong Excel

Data Analysis ToolPak phải được cài đặt trên bản sao Excel của bạn để thực hiện kiểm tra t. Để xác định xem bạn đã cài đặt ToolPak này chưa, hãy nhấp vào menu Dữ liệu trong Excel ở trên cùng và tìm Phân tích dữ liệu trong phần Phân tích. Nếu bạn không thấy Phân tích dữ liệu, bạn cần cài đặt nó. Đừng lo. Nó miễn phí

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Để cài đặt Tookpak phân tích của Excel, hãy nhấp vào tab Tệp ở trên cùng bên trái, sau đó nhấp vào Tùy chọn ở dưới cùng bên trái. Sau đó, nhấp vào Bổ trợ. Trên danh sách thả xuống Quản lý, chọn Phần bổ trợ Excel, rồi bấm Đi. Trên cửa sổ bật lên xuất hiện, kiểm tra Phân tích ToolPak và nhấp vào OK

Sau khi bạn kích hoạt nó, hãy nhấp vào Phân tích dữ liệu trong menu Dữ liệu để hiển thị các phân tích mà bạn có thể thực hiện. Trong số các tùy chọn khác, cửa sổ bật lên trình bày ba loại kiểm tra t, chúng tôi sẽ đề cập tiếp theo

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Kiểm tra t hai mẫu trong Excel

Kiểm định t hai mẫu so sánh phương tiện của chính xác hai nhóm—không hơn không kém. Thông thường, bạn thực hiện kiểm tra này để xác định xem hai trung bình dân số có khác nhau không. Ví dụ, những học sinh học bằng Phương pháp A có điểm trung bình khác với những học sinh học bằng Phương pháp B không? . Nói cách khác, mỗi nhóm chứa một nhóm người hoặc vật phẩm duy nhất

Các nhà thống kê coi sự khác biệt giữa các phương tiện nhóm là kích thước hiệu ứng không được chuẩn hóa vì các giá trị này biểu thị độ mạnh của mối quan hệ bằng cách sử dụng các giá trị giữ lại các đơn vị tự nhiên của biến phụ thuộc. Cohen's d là kích thước hiệu ứng được tiêu chuẩn hóa tương ứng và nó phù hợp để báo cáo trong một số trường hợp. Kích thước hiệu ứng giúp bạn hiểu tầm quan trọng của những phát hiện trong ý nghĩa thực tế. Để tìm hiểu thêm về kích thước hiệu ứng chưa chuẩn hóa và chuẩn hóa, hãy đọc bài đăng của tôi về Kích thước hiệu ứng trong Thống kê

Dạng chuẩn kiểm tra các giả thuyết sau

  • Vô giá trị. Hai trung bình dân số bằng nhau
  • Thay thế. Hai dân số có nghĩa là không bằng nhau

Nếu giá trị p nhỏ hơn mức ý nghĩa của bạn (e. g. , 0. 05), bạn có thể bác bỏ giả thuyết không. Sự khác biệt giữa hai giá trị trung bình có ý nghĩa thống kê. Mẫu của bạn cung cấp bằng chứng đủ mạnh để kết luận rằng hai phương tiện dân số là khác nhau

Để biết thêm thông tin về các giả thuyết không và giả thuyết thay thế cũng như các thuật ngữ kiểm tra giả thuyết khác, hãy xem Tổng quan về kiểm tra giả thuyết của tôi

Ngoài ra, hãy tìm hiểu về sự khác biệt giữa thống kê mô tả và thống kê suy luận

t-Tests cho phương sai bằng nhau và không bằng nhau

Bạn sẽ nhận thấy rằng Excel có hai dạng kiểm tra t hai mẫu. Một cái giả định phương sai bằng nhau và cái kia giả định phương sai không bằng nhau. Phương sai và độ lệch chuẩn liên quan chặt chẽ là các biện pháp thay đổi. Tất cả các thử nghiệm t đều cho rằng bạn đã thu được dữ liệu từ các quần thể được phân phối bình thường. Tuy nhiên, phép thử t thông thường cũng giả định độ lệch chuẩn/phương sai của cả hai nhóm là bằng nhau. Một dạng kiểm định khác, được gọi là kiểm định t của Welch, không giả định các phương sai bằng nhau

Bên cạnh đó, nhờ vào định lý giới hạn trung tâm, bạn có thể sử dụng kiểm tra t một cách an toàn để phân tích dữ liệu không bình thường khi có ~20 quan sát trở lên trên mỗi nhóm

Cái nào để sử dụng?

Lời khuyên cho việc sử dụng biểu mẫu phương sai bằng nhau hoặc không bằng nhau của kiểm tra t 2 mẫu khác nhau vì vấn đề này phức tạp hơn so với lần đầu tiên xuất hiện. Một số nhà phân tích khuyên nên sử dụng phép thử F để xác định xem các phương sai có không bằng nhau hay không. Và, Excel cung cấp Mẫu thử nghiệm F cho Phương sai. Tuy nhiên, sử dụng các xét nghiệm bổ sung luôn làm tăng khả năng xảy ra cả dương tính giả và âm tính giả (a. k. a, Lỗi loại I và loại II)

Ngoài ra, nếu bạn có cỡ mẫu lớn, kiểm tra f có nhiều sức mạnh thống kê hơn. Điều kiện này có thể khiến thử nghiệm xác định sự khác biệt không quan trọng là có ý nghĩa thống kê. Đó là sự khác biệt giữa ý nghĩa thực tiễn và ý nghĩa thống kê. Ngược lại, cỡ mẫu nhỏ có thể không phát hiện ra sự khác biệt đáng kể giữa các phương sai

Khi bạn có số lượng quan sát bằng nhau hoặc gần bằng nhau ở cả hai nhóm và cỡ mẫu vừa phải, kiểm định t sẽ mạnh mẽ đối với sự khác biệt giữa các phương sai. Nếu bạn thấy một nhóm có phương sai gấp đôi nhóm khác, có lẽ đã đến lúc bạn phải lo lắng. Tuy nhiên, bạn không cần phải lo lắng về những khác biệt nhỏ hơn

Các nhà phân tích khác đề nghị luôn sử dụng dạng kiểm tra t giả định phương sai không bằng nhau. Nếu bạn sử dụng phương pháp này khi các phương sai bằng nhau, bạn sẽ mất đi một lượng nhỏ sức mạnh thống kê, nhưng bạn sẽ tốt hơn khi các phương sai không bằng nhau

Nếu bạn có phương sai không bằng nhau và kích thước mẫu không bằng nhau, điều quan trọng là sử dụng phiên bản phương sai không bằng nhau của kiểm tra t 2 mẫu

Hướng dẫn từng bước để chạy Kiểm tra t hai mẫu trong Excel

Hãy tiến hành kiểm định t hai mẫu. Thử nghiệm này còn được gọi là thử nghiệm mẫu độc lập. Nhấp vào liên kết để tìm hiểu thêm về các giả thuyết, giả định và diễn giải của nó

Tình huống giả định của chúng tôi là chúng tôi đang so sánh điểm số từ hai phương pháp giảng dạy. Chúng tôi lấy ngẫu nhiên hai mẫu học sinh. Một mẫu bao gồm những sinh viên đã học bằng Phương pháp A trong khi mẫu còn lại học bằng Phương pháp B. Những mẫu này chứa các sinh viên hoàn toàn khác nhau. Bây giờ, chúng tôi muốn xác định xem hai phương tiện có khác nhau không. Tải xuống tệp CSV chứa tất cả dữ liệu cho cả hai ví dụ kiểm tra t trong bài đăng này. t-TestVí dụ

Để thực hiện kiểm tra t 2 mẫu trong Excel, hãy sắp xếp dữ liệu của bạn thành hai cột, như hình bên dưới

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Hãy giả sử rằng các phương sai bằng nhau và sử dụng phiên bản Giả sử phương sai bằng nhau. Nếu chúng tôi đã chọn hình thức kiểm tra phương sai không bằng nhau, thì các bước và cách giải thích đều giống nhau, chỉ có các phép tính thay đổi

  1. Trong Excel, nhấp vào Phân tích dữ liệu trên tab Dữ liệu
  2. Từ cửa sổ bật lên Phân tích dữ liệu, chọn t-Test. Giả định hai mẫu có phương sai bằng nhau
  3. Trong Đầu vào, chọn phạm vi cho cả Biến 1 và Biến 2
  4. Trong Chênh lệch trung bình được giả định, thông thường bạn sẽ nhập số không. Giá trị này là giá trị giả thuyết vô hiệu, đại diện cho không có hiệu lực. Trong trường hợp này, chênh lệch trung bình bằng 0 thể hiện không có sự khác biệt giữa hai phương pháp, điều này không ảnh hưởng
  5. Chọn hộp kiểm Nhãn nếu bạn có tên biến có ý nghĩa trong hàng 1. Tùy chọn này làm cho đầu ra dễ diễn giải hơn. Đảm bảo rằng bạn bao gồm hàng nhãn trong bước #3
  6. Excel sử dụng giá trị Alpha mặc định là 0. 05, thường là một giá trị tốt. Alpha là mức ý nghĩa. Chỉ thay đổi giá trị này khi bạn có lý do cụ thể để làm như vậy
  7. Nhấp vào OK

Đối với dữ liệu ví dụ, cửa sổ bật lên của bạn sẽ giống như hình bên dưới

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Sau khi Excel tạo đầu ra, tôi tự động điều chỉnh độ rộng của cột A để hiển thị tất cả văn bản trong đó

Giải thích kết quả kiểm tra t hai mẫu

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Kết quả cho biết giá trị trung bình của Phương pháp A là 71. 50362 và đối với Phương pháp B là 84. 74241. Nhìn vào hàng Phương sai, chúng ta có thể thấy rằng chúng không hoàn toàn bằng nhau, nhưng chúng đủ gần để giả định phương sai bằng nhau. Giá trị p là thống kê quan trọng nhất. Nếu bạn muốn tìm hiểu về các thống kê khác, bạn có thể đọc các bài viết của tôi về Thống kê t (i. e. , giá trị t), df (bậc tự do) và t Giá trị tới hạn

Nếu giá trị p nhỏ hơn mức ý nghĩa của bạn, sự khác biệt giữa các phương tiện có ý nghĩa thống kê. Excel cung cấp giá trị p cho cả kiểm tra t một đầu và hai đầu

Kiểm tra t một đầu có thể phát hiện sự khác biệt giữa các phương tiện chỉ theo một hướng. Ví dụ: kiểm tra một đầu chỉ có thể xác định xem Phương pháp B có tốt hơn Phương pháp A hay không. Thử nghiệm hai đuôi có thể phát hiện sự khác biệt theo cả hai hướng—lớn hơn hoặc nhỏ hơn. Có những nhược điểm bổ sung khi sử dụng kiểm tra một đầu—vì vậy tôi sẽ sử dụng kết quả hai đầu tiêu chuẩn. Để tìm hiểu thêm, hãy đọc bài viết của tôi về kiểm tra một đầu và hai đầu

Đối với kết quả của chúng tôi, chúng tôi sẽ sử dụng hai đuôi P(T<=t), là giá trị p cho dạng hai đuôi của thử nghiệm t. Bởi vì giá trị p của chúng tôi (0. 000336) nhỏ hơn mức ý nghĩa tiêu chuẩn là 0. 05, chúng ta có thể bác bỏ giả thuyết vô hiệu. Dữ liệu mẫu của chúng tôi ủng hộ giả thuyết rằng dân số có nghĩa là khác nhau. Cụ thể, giá trị trung bình của Phương pháp B lớn hơn giá trị trung bình của Phương pháp A

Các bài kiểm tra t được ghép nối trong Excel

Các thử nghiệm t được ghép nối đánh giá các quan sát được ghép nối, thường là hai phép đo trên cùng một người hoặc vật phẩm. Các nhà thống kê gọi những mẫu phụ thuộc này. Giả sử bạn thu thập một mẫu người ngẫu nhiên. Bạn tiến hành kiểm tra trước tất cả chúng, tiến hành điều trị và sau đó thực hiện kiểm tra sau. Mỗi môn học đều có điểm kiểm tra trước và sau khi kiểm tra. Hoặc, có lẽ bạn có một mẫu bảng gỗ, và bạn sơn một nửa bảng bằng một loại sơn và nửa còn lại bằng loại sơn khác. Sau đó, bạn tiến hành đo độ bền sơn cho cả 2 loại sơn trên tất cả các bảng. Mỗi bảng có hai điểm độ bền sơn

Trong cả hai trường hợp, bạn có thể sử dụng kiểm tra t theo cặp để xác định xem sự khác biệt giữa giá trị trung bình của hai tập hợp điểm có ý nghĩa thống kê hay không

Không giống như các bài kiểm tra t độc lập, các bài kiểm tra t theo cặp sử dụng cùng một người hoặc vật phẩm trong cả hai nhóm. Một cách để xác định xem thử nghiệm t được ghép nối có phù hợp với dữ liệu của bạn hay không là nếu mỗi hàng trong tập dữ liệu tương ứng với một người hoặc vật phẩm. Đối với ví dụ trước/sau thử nghiệm của chúng tôi, chúng tôi đo từng đối tượng trước và sau thử nghiệm và đặt các phép đo cho một cá nhân trên một hàng

Bài liên quan. Các mẫu độc lập và phụ thuộc và Thử nghiệm T ghép nối

Hướng dẫn từng bước để chạy Kiểm tra t được ghép nối trong Excel

Đối với ví dụ này, hãy tưởng tượng rằng chúng ta có một chương trình đào tạo và chúng ta cần xác định xem sự khác biệt giữa điểm trung bình trước khi kiểm tra và điểm trung bình sau khi kiểm tra có khác biệt đáng kể không

Để thực hiện kiểm tra t được ghép nối trong Excel, hãy sắp xếp dữ liệu của bạn thành hai cột sao cho mỗi hàng đại diện cho một người hoặc vật phẩm, như minh họa bên dưới. Lưu ý rằng phân tích không sử dụng số ID của đối tượng

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

  1. Trong Excel, nhấp vào Phân tích dữ liệu trên tab Dữ liệu
  2. Từ cửa sổ bật lên Phân tích dữ liệu, chọn t-Test. Ghép hai mẫu cho phương tiện
  3. Trong Đầu vào, chọn phạm vi cho cả Biến 1 và Biến 2
  4. Trong Chênh lệch trung bình được giả định, thông thường bạn sẽ nhập số không. Giá trị này là giá trị giả thuyết vô hiệu, đại diện cho không có hiệu lực. Trong trường hợp này, chênh lệch trung bình bằng 0 thể hiện không có sự khác biệt giữa hai phương pháp, điều này không ảnh hưởng
  5. Chọn hộp kiểm Nhãn nếu bạn có các nhãn biến có ý nghĩa ở hàng 1. Tùy chọn này giúp làm cho đầu ra dễ diễn giải hơn. Đảm bảo rằng bạn bao gồm hàng nhãn trong bước #3
  6. Excel sử dụng giá trị Alpha mặc định là 0. 05, thường là một giá trị tốt. Alpha là mức ý nghĩa. Chỉ thay đổi giá trị này khi bạn có lý do cụ thể để làm như vậy
  7. Nhấp vào OK

Đối với dữ liệu ví dụ, cửa sổ bật lên của bạn sẽ giống như hình bên dưới

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Giải thích kết quả kiểm tra t được ghép nối của Excel

Kiểm tra t một mẫu Excel
Kiểm tra t một mẫu Excel

Đầu ra cho biết giá trị trung bình của Pretest là 97. 06223 và đối với Posttest là 107. 8346

Nếu giá trị p nhỏ hơn mức ý nghĩa của bạn, sự khác biệt giữa các phương tiện có ý nghĩa thống kê. Một lần nữa, Excel cung cấp giá trị p cho cả kiểm tra t một phía và hai phía—và chúng tôi sẽ giữ nguyên kết quả hai phía. Để biết thông tin về các số liệu thống kê khác, hãy nhấp vào liên kết trong phần kiểm tra t 2 mẫu

Đối với kết quả của chúng tôi, chúng tôi sẽ sử dụng hai đuôi P(T<=t), là giá trị p cho dạng hai đuôi của thử nghiệm t. Bởi vì giá trị p của chúng tôi (0. 002221) nhỏ hơn mức ý nghĩa tiêu chuẩn là 0. 05, chúng ta có thể bác bỏ giả thuyết vô hiệu. Dữ liệu mẫu của chúng tôi ủng hộ giả thuyết rằng dân số có nghĩa là khác nhau. Cụ thể, giá trị trung bình Posttest lớn hơn giá trị trung bình Pretest

Các bài kiểm tra t của Excel không bao gồm những gì

Thật tuyệt khi có thể thực hiện các bài kiểm tra t trong Excel, nhưng nó lại bỏ qua một số tính năng cần thiết. Đáng chú ý, Excel không thể tạo khoảng tin cậy. Phương tiện trong các phân tích này là ước tính điểm cho phương tiện dân số. Tuy nhiên, do sai số ngẫu nhiên, trung bình mẫu không bao giờ chính xác bằng trung bình tổng thể. Có một biên độ lỗi xung quanh các ước tính. Khoảng tin cậy sử dụng biên độ sai số để tính toán phạm vi giá trị có thể chứa giá trị trung bình tổng thể thực tế cho mỗi nhóm. Tìm hiểu thêm về khoảng tin cậy

Excel cũng không tính toán chênh lệch ước tính giữa các phương tiện. Sự khác biệt giữa các phương tiện là quy mô hiệu ứng cho phân tích—một giá trị quan trọng cần biết. Bằng cách sử dụng một công thức trong Excel, bạn có thể dễ dàng tính toán sự khác biệt giữa các phương tiện. Tuy nhiên, thật tuyệt nếu có một khoảng tin cậy cho sự khác biệt này. Để biết thêm thông tin, hãy đọc bài đăng của tôi về việc sử dụng khoảng tin cậy để đánh giá sự khác biệt giữa các phương tiện

Cuối cùng, kỳ lạ thay, Excel không cung cấp kiểm tra t một mẫu. Trong một số trường hợp, bạn có thể có một mẫu dữ liệu duy nhất và cần xác định xem dữ liệu đó có khác với giá trị mục tiêu hay không. Ví dụ: bạn có thể đo độ bền của sản phẩm và sử dụng kiểm tra t một mẫu để xác định xem nó có khác biệt đáng kể so với giá trị độ bền quan trọng hay không

t-Tests có thể so sánh tối đa hai nhóm. Nếu bạn có ba nhóm trở lên, bạn sẽ cần sử dụng ANOVA. Để biết thêm thông tin, hãy xem các bài đăng của tôi về cách thực hiện ANOVA một chiều trong Excel và cách thực hiện ANOVA hai chiều trong Excel. Tìm hiểu về phân phối T

Nếu bạn đang tìm hiểu về kiểm tra giả thuyết và thích cách tiếp cận mà tôi sử dụng trong blog của mình, hãy xem cuốn sách Kiểm tra giả thuyết của tôi. Bạn có thể tìm thấy nó tại Amazon và các nhà bán lẻ khác

Có một cái

Vì Excel không có lệnh one-sample t-test nên chúng ta phải đánh lừa để nó nghĩ 2 số mà chúng ta gõ là một mẫu khác

t là gì

=T. KIỂM TRA(mảng1,mảng2,đuôi,loại) . Array1 (Là đối số bắt buộc) – Tập dữ liệu đầu tiên. Array2 (Là đối số bắt buộc) – Tập dữ liệu thứ hai. Tails (Đây là đối số bắt buộc) – Chỉ định xem đó là thử nghiệm một phía hay hai phía.

một cái là gì

Ví dụ: hãy tưởng tượng một công ty muốn kiểm tra tuyên bố rằng pin của họ kéo dài hơn 40 giờ . Sử dụng một mẫu ngẫu nhiên đơn giản gồm 15 pin mang lại giá trị trung bình là 44. 9 giờ, với độ lệch chuẩn là 8. 9 tiếng. Kiểm tra khẳng định này với mức ý nghĩa bằng 0. 05.

một cái là gì

Hàm R để tính t-test một mẫu . hai bên” (mặc định), “lớn hơn” hoặc “ít hơn”.