Hướng dẫn calculate z-score python pandas - tính z-score pandas python
Trong các số liệu thống kê, a & nbsp; z-score & nbsp; cho chúng ta biết có bao nhiêu độ lệch chuẩn là một giá trị từ giá trị trung bình. Chúng tôi sử dụng công thức sau để tính toán điểm Z:z-score tells us how many standard deviations away a value is from the mean. We use the following formula to calculate a z-score:z-score tells us how many standard deviations away a value is from the mean. We use the following formula to calculate a z-score: z & nbsp; = (x - & nbsp; μ) / σ = (X – μ) / σ = (X – μ) / σ where:
Hướng dẫn này giải thích cách tính toán điểm Z cho các giá trị dữ liệu thô trong Python. Cách tính điểm Z trong PythonChúng ta có thể tính toán các điểm z trong Python bằng & nbsp; scipy.stats.zscore, sử dụng cú pháp sau:scipy.stats.zscore, which uses the following syntax:scipy.stats.zscore, which uses the following syntax: scipy.stats.zscore (a, trục = 0, ddof = 0, nan_policy = Hồi tuyên truyền) where:
Các ví dụ sau đây minh họa cách sử dụng chức năng này để tính toán điểm z cho các mảng numpy một chiều, mảng numpy đa chiều và các khung dữ liệu gấu trúc. Mảng một chiều numpyBước 1: Nhập các mô -đun. import pandas as pd import numpy as np import scipy.stats as stats Bước 2: Tạo một mảng các giá trị. data = np.array([6, 7, 7, 12, 13, 13, 15, 16, 19, 22]) Bước 3: Tính toán điểm z cho mỗi giá trị trong mảng. stats.zscore(data)
[-1.394, -1.195, -1.195, -0.199, 0, 0, 0.398, 0.598, 1.195, 1.793]
Mỗi điểm Z cho chúng ta biết có bao nhiêu độ lệch chuẩn một giá trị riêng lẻ từ giá trị trung bình. Ví dụ:
Mảng đa chiều numpyNếu chúng ta có một mảng đa chiều, chúng ta có thể sử dụng tham số & nbsp; trục & nbsp; để chỉ định rằng chúng ta muốn tính toán từng điểm z so với mảng riêng của nó. Ví dụ: giả sử chúng ta có mảng đa chiều sau:axis parameter to specify that we want to calculate each z-score relative to its own array. For example, suppose we have the following multi-dimensional array:axis parameter to specify that we want to calculate each z-score relative to its own array. For example, suppose we have the following multi-dimensional array: data = np.array([[5, 6, 7, 7, 8], [8, 8, 8, 9, 9], [2, 2, 4, 4, 5]]) Chúng ta có thể sử dụng cú pháp sau để tính toán điểm z cho mỗi mảng: stats.zscore(data, axis=1) [[-1.569 -0.588 0.392 0.392 1.373] [-0.816 -0.816 -0.816 1.225 1.225] [-1.167 -1.167 0.5 0.5 1.333]] Các điểm z cho mỗi giá trị riêng lẻ được hiển thị liên quan đến mảng mà chúng ở. Ví dụ:
GANDAS DATAFRAMEGiả sử chúng ta thay vào đó có một DataFrame Pandas: data = pd.DataFrame(np.random.randint(0, 10, size=(5, 3)), columns=['A', 'B', 'C']) data A B C 0 8 0 9 1 4 0 7 2 9 6 8 3 1 8 1 4 8 0 8 Chúng ta có thể sử dụng chức năng áp dụng & nbsp;apply function to calculate the z-score of individual values by column:apply function to calculate the z-score of individual values by column: data.apply(stats.zscore) A B C 0 0.659380 -0.802955 0.836080 1 -0.659380 -0.802955 0.139347 2 0.989071 0.917663 0.487713 3 -1.648451 1.491202 -1.950852 4 0.659380 -0.802955 0.487713 Các điểm z cho mỗi giá trị riêng lẻ được hiển thị liên quan đến cột mà chúng ở. Ví dụ:
Tài nguyên bổ sung: Cách tính toán điểm z trong Excel Cách tính toán điểm Z trong SPSS Cách tính toán điểm Z trên máy tính Ti-84 How to Calculate Z-Scores in SPSS How to Calculate Z-Scores on a TI-84 Calculator |