Hướng dẫn rank trong python
Phương pháp thống kê giúp hiểu và phân tích hành vi của dữ liệu. Bây giờ chúng ta sẽ tìm hiểu một vài hàm thống kê mà ta có thể áp dụng trong Pandas. 1. Percent_changeSeries, DatFrames và Panel, tất cả đều có hàm pct_change (). Hàm này so sánh mọi phần tử với phần tử trước của nó và tính toán tỷ lệ phần trăm thay đổi.
Kết quả :
Theo mặc định, pct_change () hoạt động trên các cột; nếu bạn muốn áp dụng cùng một hàng, thay đổi đối số axis = 1 (). 2. Covariance ( Hiệp phương sai)Hiệp phương sai được áp dụng trên dữ liệu series. Đối tượng Series có một phương thức cov để tính hiệp phương sai giữa các đối tượng series. NA sẽ tự động bị loại trừ. a. Cov Series
Kết quả : Phương pháp hiệp phương sai khi được áp dụng trên DataFrame, tính toán cov giữa tất cả các cột.
Kết quả :
Lưu ý - giữa cột a và b trong câu lệnh đầu tiên và cùng là giá trị được trả về bởi cov trên DataFrame. 3. CorrelationCorrelation cho thấy mối quan hệ tuyến tính giữa hai mảng giá trị (series) bất kỳ. Có nhiều phương pháp để tính toán mối tương quan như pearson (mặc định), Speman và kendall.
Kết quả :
Nếu có bất kỳ cột nào không phải là số trong DataFrame, nó sẽ tự động bị loại trừ. 4. Data RankingData ranking tạo ra xếp hạng cho từng phần tử trong mảng các phần tử. Trong trường hợp quan hệ, chỉ định thứ hạng trung bình.
Kết quả :
Rank tùy chọn nhận một tham số tăng dần theo mặc định là True; khi false, dữ liệu được xếp hạng ngược, với các giá trị lớn hơn được chỉ định một thứ hạng nhỏ hơn.
|