Hướng dẫn covariance python - trăn hiệp phương sai
Giới thiệuLàm việc với các biến trong phân tích dữ liệu luôn đặt ra câu hỏi: Các biến phụ thuộc, liên kết và thay đổi với nhau như thế nào? Các biện pháp hiệp phương sai và hệ số tương quan tuyến tính giúp thiết lập điều này. Show Nội dung chính
Nội dung chính
Phương sai và Tương quan - Nói một cách đơn giảnThiết lập cho code Python - Truy xuất dữ liệu mẫu Tính toán hiệp phương sai trong Python Tính toán hệ số tương quan trong Python Thiết lập cho code Python - Truy xuất dữ liệu mẫuTính toán hiệp phương sai trong Python Hiệp phương sai mang lại sự thay đổi giữa các biến. Chúng ta sử dụng hiệp phương sai để đo lường mức độ hai biến thay đổi với nhau. Hệ số tương quan tuyến tính tiết lộ mối quan hệ giữa các biến. Chúng ta sử dụng mối tương quan để xác định mức độ liên kết chặt chẽ của hai biến với nhau. Cả hiệp phương sai và tương quan là hai khái niệm trong lĩnh vực xác suất thống kê, đều nói về mối quan hệ giữa các biến. Hiệp phương sai xác định mối liên kết có hướng giữa các biến. Giá trị hiệp phương sai nằm trong khoảng từ−∞ đến +∞ trong đó giá trị dương biểu thị rằng cả hai biến chuyển động theo cùng một hướng và giá trị âm biểu thị rằng cả hai biến chuyển động ngược chiều nhau.Tính toán hiệp phương sai trong PythonTính toán hệ số tương quan trong Python Hiệp phương sai mang lại sự thay đổi giữa các biến. Chúng ta sử dụng hiệp phương sai để đo lường mức độ hai biến thay đổi với nhau. Hệ số tương quan tuyến tính tiết lộ mối quan hệ giữa các biến. Chúng ta sử dụng mối tương quan để xác định mức độ liên kết chặt chẽ của hai biến với nhau.
Hãy xem tập dữ liệu, trên đó chúng tôi sẽ thực hiện phân tích:
chúng ta chọn hai cột để phân tích - sepal_length và sepal_width. Trong một tệp Python mới (có thể đặt tên nó là covariance_correlation.py), hãy bắt đầu bằng cách tạo hai danh sách với các giá trị cho thuộc tính sepal_length và sepal_width của flower:
Trong khoa học dữ liệu, nó luôn giúp trực quan hóa dữ liệu bạn đang làm việc. Đây là biểu đồ hồi quy Seaborn (Biểu đồ phân tán + phù hợp hồi quy tuyến tính) của các thuộc tính setosa này trên các trục khác nhau: Về mặt trực quan, các điểm dữ liệu dường như có mối tương quan cao gần với đường hồi quy. Hãy xem liệu các quan sát của chúng ta có khớp với các giá trị hiệp phương sai và tương quan của chúng hay không.
Công thức sau đây tính hiệp phương sai: Tính toán hệ số tương quan trong PythonHiệp phương sai mang lại sự thay đổi giữa các biến. Chúng ta sử dụng hiệp phương sai để đo lường mức độ hai biến thay đổi với nhau. Hệ số tương quan tuyến tính tiết lộ mối quan hệ giữa các biến. Chúng ta sử dụng mối tương quan để xác định mức độ liên kết chặt chẽ của hai biến với nhau.
Vì giá trị này cần hiệp phương sai của hai biến nên hàm khá nhiều lần tính ra giá trị đó. Khi hiệp phương sai được tính, chúng ta tính độ lệch chuẩn cho mỗi biến. Từ đó, mối tương quan chỉ đơn giản là chia hiệp phương sai với phép nhân các bình phương của độ lệch chuẩn. Chạy mã này, chúng ta nhận được kết quả sau, xác nhận rằng các thuộc tính này có mối quan hệ dương (dấu của giá trị, hoặc +, - hoặc none nếu 0) và mạnh (giá trị gần bằng 1):
Nguồn: https://stackabuse.com/covariance-and-correlation-in-python/ |