Nhiều mô hình thống kê Python hồi quy tuyến tính
Các mô hình hồi quy được sử dụng rộng rãi như một kỹ thuật thống kê để dự đoán kết quả dựa trên dữ liệu quan sát được Hồi quy tuyến tính cho phép mô tả mức độ thay đổi của biến phụ thuộc (kết quả) so với (các) biến độc lập (đặc trưng, yếu tố dự báo) Khi có một biến độc lập và một biến phụ thuộc, nó được gọi là hồi quy tuyến tính đơn giản (SLR) Một phương trình hồi quy tuyến tính đơn giản trông giống như y = a + bx ở đâu Và nhiều công thức hồi quy tuyến tính có thể trông giống như y = a + b1*x1 + b2*x2 + b3*x3 + + + bn*xn Biến phụ thuộc về bản chất là liên tục và biến độc lập có thể liên tục hoặc phân loại Trước khi xây dựng mô hình, chúng tôi cần đảm bảo rằng dữ liệu của chúng tôi đáp ứng nhiều giả định hồi quy Độ tuyến tính — đường thẳng (thẳng) phù hợp nhất đi qua các điểm dữ liệu; Đối với mô hình của chúng tôi, chúng tôi sẽ sử dụng hồi quy Bình phương nhỏ nhất thông thường (OLS). Ngoài ra còn có WLS (Bình phương nhỏ nhất có trọng số), GLS (Bình phương nhỏ nhất tổng quát), v.v. Chúng tôi sẽ sử dụng bộ dữ liệu giá bán nhà ở quận King đã sửa đổi Sử dụng sổ ghi chép python và Jupyter, hãy nhập các thư viện cần thiết import numpy as np Tải dữ liệu (trong trường hợp của tôi từ cùng một trang với hiện tại. tập tin ipynb) df = pd.read_csv("kc_house_data.csv") Và khám phá dữ liệu ban đầu display(df.head())
Trực quan hóa dữ liệu Bằng cách sử dụng các gói matplotlib và seaborn, chúng tôi trực quan hóa dữ liệu. sns. Hàm regplot() giúp chúng ta tạo biểu đồ hồi quy Python3
pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels1 pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels3 pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels5
import numpy as np import pandas as pd import statsmodels.api as sm1_______7_______2 import numpy as np import pandas as pd import statsmodels.api as sm3_______7_______4_______7_______5 = 7_______7
import numpy as np import pandas as pd import statsmodels.api as sm8 đầu ra
Bước 3. Đặt giả thuyết
Bước 4. lắp mô hình mô hình thống kê. hồi quy. linear_model. Phương thức OLS() được sử dụng để lấy bình phương nhỏ nhất thông thường và phương thức fit() được sử dụng để điều chỉnh dữ liệu trong đó. Phương thức ols lấy dữ liệu và thực hiện hồi quy tuyến tính. chúng tôi cung cấp các cột phụ thuộc và độc lập ở định dạng này
Python3import numpy as np import pandas as pd import statsmodels.api as sm9 = df 1df 2_______7_______3df 4df 5
import numpy as np import pandas as pd import statsmodels.api as sm5 = 32_______3Bước 5. Tóm tắt mô hình Tất cả các thống kê tóm tắt của mô hình hồi quy tuyến tính được trả về bởi mô hình. phương pháp tóm tắt (). Giá trị p và nhiều giá trị/thống kê khác được biết bằng phương pháp này. Dự đoán về dữ liệu được tìm thấy bởi mô hình. phương pháp tóm tắt () Python3
Triển khai mãPython3
pip install numpy pip install pandas pip install statsmodels0 = 8pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels1 pip install numpy pip install pandas pip install statsmodels0 pd.read_csv( 2
import numpy as np import pandas as pd import statsmodels.api as sm9 = df 1df 2_______7_______3df 4df 5
import numpy as np import pandas as pd import statsmodels.api as sm5 = 32_______3
đầu ra
Mô tả một số thuật ngữ trong bảng
dự đoán của chúng tôiNếu chúng ta lấy mức ý nghĩa (alpha) là 0. 05, chúng tôi bác bỏ giả thuyết khống và chấp nhận giả thuyết thay thế là p |