Nguồn hình ảnh Hồi quy Poisson với Python từ đầu để hiểu rõ hơn về nó. Một thư viện Python hữu ích có tên StatSmodels có thể thực hiện phân tích hồi quy ngay lập tức. Tuy nhiên, tôi đã cố gắng thực hiện nó mà không sử dụng thư viện Python để có sự hiểu biết sâu sắc hơn. Nội dung chính ShowShow
Tôi có thể sử dụng hồi quy Poisson với kết quả nhị phân không?
Poisson là gì?
Nó được dự đoán như thế nào
Cách tìm hệ số
Nó được dự đoán như thế nào
Cách tìm hệ số
Thực hiện trong Python
1. Hồi quy Poisson là gì?
2. Phân phối Poisson như một phần của gia đình theo cấp số nhân
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa
Bây giờ chúng tôi sử dụng bí mật của mình không phải là vũ khí bí mật, phương pháp khả năng tối đa
Cách tìm hệ số
Thực hiện trong Python
1. Hồi quy Poisson là gì?
2. Phân phối Poisson như một phần của gia đình theo cấp số nhân
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa.
Bây giờ chúng tôi sử dụng bí mật của mình không phải là vũ khí bí mật, phương pháp khả năng tối đa
Làm thế nào để bạn sử dụng mô hình Poisson trong Python?
Thực hiện trong Python
1. Hồi quy Poisson là gì?
2. Phân phối Poisson như một phần của gia đình theo cấp số nhân
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa
Bây giờ chúng tôi sử dụng bí mật của mình không phải là vũ khí bí mật, phương pháp khả năng tối đa
Làm thế nào để bạn sử dụng mô hình Poisson trong Python?
Có phải hồi quy Poisson giống như hồi quy tuyến tính?
Có phải hồi quy Poisson giống như hồi quy logistic?
Tôi có thể sử dụng hồi quy Poisson với kết quả nhị phân không?
Xin chào! Vì bài viết đầu tiên của tôi, tôi sẽ cố gắng tạo ra gần như toàn bộ suy luận của mô hình hồi quy Poisson, đây cũng là một khóa học cho lớp nhận dạng mẫu của tôi, vì vậy, hãy thử điều này ở nhà.
Trong bài đăng này, chúng tôi sẽ đề cập:
- Hồi quy Poisson là gì?
- Phân phối Poisson như một phần của gia đình theo cấp số nhân.
- Phương pháp log-khả năng đăng nhập tối đa.
- Tạo ra chức năng mất.
- Đại diện ma sát.
- Một triển khai đơn giản.
- Tài liệu tham khảo tuyệt vời.
1. Hồi quy Poisson là gì?
Chúng ta đã biết về hồi quy tuyến tính, giúp chúng ta trả lời các câu hỏi như một ngôi nhà với những đặc điểm này sẽ có giá bao nhiêu? Hoặc hồi quy logistic, được sử dụng để mô hình hóa xác suất của một lớp hoặc sự kiện nào đó hiện có như Pass/Fail, Win/Lose, Alive/Dead hoặc Healthy/Sick/Sick.
Nhưng, điều gì xảy ra khi các câu hỏi là có bao nhiêu người chi phí sẽ đến ngày hôm nay ?,, Có bao nhiêu người xếp hàng tại cửa hàng tạp hóa? Người mẫu.many…”, and one way to answer these questions is using the Poisson Regression Model.many…”, and one way to answer these questions is using the Poisson Regression Model.
Hồi quy Poisson được sử dụng để mô hình hóa dữ liệu. Đối với điều này, chúng tôi giả sử biến đáp ứng Y có phân phối Poisson và giả sử logarit của giá trị dự kiến của nó có thể được mô hình hóa bằng một kết hợp tuyến tính của các tham số chưa biết.
2. Phân phối Poisson như một phần của gia đình theo cấp số nhân
Được rồi, điều đầu tiên trước tiên, chúng ta có thể thể hiện phân phối Poisson trên dạng gia đình theo cấp số nhân không? Chà, chúng ta có thể tìm thấy điều đó. Đầu tiên, nếu chúng ta có một biến ngẫu nhiên x sao choFirst, if we have a random variable X such that
First, if we have a random variable X such that
Chúng tôi biết chúng tôi có thể thể hiện chức năng xác suất của nó như
Được rồi, bây giờ hãy để Lừa làm điều này, giả sử chúng ta có một biến ngẫu nhiên y được phân phối dưới dạng Poisson với một tham số λ
với chức năng xác suất của nó
Chúng ta biết rằng
và như vậy
Nhưng đợi một phút, phương trình [2] có dạng giống như phương trình [1]
và như vậy
Nhưng đợi một phút, phương trình [2] có dạng giống như phương trình [1]
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa
Được chứ! Bây giờ, giả sử chúng tôi có một biến ngẫu nhiên y, chẳng hạn như
và cho [3] bây giờ chúng ta có thể thể hiện chức năng xác suất của nó là
Hồi tưởng
và như vậy
Nhưng đợi một phút, phương trình [2] có dạng giống như phương trình [1]
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa
Được chứ! Bây giờ, giả sử chúng tôi có một biến ngẫu nhiên y, chẳng hạn như
và cho [3] bây giờ chúng ta có thể thể hiện chức năng xác suất của nó là
Hồi tưởng
Và chúng tôi biết cho GLM rằng
và như vậy
Nhưng đợi một phút, phương trình [2] có dạng giống như phương trình [1]
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa
Được chứ! Bây giờ, giả sử chúng tôi có một biến ngẫu nhiên y, chẳng hạn như
và cho [3] bây giờ chúng ta có thể thể hiện chức năng xác suất của nó là
và như vậy
Nhưng đợi một phút, phương trình [2] có dạng giống như phương trình [1]
Cuối cùng chúng ta có thể nói
3. Phương pháp log-khả năng đăng nhập tối đa
Được chứ! Bây giờ, giả sử chúng tôi có một biến ngẫu nhiên y, chẳng hạn như
và cho [3] bây giờ chúng ta có thể thể hiện chức năng xác suất của nó là
Hồi tưởng
Và chúng tôi biết cho GLM rằng
Được rồi, bây giờ nếu chúng ta có một bộ quan sát m
nơi chúng ta giả định cho mỗi y^[i] là i.i.d. Và chúng tôi đang tìm cách tối đa hóa chức năng xác suất sau
Bây giờ chúng tôi sử dụng bí mật của mình không phải là vũ khí bí mật, phương pháp khả năng tối đa
và đối với phương pháp log-khả năng đăng nhập tối đa
Vì log [1/y!] Không phụ thuộc vào W ∗ hoặc B ∗
def loss[x, y, w, b]:
y_hat = np.exp[x @ w + b]
error = [y_hat - np.log[y_hat] * y].mean[]
return error
và vì chúng tôi muốn giảm thiểu thay vì tối đa hóa
def grad[x, y, w, b]:
M, n = x.shape
y_hat = np.exp[x @ w + b]
dw = [x.T @ [y_hat - y]] / M
db = [y_hat - y].mean[]
return dw, dbdef gradient_descent[x, y, w_0, b_0, alpha, num_iter]:
w, b = w_0.copy[], b_0
hist = np.zeros[num_iter]
M, n = x.shapefor iter in range[num_iter]:
dw, db = grad[x, y, w, b]
w -= alpha * dw
b -= alpha * db
hist[iter] = loss[x, y, w, b]return w, b, hist
Nhưng chúng tôi biết
Và bởi vì chúng tôi muốn trung bình
Làm thế nào để bạn sử dụng mô hình Poisson trong Python?
Phân phối Poisson mô tả xác suất đạt được K thành công trong một khoảng thời gian nhất định. Nếu một biến ngẫu nhiên x tuân theo phân phối Poisson, thì xác suất có thể tìm thấy thành công x = k bằng công thức sau: p [x = k] = λk * e, / k!P[X=k] = λk * e–λ / k!P[X=k] = λk * e–λ / k!
Có phải hồi quy Poisson giống như hồi quy tuyến tính?
Các mô hình này có một số lợi thế so với mô hình hồi quy tuyến tính thông thường, bao gồm độ lệch, phân phối riêng biệt và hạn chế các giá trị dự đoán đối với các số không âm. Một mô hình Poisson tương tự như hồi quy tuyến tính thông thường, với hai ngoại lệ.A Poisson model is similar to an ordinary linear regression, with two exceptions.A Poisson model is similar to an ordinary linear regression, with two exceptions.
Có phải hồi quy Poisson giống như hồi quy logistic?
Hồi quy Poisson được sử dụng phổ biến nhất để phân tích tỷ lệ, trong khi hồi quy logistic được sử dụng để phân tích tỷ lệ.Chương này xem xét các mô hình thống kê cho số lượng các sự kiện ngẫu nhiên xảy ra độc lập và được tính ở các cấp độ khác nhau của một hoặc nhiều kết quả phân loại.. The chapter considers statistical models for counts of independently occurring random events, and counts at different levels of one or more categorical outcomes.. The chapter considers statistical models for counts of independently occurring random events, and counts at different levels of one or more categorical outcomes.
Tôi có thể sử dụng hồi quy Poisson với kết quả nhị phân không?
Hồi quy Poisson không thể chỉ được sử dụng cho tỷ lệ tính mà còn cho các biến kết quả nhị phân.Hồi quy Poisson của dữ liệu kết quả nhị phân khác với hồi quy logistic, bởi vì nó sử dụng nhật ký thay vì logit [tỷ lệ cược log] biến đổi biến phụ thuộc.Nó có xu hướng cung cấp số liệu thống kê tốt hơn.. Poisson regression of binary outcome data is different from logistic regression, because it uses a log instead of logit [log odds] transformed dependent variable. It tends to provide better statistics.. Poisson regression of binary outcome data is different from logistic regression, because it uses a log instead of logit [log odds] transformed dependent variable. It tends to provide better statistics.