Phương pháp phương sai sai số thay đổi

 MBA Bách Khoa trình bài về khái niệm phương sai sai số thay đổi: định nghĩa, cách phát hiện, cách khắc phục phương sai sai số thay đổi sử dụng phần mềm Stata.

Định nghĩa phương sai của sai số thay đổi

     Một giả thiết quan trọng trong mô hình hồi quy tuyến tính cổ điển là các yếu tố  nhiễu ui [hay còn gọi là phần dư residuals] xuất hiện trong hàm hồi quy tổng thể có phương sai không thay đổi [homoscedasticity,  còn gọi là phương sai có điều kiện không đổi]; tức là chúng có cùng phương sai. Nếu giả thiết này không được thỏa mãn thì có sự hiện diện của phương sai thay đổi. Phương sai thay đổi [Heteroscedasticity, còn gọi là phương sai của sai số thay đổi] .

     Phương sai thay đổi không làm mất đi tính chất không thiên lệch và nhất quán của các ước lượng OLS. Nhưng các ước lượng này không còn có phương sai nhỏ nhất hay là các ước lượng hiệu quả. Tức là chúng không còn là các ước lượng tuyến tính không thiên lệch tốt nhất [BLUE]. Khi có phương sai thay đổi, các phương sai của các ước lượng OLS không được tính từ các công thức OLS thông thường. Nhưng nếu ta vẫn sử dụng các công thức OLS thông thường, các kiểm định t và F dựa vào chúng có thể gây ra những kết luận sai lầm.

Cách phát hiện phương sai sai số thay đổi trong Stata

Kiểm định phương sai sai số thay đổi trong mô hình hồi quy tuyến tính đa biến OLS

hai cách chính để kiểm định phương sai sai số thay đổi trong Stata,đó là dùng kiểm định White , hoặc dùng kiểm định Breusch-Pagan

Cách 1: Dùng kiểm định White để kiểm tra phương sai thay đổi[ White’s test]

Cú pháp lệnh:

estat imtest

Cách 2: Dùng kiểm định Breusch-Pagan

            estat hettest

Cách đọc kết quả: hai cách trên ,nếu p-value 5%, lúc đó phương sai đồng nhất, phương sai không đổi].

Kiểm định phương sai sai số thay đổi trong mô hình hồi quy dữ liệu bảng sử dụng fix và random effect

     Phương sai sai số thay đổi heteroskedasticity của mô hình REM: [sử dụng kiểm định LM – Breusch and pagan Lagrangian Multiplier ]. Dùng lệnh xttest0, nếu  p-value < 0.05, bác bỏ Ho [với phát biểu  Ho: Phương sai qua các thực thể là không đổi][ làm bài mong đợi p-value >5% để kết luận phương sai ko đổi]

     Phương sai sai số thay đổi heteroskedasticity của mô hình FEM[ dùng kiểm định wald]: Dùng lệnh xttest3 [lệnh này không có sẵn trong Stata, phải cài thêm bằng lệnh ssc install xttest3] . Nếu  p-value < 0.05, bác bỏ Ho [với phát biểu  Ho: Phương sai qua các thực thể là không đổi][ làm bài mong đợi p-value >5% để kết luận phương sai ko đổi]

Full PDF PackageDownload Full PDF Package

This Paper

A short summary of this paper

2 Full PDFs related to this paper

Download

PDF Pack

NỘI DUNG

 Khái niệm PSSSTĐ

   Hậu quả PSSSTĐ

    Phát hiện PSSSTĐ

      Khắc phục PSSSTĐ

Chào các bạn,

Một trong những giả định của mô hình hồi quy tuyến tính là phương sai của sai số phải như nhau [gọi là homoskedasticity]. Việc vi phạm giả định này sẽ gây ra hiện tượng phương sai sai số thay đổi. Trong bài viết này, mình sẽ giới thiệu với các bạn một cách chi tiết nhất về hiện tượng này nhé.

1. Định nghĩa:

Phương sai sai số thay đổi là hiện tượng mà phương sai của các sai số ước lượng không bằng nhau. Từ heteroscedasticity nghĩa là unequal variance. Hiện tượng này thường hay xảy ra đối với dữ liệu cắt ngang [cross-sectional data].

2. Nguyên nhân xuất hiện:

Nguyên nhân chính dẫn đến sự xuất hiện của hiện tượng này có lẽ là do sự tồn tại của các outliers trong biến. Outliers là các quan sát của biến mà có giá trị quá khác biệt so với các quan sát còn lại. Hoặc là các quan sát của cùng một biến nhưng lại được đo lường với những thang đo khác nhau. Ví dụ khi đo lường thu nhập, bạn dùng đơn vị tỷ đồng cho những người có thu nhập cao, nhưng lại vô tình dùng đơn vị triệu đồng cho những người có thu nhập thấp hơn. Ngoài ra, hiện tượng này cũng có thể xảy ra trong trường hợp sai dạng hàm hoặc sai sót trong quá trình biến đổi dữ liệu.

3. Hậu quả:

Nếu như mô hình chỉ xảy ra lỗi phương sai sai số thay đổi thôi thì ước lượng OLS vẫn là ước lượng ko bị thiên lệch và nhất quán [unbiased and consistent], tuy nhiên nó không phải là ước lượng tốt nhất [hiệu quả nhất] nữa. Bởi vì, phương sai của sai số trong trường hợp này không thể đạt được giá trị nhỏ nhất nữa. Khi đó, các kiểm định hệ số hồi quy và kiểm định F của mô hình trở nên không đáng tin cậy. Vì vậy, việc đưa ra các kết luận dựa trên các kiểm định này sẽ không chính xác.

4. Cách phát hiện:

Mình sẽ sử dụng bộ dữ liệu auto có sẵn của STATA để minh hoạ nhé. Để sử dụng bộ dữ liệu này thì các bạn chỉ cần gõ lệnh sysuse auto.dta là được.

hai cách phát hiện hiện tượng này: đó là dùng hình vẽ hoặc dùng các kiểm định.

Cách 1: Vẽ đồ thị giữa sai số và giá trị ước lượng của biến Y và quan sát

Đầu tiên mình sẽ chạy hồi quy mô hình PRICE = alpha + beta1*MPG + beta2*WEIGHT

Mình đang kiểm tra xem mức độ hao xăng và trọng lượng của xe thì có ảnh hưởng ntn đến giá thành của một chiếc xe.

Sau đó, mình sẽ dùng lệnh rvfplot để có thể vẽ được đồ thị giữa sai số và giá trị ước lượng của biến phụ thuộc trong mô hình. Mình thêm một cái option trong câu lệnh là yline[0] để đồ thị hiện ra đường thẳng tại mức sai số = 0. Giá trị 0 là giá trị trung bình của sai số. 

 

Các chấm xanh trong hình vẽ thể hiện cho vị trí của các sai số đối với từng giá trị ước lượng của biến Y [fitted values]. Nếu khoảng cách của các chấm xanh này đến đường giá trị trung bình tương tự nhau thì chúng ta có thể ngầm hiểu là không có hiện tượng phương sai sai số thay đổi xảy ra. Tuy nhiên, trong hình vẽ trên, ta thấy càng về phía bên phải thì các chấm xanh càng cách xa đường giá trị trung bình hơn. Điều này ngầm báo hiệu cho chúng ta rằng có hiện tượng phương sai sai số thay đổi xảy ra. Ta có thể dùng các kiểm định chuyên dụng để kiểm tra lại lần nữa cho chắc.

Cách 2: Dùng các kiểm định chuyên dụng

Có 2 kiểm định mà chúng ta có thể sử dụng đó là kiểm định Breusch-Pagan và kiểm định White. Cả hai kiểm định này đều có cùng một giả thuyết, đó là:

Ho: Phương sai sai số là bằng nhau/không đổi [Constant variance/Homoskedasticity]

H1: Phương sai sai số không bằng nhau/thay đổi [Unequal variance/Heteroskedasticity]

Nếu như chúng ta bác bỏ giả thuyết Ho thì nghĩa là mô hình hồi quy có hiện tượng phương sai sai số thay đổi. Ngược lại nếu chúng ta chấp nhận giả thuyết H0 thì nghĩa là không có hiện tượng PSSS thay đổi xảy ra.

Cả hai kiểm định này đều sẽ cung cấp cho chúng ta một hệ số thống kê đi cùng với giá trị P-value tương ứng. Như vậy, nếu P-value>=0.1 thì chúng ta có thể an tâm không thể bác bỏ giả thuyết H0 và vì vậy mô hình của chúng ta okay. Ngược lại, nếu P-value

Chủ Đề