Giá trị dị biệt là gì

Giá trị ngoại biên - dị biệt [ouliers] _ Cách xử lý đơn giản

Giá trị ngoại biên hay các dị biệt trong dữ liệu mẫu
Về nguyên tắc xử lý dị biệt là loại bỏ các quan sát dị biệt trong mẫu tuy nhiên cần lưu ý rằng các giá trị dị biệt thường chứa đựng rất nhiều thông tin hữu ích cần nghiên cứu trong chủ đề nghiên cứu của đề tài [ tất nhiên trừ trường hợp dị biệt do sai sót về nhập dữ liệu].
Phân tách các quan sát dị biệt:
Phân tách các quan sát dị biệt đối với biến liên tục ta dùng phân phối chuẩn hóa.
B1: Tạo một biến mới với giá trị là giá trị chuẩn hóa của biến cần xem xét dị biệt
z= [X-Xtb]/sigma
B2: Thống kê biến mới [z]
B3: Loại bỏ các quan sát giá trị có z >3
Phân tách các quan sát dị biết đối với biến rời rạc ta dùng tứ phân vị.
B1: Tính toán tứ phân vị Q1, Q2, Q3
B2: Tính khoảng cách D = Q3-Q1
B3: Xác định giá trị ngưỡng: X1 = Q1-1.5D và X2 = Q3+1.5D
B4: Loại bỏ các giá trị nằm ngoài khoảng X1,X2
at1:24 PM
Share

Video liên quan

Chủ Đề