Làm thế nào tôi có thể thay thế một ngoại lệ từ một cột của một gấu trúc DataFrame bằng giá trị trung bình của cột?
Tôi đã thử theo cách này:
median = dt[feature].median[]
std = dt[feature].std[]
outliers = [dt[feature] - median].abs[] > std
dt[outliers] = np.nan
dt[feature].fillna[median, inplace=True]
Nhưng DataFrame 1000 x 784 của tôi trở thành 0 x 784 daframe
sa mạc
54,8K21 Huy hiệu vàng132 Huy hiệu bạc161 Huy hiệu đồng21 gold badges132 silver badges161 bronze badges
hỏi ngày 26 tháng 4 lúc 13:20Apr 26 at 13:20
Tôi nghĩ bạn nên làm điều đó như thế này thay thế:
median = dt[feature].median[]
std = dt[feature].std[]
dt.loc[[dt[feature] - median].abs[] > std,feature]=np.nan
dt[feature].fillna[median, inplace=True]
Tôi đoán đó là vấn đề của bạn với mã cũ của bạn là:
dt[outliers] = np.nan
Đã trả lời ngày 26 tháng 4 lúc 14:38Apr 26 at 14:38
DatascirookiedatascirookieDataSciRookie
7881 Huy hiệu vàng2 Huy hiệu bạc10 Huy hiệu đồng1 gold badge2 silver badges10 bronze badges
Pandas loại bỏ các ngoại lệ cho nhiều cột với các ví dụ mã
Trong bài viết này, giải pháp của gấu trúc loại bỏ các ngoại lệ cho nhiều cột sẽ được chứng minh bằng cách sử dụng các ví dụ từ ngôn ngữ lập trình.
def cap_data[df]: for col in df.columns: print["capping the ",col] if [[[df[col].dtype]=='float64'] | [[df[col].dtype]=='int64']]: percentiles = df[col].quantile[[0.01,0.99]].values df[col][df[col] = percentiles[1]] = percentiles[1] else: df[col]=df[col] return df final_df=cap_data[df]
Sử dụng nhiều ví dụ khác nhau, chúng tôi đã học cách giải quyết các gấu trúc loại bỏ các ngoại lệ cho nhiều cột.
Làm thế nào để bạn loại bỏ các ngoại lệ khỏi nhiều cột?
Thường thì bạn có thể muốn loại bỏ các ngoại lệ khỏi nhiều cột cùng một lúc trong R. Làm thế nào để xóa các ngoại lệ khỏi nhiều cột trong r
- Bước 1: Tạo khung dữ liệu.
- Bước 2: Xác định hàm ngoại lệ.
- Bước 3: Áp dụng chức năng ngoại lệ vào khung dữ liệu.
Làm thế nào để bạn loại bỏ các ngoại lệ trong gấu trúc DF?
Cách loại bỏ các ngoại lệ khỏi khung dữ liệu gấu trúc trong Python
- print[df]
- z_scores = số liệu thống kê. Zscore [DF] tính toán các điểm z của `df`
- abs_z_scores = np. abs [z_scores]
- Đã lọc_entries = [abs_z_scores