Hướng dẫn how do you replace outliers in multiple columns in python? - làm thế nào để bạn thay thế các giá trị ngoại lai trong nhiều cột trong python?

Làm thế nào tôi có thể thay thế một ngoại lệ từ một cột của một gấu trúc DataFrame bằng giá trị trung bình của cột?

Tôi đã thử theo cách này:

median = dt[feature].median[]
std = dt[feature].std[]
outliers = [dt[feature] - median].abs[] > std
dt[outliers] = np.nan
dt[feature].fillna[median, inplace=True]

Nhưng DataFrame 1000 x 784 của tôi trở thành 0 x 784 daframe

sa mạc

54,8K21 Huy hiệu vàng132 Huy hiệu bạc161 Huy hiệu đồng21 gold badges132 silver badges161 bronze badges

hỏi ngày 26 tháng 4 lúc 13:20Apr 26 at 13:20

Tôi nghĩ bạn nên làm điều đó như thế này thay thế:

median = dt[feature].median[]
std = dt[feature].std[]
dt.loc[[dt[feature] - median].abs[] > std,feature]=np.nan
dt[feature].fillna[median, inplace=True]

Tôi đoán đó là vấn đề của bạn với mã cũ của bạn là:

dt[outliers] = np.nan

Đã trả lời ngày 26 tháng 4 lúc 14:38Apr 26 at 14:38

DatascirookiedatascirookieDataSciRookie

7881 Huy hiệu vàng2 Huy hiệu bạc10 Huy hiệu đồng1 gold badge2 silver badges10 bronze badges

Pandas loại bỏ các ngoại lệ cho nhiều cột với các ví dụ mã

Trong bài viết này, giải pháp của gấu trúc loại bỏ các ngoại lệ cho nhiều cột sẽ được chứng minh bằng cách sử dụng các ví dụ từ ngôn ngữ lập trình.

def cap_data[df]:
    for col in df.columns:
        print["capping the ",col]
        if [[[df[col].dtype]=='float64'] | [[df[col].dtype]=='int64']]:
            percentiles = df[col].quantile[[0.01,0.99]].values
            df[col][df[col] = percentiles[1]] = percentiles[1]
        else:
            df[col]=df[col]
    return df
final_df=cap_data[df]

Sử dụng nhiều ví dụ khác nhau, chúng tôi đã học cách giải quyết các gấu trúc loại bỏ các ngoại lệ cho nhiều cột.

Làm thế nào để bạn loại bỏ các ngoại lệ khỏi nhiều cột?

Thường thì bạn có thể muốn loại bỏ các ngoại lệ khỏi nhiều cột cùng một lúc trong R. Làm thế nào để xóa các ngoại lệ khỏi nhiều cột trong r

  • Bước 1: Tạo khung dữ liệu.
  • Bước 2: Xác định hàm ngoại lệ.
  • Bước 3: Áp dụng chức năng ngoại lệ vào khung dữ liệu.

Làm thế nào để bạn loại bỏ các ngoại lệ trong gấu trúc DF?

Cách loại bỏ các ngoại lệ khỏi khung dữ liệu gấu trúc trong Python

  • print[df]
  • z_scores = số liệu thống kê. Zscore [DF] tính toán các điểm z của `df`
  • abs_z_scores = np. abs [z_scores]
  • Đã lọc_entries = [abs_z_scores

Bài Viết Liên Quan

Chủ Đề