Hướng dẫn how do you remove blank rows from a dataframe in python? - làm cách nào để xóa các hàng trống khỏi khung dữ liệu trong python?
Tế bào trốngCác ô trống có khả năng cho bạn một kết quả sai khi bạn phân tích dữ liệu. Show
Xóa hàngMột cách để đối phó với các ô trống là loại bỏ các hàng có chứa các ô trống. Điều này thường ổn, vì các bộ dữ liệu có thể rất lớn và việc loại bỏ một vài hàng sẽ không có tác động lớn đến kết quả. Thí dụTrả về một khung dữ liệu mới mà không có ô trống: nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () print(new_df.to_string()) Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số Thí dụTrả về một khung dữ liệu mới mà không có ô trống: nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () Hãy tự mình thử » Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True:Xóa tất cả các hàng bằng các giá trị null: df.dropna (tại chỗ = true) in (df.to_string ())) Thí dụTrả về một khung dữ liệu mới mà không có ô trống: nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số Xóa tất cả các hàng bằng các giá trị null: Thí dụTrả về một khung dữ liệu mới mà không có ô trống: nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số Xóa tất cả các hàng bằng các giá trị null: Thí dụTrả về một khung dữ liệu mới mà không có ô trống: nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () Hãy tự mình thử » Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức Thí dụTrả về một khung dữ liệu mới mà không có ô trống: nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () Hãy tự mình thử » Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức Thí dụNếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số nhập khẩu gấu trúc dưới dạng PD df = pd.read_csv ('data.csv') new_df = df.dropna () Hãy tự mình thử » Hãy tự mình thử » Lưu ý: Theo mặc định, phương thức Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True:Xóa tất cả các hàng bằng các giá trị null:
df.dropna (tại chỗ = true)
Nhanh hơn bạn nghĩ 3 là một hoạt động vector hóa, điều này nhanh hơn mọi tùy chọn được trình bày cho đến nay.Ít nhất, từ các bài kiểm tra của tôi.Ymmv.Đây là một so sánh thời gian, tôi đã ném vào một số phương pháp khác mà tôi có thể nghĩ đến. Mã điểm chuẩn, để tham khảo: |