Hướng dẫn drop column in python dataframe - thả cột trong khung dữ liệu python

DataFrame.drop (nhãn = none, axis = 0, index = none, cột = none, level = none, inplace = falsedrop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')[source]#

Thả nhãn được chỉ định từ các hàng hoặc cột.

Xóa các hàng hoặc cột bằng cách chỉ định tên nhãn và trục tương ứng hoặc bằng cách chỉ định tên chỉ mục hoặc tên cột trực tiếp. Khi sử dụng đa chỉ số, các nhãn ở các cấp độ khác nhau có thể được xóa bằng cách chỉ định mức. Xem Hướng dẫn sử dụng để biết thêm thông tin về các cấp độ chưa được sử dụng.

Nhãn tham sốlabelssingle hoặc giống như danh sáchlabelssingle label or list-like

Chỉ mục hoặc nhãn cột để thả. Một tuple sẽ được sử dụng như một nhãn duy nhất và không được coi là giống như một danh sách.

trục {0 hoặc ‘index, 1 hoặc‘ cột,}, mặc định 0{0 or ‘index’, 1 or ‘columns’}, default 0

Cho dù thả nhãn từ chỉ mục (0 hoặc ‘chỉ mục) hoặc các cột (1 hoặc‘ cột,).

Nhãn chỉ mục hoặc giống như danh sáchsingle label or list-like

Thay thế để chỉ định trục (labels, axis=0 tương đương với index=labels).

Nhãn cột hoặc giống như Danh sáchsingle label or list-like

Thay thế để chỉ định trục (

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
0 tương đương với
>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
1).

tên cấp độ hoặc tên cấp, tùy chọnint or level name, optional

Đối với đa dạng, mức từ đó các nhãn sẽ được gỡ bỏ.

inplaceBool, mặc định saibool, default False

Nếu sai, hãy trả lại một bản sao. Nếu không, thực hiện hoạt động tại chỗ và không trả lại.

Lỗi {’bỏ qua,‘ nâng cao}, mặc định ‘nâng cao{‘ignore’, ‘raise’}, default ‘raise’

Nếu ‘bỏ qua, thì việc ngăn chặn lỗi và chỉ các nhãn hiện có bị loại bỏ.

ReturnSdatAframe hoặc không có

DataFrame mà không có nhãn chỉ mục hoặc nhãn cột bị xóa hoặc không có nếu

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
2.

Risiskeyerror

Nếu bất kỳ nhãn nào không được tìm thấy trong trục đã chọn.

Xem thêm

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
3

Chỉ số dựa trên địa điểm đặt nhãn để lựa chọn theo nhãn.

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
4

Trả về DataFrame với các nhãn trên trục đã cho bị bỏ qua trong đó dữ liệu (tất cả hoặc bất kỳ) nào bị thiếu.

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
5

Trả về DataFrame với các hàng trùng lặp bị xóa, tùy chọn chỉ xem xét các cột nhất định.

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
6

Return Series với các nhãn chỉ mục được chỉ định bị xóa.

Ví dụ

>>> df = pd.DataFrame(np.arange(12).reshape(3, 4),
...                   columns=['A', 'B', 'C', 'D'])
>>> df
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

Thả cột

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11

>>> df.drop(columns=['B', 'C'])
   A   D
0  0   3
1  4   7
2  8  11

Thả một hàng theo chỉ mục

>>> df.drop([0, 1])
   A  B   C   D
2  8  9  10  11

Thả các cột và/hoặc hàng của multiindex DataFrame

>>> midx = pd.MultiIndex(levels=[['lama', 'cow', 'falcon'],
...                              ['speed', 'weight', 'length']],
...                      codes=[[0, 0, 0, 1, 1, 1, 2, 2, 2],
...                             [0, 1, 2, 0, 1, 2, 0, 1, 2]])
>>> df = pd.DataFrame(index=midx, columns=['big', 'small'],
...                   data=[[45, 30], [200, 100], [1.5, 1], [30, 20],
...                         [250, 150], [1.5, 0.8], [320, 250],
...                         [1, 0.8], [0.3, 0.2]])
>>> df
                big     small
lama    speed   45.0    30.0
        weight  200.0   100.0
        length  1.5     1.0
cow     speed   30.0    20.0
        weight  250.0   150.0
        length  1.5     0.8
falcon  speed   320.0   250.0
        weight  1.0     0.8
        length  0.3     0.2

Thả một kết hợp chỉ mục cụ thể từ khung dữ liệu đa dạng, tức là, thả kết hợp

>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
7 và
>>> df.drop(['B', 'C'], axis=1)
   A   D
0  0   3
1  4   7
2  8  11
8, chỉ xóa hàng

>>> df.drop(index=('falcon', 'weight'))
                big     small
lama    speed   45.0    30.0
        weight  200.0   100.0
        length  1.5     1.0
cow     speed   30.0    20.0
        weight  250.0   150.0
        length  1.5     0.8
falcon  speed   320.0   250.0
        length  0.3     0.2

>>> df.drop(index='cow', columns='small')
                big
lama    speed   45.0
        weight  200.0
        length  1.5
falcon  speed   320.0
        weight  1.0
        length  0.3

>>> df.drop(index='length', level=1)
                big     small
lama    speed   45.0    30.0
        weight  200.0   100.0
cow     speed   30.0    20.0
        weight  250.0   150.0
falcon  speed   320.0   250.0
        weight  1.0     0.8

Làm cách nào để loại bỏ một cột khỏi DataFrame trong Python?

Để xóa các hàng và cột khỏi DataFrames, Pandas sử dụng chức năng của Drop Drop. Để xóa một cột hoặc nhiều cột, hãy sử dụng tên của (các) cột và chỉ định trục của Trục là 1. Ngoài ra, như trong ví dụ dưới đây, tham số 'cột' đã được thêm vào cần 'trục'.use the name of the column(s), and specify the “axis” as 1. Alternatively, as in the example below, the 'columns' parameter has been added in Pandas which cuts out the need for 'axis'.

Làm cách nào để thả một cột trong một khung dữ liệu?

Trong quá trình hoạt động phân tích dữ liệu trên DataFrame, bạn có thể cần phải thả một cột trong gấu trúc. Bạn có thể thả cột trong gấu trúc DataFrame bằng cách sử dụng câu lệnh df.drop (Cột cột_name, trục = 1, inplace = true).df. drop(“column_name”, axis=1, inplace=True) statement.

Làm cách nào để thả một cột trong bộ dữ liệu trong Python?

Cách phổ biến nhất để loại bỏ một cột là sử dụng df.drop ().Đôi khi, lệnh del trong Python cũng được sử dụng.df. drop() . Sometimes, del command in Python is also used.

Làm cách nào để thả một cột trong loạt gấu trúc?

Thả nhãn được chỉ định từ các hàng hoặc cột.Xóa các hàng hoặc cột bằng cách chỉ định tên nhãn và trục tương ứng hoặc bằng cách chỉ định tên chỉ mục hoặc tên cột trực tiếp.Khi sử dụng đa chỉ số, các nhãn ở các cấp độ khác nhau có thể được xóa bằng cách chỉ định mức.