Hướng dẫn how do i remove a specific character from a dataframe in python? - làm cách nào để xóa một ký tự cụ thể khỏi khung dữ liệu trong python?

Bạn có thể sử dụng DataFrame.replace và để chọn sử dụng subset:

df = pd.DataFrame[{'A':[1,2,3],
                   'B':[4,5,6],
                   'C':['f;','d:','sda;sd'],
                   'D':['s','d;','d;p'],
                   'E':[5,3,6],
                   'F':[7,4,3]}]

print [df]
   A  B       C    D  E  F
0  1  4      f;    s  5  7
1  2  5      d:   d;  3  4
2  3  6  sda;sd  d;p  6  3

cols_to_check = ['C','D', 'E']

print [df[cols_to_check]]
        C    D  E
0      f;    s  5
1      d:   d;  3
2  sda;sd  d;p  6

df[cols_to_check] = df[cols_to_check].replace[{';':''}, regex=True]
print [df]
   A  B      C   D  E  F
0  1  4      f   s  5  7
1  2  5     d:   d  3  4
2  3  6  sdasd  dp  6  3

Để xóa các ký tự khỏi các cột trong Pandas DataFrame, hãy sử dụng phương thức replace[~].

Xem xét các dữ liệu sau:

df = pd.DataFrame[{"A":["a","ab","cc"]}]

df

A

0 a

1 ab

2 cc

Để xóa tất cả các chuỗi con

df['my_column'] = df['my_column'].str.replace['\W', '', regex=True]
0 khỏi cột
df['my_column'] = df['my_column'].str.replace['\W', '', regex=True]
1:

df['my_column'] = df['my_column'].str.replace['\W', '', regex=True]
3

Để loại bỏ tất cả các chuỗi con ____10 hoặc

df['my_column'] = df['my_column'].str.replace['\W', '', regex=True]
6:

df['my_column'] = df['my_column'].str.replace['\W', '', regex=True]
8

Ở đây,

import pandas as pd

#create DataFrame
df = pd.DataFrame[{'team' : ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   'points' : [12, 15, 22, 29, 24]}]

#view DataFrame
print[df]

      team  points
0    Mavs$      12
1     Nets      15
2  Kings!!      22
3   Spurs%      29
4   &Heat&      24
0 là regex và phù hợp với bất kỳ ký tự nào là
import pandas as pd

#create DataFrame
df = pd.DataFrame[{'team' : ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   'points' : [12, 15, 22, 29, 24]}]

#view DataFrame
print[df]

      team  points
0    Mavs$      12
1     Nets      15
2  Kings!!      22
3   Spurs%      29
4   &Heat&      24
1 hoặc
import pandas as pd

#create DataFrame
df = pd.DataFrame[{'team' : ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   'points' : [12, 15, 22, 29, 24]}]

#view DataFrame
print[df]

      team  points
0    Mavs$      12
1     Nets      15
2  Kings!!      22
3   Spurs%      29
4   &Heat&      24
2.

Để loại bỏ các chuỗi con khỏi Pandas DataFrame, vui lòng tham khảo công thức của chúng tôi ở đây.here.

Bạn có thể sử dụng cú pháp cơ bản sau để xóa các ký tự đặc biệt khỏi cột trong Pandas DataFrame:

df['my_column'] = df['my_column'].str.replace['\W', '', regex=True]

Ví dụ cụ thể này sẽ xóa tất cả các ký tự trong my_column không phải là chữ cái hoặc số.my_column that are not letters or numbers.

Ví dụ sau đây cho thấy cách sử dụng cú pháp này trong thực tế.

Giả sử chúng ta có khung dữ liệu Pandas sau đây có chứa thông tin về các cầu thủ bóng rổ khác nhau:

import pandas as pd

#create DataFrame
df = pd.DataFrame[{'team' : ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   'points' : [12, 15, 22, 29, 24]}]

#view DataFrame
print[df]

      team  points
0    Mavs$      12
1     Nets      15
2  Kings!!      22
3   Spurs%      29
4   &Heat&      24

Giả sử chúng tôi muốn xóa tất cả các ký tự đặc biệt khỏi các giá trị trong cột nhóm.team column.

Chúng ta có thể sử dụng cú pháp sau để làm như vậy:

#remove special characters from team column
df['team'] = df['team'].str.replace['\W', '', regex=True]

#view updated DataFrame
print[df]

    team  points
0   Mavs      12
1   Nets      15
2  Kings      22
3  Spurs      29
4   Heat      24

Lưu ý rằng tất cả các ký tự đặc biệt đã bị xóa khỏi các giá trị trong cột nhóm.team column.

Lưu ý: Regex \ W được sử dụng để tìm tất cả các ký tự không từ, tức là các ký tự không theo thứ tự bảng chữ cái hoặc số.: The regex \W is used to find all non-word characters, i.e. characters which are not alphabetical or numerical.

Trong ví dụ này, chúng tôi đã thay thế từng ký tự không từ bằng một giá trị trống tương đương với việc loại bỏ các ký tự không từ.

Tài nguyên bổ sung

Các hướng dẫn sau đây giải thích cách thực hiện các nhiệm vụ phổ biến khác trong gấu trúc:

Cách thay thế các giá trị NAN bằng các số không trong gấu trúc Cách thay thế các chuỗi trống bằng NAN trong gấu trúc Cách thay thế các giá trị trong cột dựa trên điều kiện trong gấu trúc
How to Replace Empty Strings with NaN in Pandas
How to Replace Values in Column Based on Condition in Pandas

Chủ Đề