Hướng dẫn how do you check for spaces in a dataframe in python? - làm cách nào để kiểm tra khoảng trắng trong khung dữ liệu trong python?

Trong hướng dẫn này, chúng tôi sẽ học cách chỉ kiểm tra không gian trong một cột của dataFrame bằng hàm isspace () trong pandas python

Hãy cùng xem với một ví dụ

Tạo một DataFrame

## create dataframe

import pandas as pd
d = {'Quarters' : [' ','quarter2','quarter3','quarter4'],
     'Revenue':[23400344.567,54363744.678,56789117.456,4132454.987]}
df=pd.DataFrame(d)
print df

DataFrame kết quả sẽ

Hướng dẫn how do you check for spaces in a dataframe in python? - làm cách nào để kiểm tra khoảng trắng trong khung dữ liệu trong python?

Kiểm tra không gian trong cột DataFrame trong Python

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df

ISSPACE () & nbsp; hàm trong Pandas Python có kiểm tra xem chuỗi chỉ bao gồm không gian. Function in pandas python checks whether the string consists of only space.

Nó trả về đúng khi chỉ có không gian và nó trả về sai khi nó không chỉ có không gian.True when only space is present and it returns False when it does not have only space.

Kết quả được lưu trữ trong cột Quarters_isspace của DataFrame.Quarters_isspace column of the dataframe.

Vì vậy, khung dữ liệu kết quả sẽ

Hướng dẫn how do you check for spaces in a dataframe in python? - làm cách nào để kiểm tra khoảng trắng trong khung dữ liệu trong python?

Hướng dẫn how do you check for spaces in a dataframe in python? - làm cách nào để kiểm tra khoảng trắng trong khung dữ liệu trong python?
& nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp;
Hướng dẫn how do you check for spaces in a dataframe in python? - làm cách nào để kiểm tra khoảng trắng trong khung dữ liệu trong python?

Tôi có một DataFrame

df['Car_Brand'][1]
'HYUNDAI                       '
1 chứa thông tin của các thương hiệu xe hơi. Ví dụ,

df['Car_Brand'][1]
'HYUNDAI                       '

trong đó độ dài của mỗi mục là giống nhau

df['Car_Brand'][1]
'HYUNDAI                       '
2. Tôi cũng có thể có các mục với chỉ có không gian trắng.

df['Car_Brand'] 

0          TOYOTA                        
1          HYUNDAI                       
2                                        
3                                        
4                                        
5          OPEL                          
6                                        
7          JAGUAR 

trong đó

df['Car_Brand'][1]
'HYUNDAI                       '
3

Tôi muốn bỏ khỏi DataFrame tất cả các mục với không gian trắng và giảm kích thước của các mục khác. Cuối cùng:

df['Car_Brand'][1]
'HYUNDAI                       '

trở thành

df['Car_Brand'][1]
'HYUNDAI'

Tôi bắt đầu loại bỏ các không gian withe, theo cách này:

tmp = df['Car_Brand'].str.replace(" ","")

Series.str.isspace()[source]#isspace()[source]#

Kiểm tra xem tất cả các ký tự trong mỗi chuỗi là khoảng trắng.

Điều này tương đương với việc chạy phương thức chuỗi Python

df['Car_Brand'][1]
'HYUNDAI                       '
4 cho mỗi phần tử của chuỗi/chỉ mục. Nếu một chuỗi có ký tự bằng không,
df['Car_Brand'][1]
'HYUNDAI                       '
5 sẽ được trả về cho kiểm tra đó.

ReturnSseries hoặc index of bool

Sê -ri hoặc chỉ mục của các giá trị Boolean có cùng độ dài với chuỗi/chỉ mục gốc.

Ví dụ

Kiểm tra các ký tự chữ cái và số

>>> s1 = pd.Series(['one', 'one1', '1', ''])

>>> s1.str.isalpha()
0     True
1    False
2    False
3    False
dtype: bool

>>> s1.str.isnumeric()
0    False
1    False
2     True
3    False
dtype: bool

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
0

Lưu ý rằng các kiểm tra đối với các ký tự được trộn với bất kỳ dấu câu bổ sung hoặc khoảng trắng nào sẽ đánh giá sai để kiểm tra chữ và số.

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
1

Kiểm tra chi tiết hơn cho các ký tự số

Có một số bộ ký tự số khác nhau nhưng chồng chéo có thể được kiểm tra.

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
2

Phương pháp

df['Car_Brand'][1]
'HYUNDAI                       '
6 kiểm tra các ký tự được sử dụng để tạo ra số trong cơ sở 10.

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
3

Phương pháp

df['Car_Brand'][1]
'HYUNDAI                       '
7 giống như
df['Car_Brand'][1]
'HYUNDAI                       '
6 nhưng cũng bao gồm các chữ số đặc biệt, như các chữ số được ghi chép và đăng ký trong Unicode.

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
4

Phương pháp

df['Car_Brand'][1]
'HYUNDAI                       '
9 giống như
df['Car_Brand'] 

0          TOYOTA                        
1          HYUNDAI                       
2                                        
3                                        
4                                        
5          OPEL                          
6                                        
7          JAGUAR 
0 nhưng cũng bao gồm các ký tự khác có thể đại diện cho các đại lượng như phân số unicode.

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
5

Kiểm tra khoảng trắng

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
6

Kiểm tra trường hợp nhân vật

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
7

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
8

# whether only space is present in Quarters column of dataframe in Python

df['Quarters_isspace'] = map(lambda x: x.isspace(), df['Quarters'])
print df
9

Phương pháp

df['Car_Brand'] 

0          TOYOTA                        
1          HYUNDAI                       
2                                        
3                                        
4                                        
5          OPEL                          
6                                        
7          JAGUAR 
1 kiểm tra xem tất cả các từ có trong trường hợp tiêu đề hay không (cho dù chỉ chữ cái đầu tiên của mỗi từ được viết hoa). Các từ được coi là bất kỳ chuỗi các ký tự không phải là số được phân tách bằng các ký tự khoảng trắng.

df['Car_Brand'][1]
'HYUNDAI                       '
0

Làm thế nào để bạn kiểm tra khoảng trắng trong một khung dữ liệu trong Python?

Kiểm tra xem tất cả các ký tự trong mỗi chuỗi là khoảng trắng.Điều này tương đương với việc chạy phương thức chuỗi python str.isspace () cho mỗi phần tử của chuỗi/chỉ mục.str. isspace() for each element of the Series/Index.

Làm thế nào để bạn loại bỏ các không gian bổ sung khỏi một khung dữ liệu trong Python?

Series.str.strip () để loại bỏ khoảng trắng khỏi chuỗi.Sử dụng chức năng dải, chúng ta có thể dễ dàng loại bỏ thêm khoảng trắng từ khoảng trắng dẫn đầu và kéo theo không bắt đầu. str. strip()” to remove the whitespace from the string. Using strip function we can easily remove extra whitespace from leading and trailing whitespace from starting.

Tên cột DataFrame có thể có khoảng trắng không?

Bạn có thể tham khảo tên cột có chứa khoảng trống hoặc toán tử bằng cách xung quanh chúng trong các backticks.Bằng cách này, bạn cũng có thể thoát khỏi các tên bắt đầu bằng một chữ số hoặc các tên là từ khóa Python.. This way you can also escape names that start with a digit, or those that are a Python keyword.

AT và loc giống nhau trong gấu trúc?

AT là một yếu tố duy nhất và sử dụng .loc có thể là một chuỗi hoặc một dataFrame.Trả lại giá trị đơn không phải là trường hợp luôn luôn.Nó trả về mảng các giá trị nếu chỉ mục được cung cấp được sử dụng nhiều lần. loc maybe a Series or a DataFrame. Returning single value is not the case always. It returns array of values if the provided index is used multiple times.