Hướng dẫn what does skiprows mean in python? - trong python nghĩa là gì?

Hướng dẫn what does skiprows mean in python? - trong python nghĩa là gì?

Trong bài viết này, chúng tôi sẽ thảo luận về cách bỏ qua các hàng từ trên cùng, dưới hoặc tại các chỉ số cụ thể trong khi đọc tệp CSV và tải nội dung vào DataFrame.

Thư viện Python Panda, cung cấp một chức năng để đọc tệp CSV và tải dữ liệu vào DataFrame trực tiếp cũng bỏ qua các dòng được chỉ định từ tệp CSV, tức là.

pandas.read_csv(filepath_or_buffer, skiprows=N, ....)

Nó có thể chấp nhận số lượng lớn các đối số. Nhưng ở đây chúng tôi sẽ thảo luận về một vài lập luận quan trọng chỉ là.Argument:
Arguments:

  • FILEPATH_OR_BUFFER: Đường dẫn của tệp CSV hoặc đối tượng của nó. : path of a csv file or it’s object.
  • Bỏ qua: Số dòng để bỏ qua trong khi đọc CSV. : Line numbers to skip while reading csv.
    • Nếu nó là một int thì hãy bỏ qua các dòng đó từ đầu
    • Nếu nó có một danh sách các int thì bỏ qua các dòng tại các vị trí chỉ mục đó
    • Nếu nó có một hàm có thể gọi thì hãy chuyển từng chỉ mục cho chức năng này để kiểm tra xem dòng để bỏ qua hay không.

Nó sẽ đọc tệp CSV đã cho bằng cách bỏ qua các dòng được chỉ định và tải các dòng còn lại vào DataFrame.

Để sử dụng mô -đun Pandas nhập khẩu này như thế này,

import pandas as pd

Hãy để hiểu biết bởi các ví dụ,

Quảng cáo

Giả sử chúng ta có một tệp CSV đơn giản.

>>cat users.txt
Name,Age,City
jack,34,Sydeny
Riti,31,Delhi
Aadi,16,New York
Suse,32,Lucknow
Mark,33,Las vegas
Suri,35,Patna

Hãy để tải tệp CSV này vào DataFrame bằng read_csv () và bỏ qua các hàng theo những cách khác nhau,

Bỏ qua n hàng từ trên cùng trong khi đọc tệp CSV sang DataFrame

Trong khi gọi pandas.read_csv () nếu chúng ta chuyển đối số bỏ qua với giá trị int, thì nó sẽ bỏ qua các hàng đó từ trên cùng trong khi đọc tệp CSV và khởi tạo DataFrame. Ví dụ: nếu chúng ta muốn bỏ qua 2 dòng từ trên cùng trong khi đọc tệp user.csv và khởi tạo một dataFrame, tức là.skiprows argument with int value, then it will skip those rows from top while reading csv file and initializing a dataframe.
For example if we want to skip 2 lines from top while reading users.csv file and initializing a dataframe i.e.

# Skip 2 rows from top in csv and initialize a dataframe
usersDf = pd.read_csv('users.csv', skiprows=2)

print('Contents of the Dataframe created by skipping top 2 lines from csv file ')
print(usersDf)

Đầu ra:

Contents of the Dataframe created by skipping top 2 lines from csv file 
   Riti  31      Delhi
0  Aadi  16   New York
1  Suse  32    Lucknow
2  Mark  33  Las vegas
3  Suri  35      Patna

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame

Trong khi gọi pandas.read_csv () nếu chúng ta chuyển đối số bỏ qua dưới dạng danh sách INTS, thì nó sẽ bỏ qua các hàng từ CSV tại các chỉ số được chỉ định trong danh sách. Trong khi đọc tệp user.csv và khởi tạo một dataFrame, tức là.

# Skip  rows at specific index
usersDf = pd.read_csv('users.csv', skiprows=[0,2,5])

print('Contents of the Dataframe created by skipping specifying lines from csv file ')
print(usersDf)

Đầu ra:

Contents of the Dataframe created by skipping specifying lines from csv file 
   jack  34    Sydeny
0  Aadi  16  New York
1  Suse  32   Lucknow
2  Suri  35     Patna

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
So, if our csv file has header row and we want to skip first 2 data rows then we need to pass a list to skiprows i.e.

# Skip 2 rows from top except header
usersDf = pd.read_csv('users.csv', skiprows=[i for i in range(1,3)])

print('Contents of the Dataframe created by skipping 2 rows after header row from csv file ')
print(usersDf)

Đầu ra:

Contents of the Dataframe created by skipping 2 rows after header row from csv file 
   Name  Age       City
0  Aadi   16   New York
1  Suse   32    Lucknow
2  Mark   33  Las vegas
3  Suri   35      Patna

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
Let’s skip rows in csv file whose index position is multiple of 3 i.e. skip every 3rd line while reading csv file and loading dataframe out of it,

def logic(index):
    if index % 3 == 0:
       return True
    return False


# Skip rows from based on condition like skip every 3rd line
usersDf = pd.read_csv('users.csv', skiprows= lambda x: logic(x) )

print('Contents of the Dataframe created by skipping every 3rd row from csv file ')
print(usersDf)

Đầu ra:

import pandas as pd
0

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

import pandas as pd
1

Đầu ra:

import pandas as pd
2

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.skipfooter otherwise we will get a warning like this,

import pandas as pd
3

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

import pandas as pd
4

Output:

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
 

Làm thế nào để bạn sử dụng bỏ qua trong gấu trúc?

Pandas: Cách bỏ qua các hàng khi đọc tệp CSV..
Phương pháp 1: Bỏ qua một hàng cụ thể #Import DataFrame và Bỏ qua hàng thứ 2 DF = PD.....
Phương pháp 2: Bỏ qua một số hàng cụ thể #Import DataFrame và Bỏ qua hàng thứ 2 và thứ 4 df = pd.....
Phương pháp 3: Bỏ qua đầu tiên n hàng #Import dataFrame và bỏ qua 2 hàng đầu tiên df = pd ..

Làm cách nào để đọc các hàng cụ thể trong gấu trúc?

Làm cách nào để đọc một hàng cụ thể trong một khung dữ liệu trong Python ?..
Bước 1: Thiết lập dữ liệu ..
Bước 2: Nhập dữ liệu CSV ..
Bước 3: Chọn hàng từ Pandas DataFrame ..
Chọn các hàng gấu trúc bằng thuộc tính ILOC ..
Chọn các hàng gấu trúc bằng thuộc tính LỘC ..

Bạn sẽ sửa đổi tham số nào sau đây trong hàm Pandas Read_CSV nếu bạn không muốn đọc một vài hàng trên cùng của tệp CSV?

read_csv () Nếu chúng ta chuyển đối số bỏ qua với giá trị INT, thì nó sẽ bỏ qua các hàng đó từ trên cùng trong khi đọc tệp CSV và khởi tạo DataFrame.Ví dụ: nếu chúng ta muốn bỏ qua 2 dòng từ trên cùng trong khi đọc người dùng.Tệp CSV và khởi tạo DataFrame, tức là.skiprows argument with int value, then it will skip those rows from top while reading csv file and initializing a dataframe. For example if we want to skip 2 lines from top while reading users. csv file and initializing a dataframe i.e.