Hướng dẫn how do i skip rows while reading excel in python? - làm cách nào để bỏ qua các hàng trong khi đọc excel trong python?

Tôi biết đối số

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
4 trong
#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
5 cho phép bạn chọn các cột cụ thể.

Giả sử tôi đọc một tệp excel trong với

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
5. Bảng tính Excel của tôi có 1161 hàng. Tôi muốn giữ hàng đầu tiên (với chỉ mục 0) và bỏ qua các hàng 2: 337. Có vẻ như đối số
#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
7 chỉ hoạt động khi có 0 lập chỉ mục. Tôi không biết liệu tôi có thể sai hay không, nhưng một vài lần chạy mã của tôi luôn tạo ra đầu ra đọc tất cả 1161 hàng của tôi thay vì chỉ sau hàng thứ 337. Chẳng hạn như thế này:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "336",
                                        usecols = "H:BD")

Đây là một nỗ lực khác của những gì tôi đã thiết lập.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")

Tôi muốn DataFrame loại trừ các hàng từ 2 đến 337 trong nhập Excel ban đầu.


Bạn có thể sử dụng các phương thức sau để bỏ qua các hàng khi đọc tệp CSV vào gấu trúc DataFrame:

Phương pháp 1: Bỏ qua một hàng cụ thể

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])

Phương pháp 2: Bỏ qua một số hàng cụ thể

#import DataFrame and skip 2nd and 4th row
df = pd.read_csv('my_data.csv', skiprows=[2, 4])

Phương pháp 3: Bỏ qua các hàng đầu tiên

#import DataFrame and skip first 2 rows
df = pd.read_csv('my_data.csv', skiprows=2)

Các ví dụ sau đây cho thấy cách sử dụng từng phương thức trong thực tế với tệp CSV sau có tên là rổ bóng rổ_data.csv:basketball_data.csv:

Hướng dẫn how do i skip rows while reading excel in python? - làm cách nào để bỏ qua các hàng trong khi đọc excel trong python?

Ví dụ 1: Bỏ qua một hàng cụ thể

Chúng ta có thể sử dụng mã sau để nhập tệp CSV và bỏ qua hàng thứ hai:

import pandas as pd

#import DataFrame and skip 2nd row
df = pd.read_csv('basketball_data.csv', skiprows=[2])

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6
2	D	30	2

Lưu ý rằng hàng thứ hai (với nhóm ‘B,) đã bị bỏ qua khi nhập tệp CSV vào khung dữ liệu gấu trúc.

Lưu ý: Hàng đầu tiên trong tệp CSV được coi là hàng 0.: The first row in the CSV file is considered to be row 0.

Ví dụ 2: Bỏ qua một số hàng cụ thể

Chúng ta có thể sử dụng mã sau để nhập tệp CSV và bỏ qua các hàng thứ hai và thứ tư:

import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd.read_csv('basketball_data.csv', skiprows=[2, 4])

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6

Lưu ý rằng các hàng thứ hai và thứ tư (với nhóm ‘B, và‘ D,) đã được bỏ qua khi nhập tệp CSV vào khung dữ liệu Pandas.

Ví dụ 3: Bỏ qua các hàng đầu tiên

Chúng ta có thể sử dụng mã sau để nhập tệp CSV và bỏ qua hai hàng đầu tiên:

import pandas as pd

#import DataFrame and skip first 2 rows
df = pd.read_csv('basketball_data.csv', skiprows=2)

#view DataFrame
df

        B	14	9
0	C	29	6
1	D	30	2

Lưu ý rằng hai hàng đầu tiên trong tệp CSV đã bị bỏ qua và hàng có sẵn tiếp theo (với nhóm ‘B,) đã trở thành hàng tiêu đề cho DataFrame.

Tài nguyên bổ sung

Các hướng dẫn sau đây giải thích cách thực hiện các nhiệm vụ phổ biến khác trong Python:

Cách đọc các tệp Excel có gấu trúc Cách xuất DataFrame để xuất sắc
How to Export Pandas DataFrame to Excel
How to Export NumPy Array to CSV File

Hướng dẫn how do i skip rows while reading excel in python? - làm cách nào để bỏ qua các hàng trong khi đọc excel trong python?

Sử dụng ILOC để thả hàng đầu tiên của Pandas DataFrame ..

Thư viện Python Panda, cung cấp một chức năng để đọc tệp CSV và tải dữ liệu vào DataFrame trực tiếp cũng bỏ qua các dòng được chỉ định từ tệp CSV, tức là.

pandas.read_csv(filepath_or_buffer, skiprows=N, ....)

Nó có thể chấp nhận số lượng lớn các đối số. Nhưng ở đây chúng tôi sẽ thảo luận về một vài lập luận quan trọng chỉ là.Argument:
Arguments:

  • FILEPATH_OR_BUFFER: Đường dẫn của tệp CSV hoặc đối tượng của nó. : path of a csv file or it’s object.
  • Bỏ qua: Số dòng để bỏ qua trong khi đọc CSV. : Line numbers to skip while reading csv.
    • Nếu nó là một int thì hãy bỏ qua các dòng đó từ đầu
    • Nếu nó có một danh sách các int thì bỏ qua các dòng tại các vị trí chỉ mục đó
    • Nếu nó có một hàm có thể gọi thì hãy chuyển từng chỉ mục cho chức năng này để kiểm tra xem dòng để bỏ qua hay không.

Nó sẽ đọc tệp CSV đã cho bằng cách bỏ qua các dòng được chỉ định và tải các dòng còn lại vào DataFrame.

Để sử dụng mô -đun Pandas nhập khẩu này như thế này,

import pandas as pd

Hãy để hiểu biết bởi các ví dụ,

Quảng cáo

Giả sử chúng ta có một tệp CSV đơn giản.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
0

Hãy để tải tệp CSV này vào DataFrame bằng read_csv () và bỏ qua các hàng theo những cách khác nhau,

Bỏ qua n hàng từ trên cùng trong khi đọc tệp CSV sang DataFrame

Trong khi gọi pandas.read_csv () nếu chúng ta chuyển đối số bỏ qua với giá trị int, thì nó sẽ bỏ qua các hàng đó từ trên cùng trong khi đọc tệp CSV và khởi tạo DataFrame. Ví dụ: nếu chúng ta muốn bỏ qua 2 dòng từ trên cùng trong khi đọc tệp user.csv và khởi tạo một dataFrame, tức là.skiprows argument with int value, then it will skip those rows from top while reading csv file and initializing a dataframe.
For example if we want to skip 2 lines from top while reading users.csv file and initializing a dataframe i.e.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
1

Đầu ra:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
2

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame

Trong khi gọi pandas.read_csv () nếu chúng ta chuyển đối số bỏ qua dưới dạng danh sách INTS, thì nó sẽ bỏ qua các hàng từ CSV tại các chỉ số được chỉ định trong danh sách. Trong khi đọc tệp user.csv và khởi tạo một dataFrame, tức là.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
3

Đầu ra:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
4

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
So, if our csv file has header row and we want to skip first 2 data rows then we need to pass a list to skiprows i.e.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
5

Đầu ra:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
6

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
Let’s skip rows in csv file whose index position is multiple of 3 i.e. skip every 3rd line while reading csv file and loading dataframe out of it,

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
7

Đầu ra:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
8

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")
9

Đầu ra:

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
0

Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 (tại INDEX 2) làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.skipfooter otherwise we will get a warning like this,

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
1

Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?

#import DataFrame and skip 2nd row
df = pd.read_csv('my_data.csv', skiprows=[2])
2

Output:

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
 

Làm thế nào để bạn bỏ qua một hàng trong Python?

Một trong những phương thức tốt nhất là phương thức Readlines () cho các tệp và bỏ qua bất kỳ đầu ra mã cụ thể nào hoặc tạo khoảng cách, vượt qua hoặc kết hợp in in () là những phương pháp tốt nhất và hiệu quả nhất. Bỏ qua các dòng hoặc đầu ra cũng giúp thiết kế đối xứng hoặc in đầu ra trong nhiều ứng dụng và hệ thống dựa trên mẫu.pass or if-print() combination are the best and the most efficient ones. Skipping lines or output also helps in symmetrically design or print output in many apps and pattern-based systems.

Làm thế nào để bạn bỏ qua một cột trong Excel trong Python?

Bỏ qua các cột từ tờ Excel Đôi khi trong khi đọc một tờ Excel vào Pandas DataFrame Bạn có thể cần phải bỏ qua các cột, bạn có thể làm điều này bằng cách sử dụng param usecols.Điều này lấy các giá trị {int, str, giống như danh sách hoặc mặc định có thể gọi không}.Để chỉ định danh sách các tên hoặc vị trí cột, sử dụng danh sách các chuỗi hoặc danh sách int.using usecols param. This takes values {int, str, list-like, or callable default None}. To specify the list of column names or positions use a list of strings or a list of int.

Làm cách nào để bỏ qua hàng đầu tiên trong một khung dữ liệu trong Python?

Thả hàng đầu tiên của Pandas DataFrame (3 cách)..
Sử dụng ILOC để thả hàng đầu tiên của Pandas DataFrame ..
Sử dụng Drop () để xóa hàng đầu tiên của gấu trúc DataFrame ..
Sử dụng hàm đuôi () để loại bỏ hàng đầu tiên của gấu trúc dữ liệu ..

Làm thế nào để bạn đọc một hàng trong Excel bằng Python?

# Nhập mô -đun XLRD ..
Nhập XLRD ..
# Xác định vị trí của tệp ..
loc = ("đường dẫn của tệp").
# Để mở sổ làm việc ..
wb = xlrd.open_workbook (loc).
trang tính = wb.sheet_by_index (0).
# Cho hàng 0 và cột 0 ..