Tôi biết đối số
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]4 trong
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]5 cho phép bạn chọn các cột cụ thể.
Giả sử tôi đọc một tệp excel trong với
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]5. Bảng tính Excel của tôi có 1161 hàng. Tôi muốn giữ hàng đầu tiên [với chỉ mục 0] và bỏ qua các hàng 2: 337. Có vẻ như đối số
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]7 chỉ hoạt động khi có 0 lập chỉ mục. Tôi không biết liệu tôi có thể sai hay không, nhưng một vài lần chạy mã của tôi luôn tạo ra đầu ra đọc tất cả 1161 hàng của tôi thay vì chỉ sau hàng thứ 337. Chẳng hạn như thế này:
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "336",
usecols = "H:BD"]
Đây là một nỗ lực khác của những gì tôi đã thiết lập.
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
Tôi muốn DataFrame loại trừ các hàng từ 2 đến 337 trong nhập Excel ban đầu.
Bạn có thể sử dụng các phương thức sau để bỏ qua các hàng khi đọc tệp CSV vào gấu trúc DataFrame:
Phương pháp 1: Bỏ qua một hàng cụ thể
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]
Phương pháp 2: Bỏ qua một số hàng cụ thể
#import DataFrame and skip 2nd and 4th row df = pd.read_csv['my_data.csv', skiprows=[2, 4]]
Phương pháp 3: Bỏ qua các hàng đầu tiên
#import DataFrame and skip first 2 rows df = pd.read_csv['my_data.csv', skiprows=2]
Các ví dụ sau đây cho thấy cách sử dụng từng phương thức trong thực tế với tệp CSV sau có tên là rổ bóng rổ_data.csv:basketball_data.csv:
Ví dụ 1: Bỏ qua một hàng cụ thể
Chúng ta có thể sử dụng mã sau để nhập tệp CSV và bỏ qua hàng thứ hai:
import pandas as pd #import DataFrame and skip 2nd row df = pd.read_csv['basketball_data.csv', skiprows=[2]] #view DataFrame df team points rebounds 0 A 22 10 1 C 29 6 2 D 30 2
Lưu ý rằng hàng thứ hai [với nhóm ‘B,] đã bị bỏ qua khi nhập tệp CSV vào khung dữ liệu gấu trúc.
Lưu ý: Hàng đầu tiên trong tệp CSV được coi là hàng 0.: The first row in the CSV file is considered to be row 0.
Ví dụ 2: Bỏ qua một số hàng cụ thể
Chúng ta có thể sử dụng mã sau để nhập tệp CSV và bỏ qua các hàng thứ hai và thứ tư:
import pandas as pd #import DataFrame and skip 2nd and 4th rows df = pd.read_csv['basketball_data.csv', skiprows=[2, 4]] #view DataFrame df team points rebounds 0 A 22 10 1 C 29 6
Lưu ý rằng các hàng thứ hai và thứ tư [với nhóm ‘B, và‘ D,] đã được bỏ qua khi nhập tệp CSV vào khung dữ liệu Pandas.
Ví dụ 3: Bỏ qua các hàng đầu tiên
Chúng ta có thể sử dụng mã sau để nhập tệp CSV và bỏ qua hai hàng đầu tiên:
import pandas as pd #import DataFrame and skip first 2 rows df = pd.read_csv['basketball_data.csv', skiprows=2] #view DataFrame df B 14 9 0 C 29 6 1 D 30 2
Lưu ý rằng hai hàng đầu tiên trong tệp CSV đã bị bỏ qua và hàng có sẵn tiếp theo [với nhóm ‘B,] đã trở thành hàng tiêu đề cho DataFrame.
Tài nguyên bổ sung
Các hướng dẫn sau đây giải thích cách thực hiện các nhiệm vụ phổ biến khác trong Python:
Cách đọc các tệp Excel có gấu trúc Cách xuất DataFrame để xuất sắc
How to Export Pandas DataFrame to Excel
How to Export NumPy Array to CSV File
Sử dụng ILOC để thả hàng đầu tiên của Pandas DataFrame ..
Thư viện Python Panda, cung cấp một chức năng để đọc tệp CSV và tải dữ liệu vào DataFrame trực tiếp cũng bỏ qua các dòng được chỉ định từ tệp CSV, tức là.
pandas.read_csv[filepath_or_buffer, skiprows=N, ....]
Nó có thể chấp nhận số lượng lớn các đối số. Nhưng ở đây chúng tôi sẽ thảo luận về một vài lập luận quan trọng chỉ là.Argument:
Arguments:
- FILEPATH_OR_BUFFER: Đường dẫn của tệp CSV hoặc đối tượng của nó. : path of a csv file or it’s object.
- Bỏ qua: Số dòng để bỏ qua trong khi đọc CSV. : Line numbers to skip while reading csv.
- Nếu nó là một int thì hãy bỏ qua các dòng đó từ đầu
- Nếu nó có một danh sách các int thì bỏ qua các dòng tại các vị trí chỉ mục đó
- Nếu nó có một hàm có thể gọi thì hãy chuyển từng chỉ mục cho chức năng này để kiểm tra xem dòng để bỏ qua hay không.
Nó sẽ đọc tệp CSV đã cho bằng cách bỏ qua các dòng được chỉ định và tải các dòng còn lại vào DataFrame.
Để sử dụng mô -đun Pandas nhập khẩu này như thế này,
import pandas as pd
Hãy để hiểu biết bởi các ví dụ,
Quảng cáo
Giả sử chúng ta có một tệp CSV đơn giản.
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
0Hãy để tải tệp CSV này vào DataFrame bằng read_csv [] và bỏ qua các hàng theo những cách khác nhau,
Bỏ qua n hàng từ trên cùng trong khi đọc tệp CSV sang DataFrame
Trong khi gọi pandas.read_csv [] nếu chúng ta chuyển đối số bỏ qua với giá trị int, thì nó sẽ bỏ qua các hàng đó từ trên cùng trong khi đọc tệp CSV và khởi tạo DataFrame. Ví dụ: nếu chúng ta muốn bỏ qua 2 dòng từ trên cùng trong khi đọc tệp user.csv và khởi tạo một dataFrame, tức là.skiprows argument with int value, then it will skip those rows from top while reading csv file and initializing a dataframe.
For example if we want to skip 2 lines from top while reading users.csv file and initializing a dataframe i.e.
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
1Đầu ra:
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
2Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 [tại INDEX 2] làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.
Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?
Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
Trong khi gọi pandas.read_csv [] nếu chúng ta chuyển đối số bỏ qua dưới dạng danh sách INTS, thì nó sẽ bỏ qua các hàng từ CSV tại các chỉ số được chỉ định trong danh sách. Trong khi đọc tệp user.csv và khởi tạo một dataFrame, tức là.
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
3Đầu ra:
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
4Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 [tại INDEX 2] làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.
Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?
Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
So, if our csv file has header row and we want
to skip first 2 data rows then we need to pass a list to skiprows i.e.
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
5Đầu ra:
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
6Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 [tại INDEX 2] làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.
Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?
Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame
Let’s skip rows in csv file whose index position is multiple of 3 i.e. skip every 3rd line while reading csv file and loading dataframe out of it,
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
7Đầu ra:
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
8Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 [tại INDEX 2] làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.
Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?
documentationscore_dataframe = pd.read_excel["Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
sheet_name = "Sheet1",
skiprows = "1:336",
usecols = "H:BD"]
9Đầu ra:
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]0
Nó đã bỏ qua 2 dòng trên cùng từ CSV và sử dụng dòng thứ 3 [tại INDEX 2] làm hàng tiêu đề và tải các hàng còn lại từ CSV dưới dạng các hàng dữ liệu trong DataFrame.skipfooter otherwise we will get a warning like this,
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]1
Bây giờ điều gì sẽ xảy ra nếu chúng ta muốn bỏ qua một số hàng cụ thể trong khi đọc CSV?
#import DataFrame and skip 2nd row df = pd.read_csv['my_data.csv', skiprows=[2]]2
Output:
Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp CSV đến DataFrame