Hướng dẫn read last row of csv python pandas - đọc hàng cuối cùng của csv python gấu trúc
Chỉ cần sử dụng 8 và 9 và 0. Bạn thậm chí có thể điều chỉnh số lượng hàng. Show
Result:
Điều chỉnh 8 và 9 để lấy 5 hàng từ trên cùng và 10 từ dưới cùng ...
Một cách tiếp cận có thể được sử dụng nếu bạn không muốn tải toàn bộ tệp CSV như một DataFrame là xử lý chúng dưới dạng CSV. Mã sau đây tương tự như cách tiếp cận của bạn.
Kết quả là như nhau, ngoại trừ chỉ số. Được thử nghiệm so với một triệu hàng và nó đã được xử lý trong khoảng một giây.
Làm thế nào nó quy mô so với 15 triệu hàng, có thể đó là trò chơi bóng của bạn bây giờ. Vì vậy, tôi quyết định kiểm tra nó so với chính xác 15.728.626 hàng và kết quả có vẻ đủ tốt. in (đánh giá_df. head ()). Xây dựng vấn đềĐưa ra: Hãy xem xét tệp CSV sau (Lưu ý: Bạn cần sử dụng nó như một gấu trúc DataFrame).Consider the following csv file (Note: You need to use it as a Pandas DataFrame). import pandas as pd df = pd.read_csv('countries.csv') print(df) Country Capital Population Area 0 Germany Berlin 84,267,549 348,560 1 France Paris 65,534,239 547,557 2 Spain Madrid 46,787,468 498,800 3 Italy Rome 60,301,346 294,140 4 India Delhi 1,404,495,187 2,973,190 5 USA Washington 334,506,463 9,147,420 6 China Beijing 1,449,357,022 9,388,211 7 Poland Warsaw 37,771,789 306,230 8 Russia Moscow 146,047,418 16,376,870 9 England London 68,529,747 241,930 Tại đây, danh sách các câu hỏi mà chúng tôi sẽ tập trung vào bài viết này:
Được đề xuất Đọc: Cách chọn Hàng từ DataFrame dựa trên các giá trị cột? Không chậm trễ hơn nữa, chúng ta hãy đi sâu vào các giải pháp cho câu hỏi đầu tiên và tìm hiểu làm thế nào để có được n hàng cuối cùng của một khung dữ liệu gấu trúc. Phương pháp 1: Sử dụng ILOCCách tiếp cận: Sử dụng thuộc tính 3 property as 4.Thuộc tính 3 được sử dụng để có hoặc đặt các giá trị của các chỉ số được chỉ định. Chọn n hàng cuối cùng bằng cú pháp ký hiệu khung vuông [-N:] với thuộc tính 3. Ở đây, -n đại diện cho chỉ số của n hàng cuối cùng của DataFrame Pandas đã cho.n rows using the square bracket notation syntax [-n:] with the 3 property. Here, -n represents the index of the last n rows of
the given pandas DataFrame. Code: import pandas as pd df = pd.read_csv('countries.csv') rows = df.iloc[-5:] print(rows) Output: Country Capital Population Area 5 USA Washington 334,506,463 9,147,420 6 China Beijing 1,449,357,022 9,388,211 7 Poland Warsaw 37,771,789 306,230 8 Russia Moscow 146,047,418 16,376,870 9 England London 68,529,747 241,930 Phương pháp 2: Sử dụng đuôi ()Cách tiếp cận: Sử dụng 7 to select the last n rows of the given DataFrame.Phương thức 8 trả về n số phương thức từ đầu dưới của dataFrame. Ở đây, n đại diện cho một số nguyên biểu thị số lượng hàng bạn muốn tìm nạp từ đầu dưới cùng của khung dữ liệu.n number of methods from the bottom end of the DataFrame. Here, n represents an integer that denotes the number of rows you want to fetch from the bottom end of the
DataFrame. Code: 0Output: Country Capital Population Area 5 USA Washington 334,506,463 9,147,420 6 China Beijing 1,449,357,022 9,388,211 7 Poland Warsaw 37,771,789 306,230 8 Russia Moscow 146,047,418 16,376,870 9 England London 68,529,747 241,930 Chà, điều đó đưa chúng ta đến câu hỏi tiếp theo - Làm thế nào để có được n hàng cuối cùng từ n cột cuối cùng của một bản dữ liệu gấu trúc?“How to get the last N rows from last N columns of a Pandas DataFrame?” Phương pháp 1: Lập chỉ mục dựa trên số nguyênInteger Based IndexingCách tiếp cận: Gọi 9 to display last n rows from the last m columns of the given DataFrame.Mã: Trong đoạn mã sau đây, chúng tôi sẽ tìm được 5 hàng cuối cùng từ 2 cột cuối cùng, tức là, dân số và khu vực. In the following code snippet we will fetch the last 5 rows from the last 2 columns, i.e., Population and Area. 2Output: 3Phương pháp 2: Lập chỉ mục dựa trên tênName Based IndexingTrong trường hợp, bạn tình cờ biết tên của các cột cụ thể và bạn muốn lấy n bản ghi cuối cùng từ khung dữ liệu từ các cột đó thì bạn có thể làm theo quy trình hai bước.N records from the DataFrame from those columns then you can follow a two step process.
Mã: Đoạn mã sau cho thấy cách bạn có thể sử dụng tên cột và tìm nạp các giá trị tương ứng từ 5 hàng cuối cùng của DataFrame đã cho. The following code snippet shows how you can use the column names and fetch the corresponding values from the last 5 rows of the given Dataframe. 4Output: 3Cuối cùng nhưng không kém phần quan trọng, chúng ta hãy giải quyết vấn đề thứ ba và cuối cùng của hướng dẫn hôm nay - Cách đọc n hàng cuối cùng của một tập tin CSV lớn trong gấu trúc?How to read last N rows of a large csv file in Pandas?” Thật không may, 4 không tạo điều kiện cho chúng tôi bất kỳ tham số nào cho phép bạn đọc trực tiếp các dòng N cuối cùng từ một tệp. Đây có thể là một vấn đề rắc rối để xử lý khi bạn đang xử lý các bộ dữ liệu lớn.N lines from a file. This can be a troublesome issue to handle when you are dealing with large datasets. Do đó, một cách giải quyết cho vấn đề này là trước tiên tìm hiểu tổng số dòng/bản ghi trong tệp. Sau đó sử dụng tham số 5 để trực tiếp nhảy vào hàng/dòng mà bạn muốn chọn các bản ghi.Mã: Trong đoạn mã sau, chúng tôi sẽ tìm được 5 hàng đầu tiên từ tệp CSV vào DataFrame của chúng tôi. In the following code snippet we will fetch the first 5 rows from the csv file into our DataFrame. 6Output: 7Sự kết luậnPhew! Chúng tôi đã giải quyết thành công tất cả các vấn đề được trình bày cho chúng tôi trong hướng dẫn này. & nbsp; Tôi hy vọng hướng dẫn này đã giúp bạn mài giũa kỹ năng mã hóa của bạn. Xin vui lòng & nbsp; Hãy theo dõi & nbsp; và & nbsp; đăng ký & nbsp; để biết các vấn đề mã hóa thú vị hơn.stay tuned and subscribe for more interesting coding problems. Đề xuất đọc:
Học gấu con cách thú vị bằng cách giải các câu đố mãNếu bạn muốn tăng kỹ năng gấu trúc của mình, hãy xem xét kiểm tra cuốn sách học tập dựa trên câu đố của tôi Coffee Break Pandas (Amazon Link). Nó chứa 74 câu đố gấu trúc thủ công bao gồm các giải thích. Bằng cách giải quyết từng câu đố, bạn sẽ nhận được một số điểm đại diện cho cấp độ kỹ năng của bạn trong gấu trúc. Bạn có thể trở thành một Grandmaster Gandas không? Coffee Break Pandas cung cấp một cách tiếp cận dựa trên niềm vui để làm chủ khoa học dữ liệu và một trải nghiệm học tập thực sự được chơi game. Tôi là một blogger Python chuyên nghiệp và người tạo nội dung. Tôi đã xuất bản nhiều bài báo và tạo ra các khóa học trong một khoảng thời gian. Hiện tại tôi đang làm việc như một freelancer toàn thời gian và tôi có kinh nghiệm trong các lĩnh vực như Python, AWS, DevOps và Mạng. Bạn có thể liên lạc với tôi @: Upwork LinkedIn in (đánh giá_df. head ()).in (đánh giá_df. head ()).
Bước 1: Để đọc các hàng trong Python, trước tiên, chúng ta cần tải tệp CSV trong một đối tượng. Vì vậy, để tải tệp CSV vào một đối tượng sử dụng phương thức Open (). Bước 2: Tạo một đối tượng đầu đọc bằng cách chuyển đối tượng tệp được tạo ở trên cho hàm đầu đọc. Bước 3: Sử dụng cho vòng lặp trên đối tượng đầu đọc để có được mỗi hàng.in (đánh giá_df. head ()).Using the Pandas iloc[-1] attribute you can select the last row of the DataFrame. iloc[] is used to select the single row or column by using an index. iloc[-1] property return the last row of DataFrame in the form of Pandas Series.
Nhận hàng cuối cùng của gấu trúc bằng ILOC [] bằng thuộc tính Pandas ILOC [-1] Bạn có thể chọn hàng cuối cùng của DataFrame.ILOC [] được sử dụng để chọn một hàng hoặc cột bằng cách sử dụng chỉ mục.thuộc tính ILOC [-1] Trả về hàng cuối cùng của DataFrame dưới dạng sê-ri Pandas.Làm cách nào để đọc một hàng tệp CSV theo hàng trong Python bằng Pandas?. Đọc tệp CSV. Tải CSV vào DataFrame: Nhập Pandas dưới dạng PD.df = pd.read_csv ('data.csv') .... In DataFrame mà không cần phương thức TO_STRING (): Nhập gấu trúc dưới dạng pd..... Tăng số lượng hàng tối đa để hiển thị toàn bộ DataFrame: Nhập Pandas dưới dạng PD .. Làm cách nào để làm cho gấu trúc chỉ đọc một vài hàng?Làm cách nào để làm gấu trúc chỉ đọc một vài hàng ?.. df_firstn = pd.read_csv (file_path, nrows = n) df_firstn = pd.Read_csv (file_path, nRows = n). Hình dạng dữ liệu: (100, 2) Hình dạng dữ liệu: (100, 2). in (review_df. head ()) in (Review_df.head ()). Hình dạng dữ liệu: (100, 2) Hình dạng dữ liệu: (100, 2). in (đánh giá_df. head ()). |