Làm cách nào để bạn ghi một khung dữ liệu vào tệp csv trong python?

Sau khi làm việc trên tập dữ liệu và thực hiện tất cả quá trình tiền xử lý, chúng tôi cần lưu dữ liệu đã được xử lý trước vào một số định dạng như trong csv, excel hoặc các định dạng khác

Mã nguồn python này thực hiện như sau.
1. Tạo từ điển dữ liệu và chuyển đổi nó thành khung dữ liệu
2. Lưu nó ở định dạng CSV

Vì vậy, đây là công thức về cách chúng tôi có thể lưu Pandas DataFrame dưới dạng tệp CSV

Bước 1 - Nhập thư viện

$ pip install pandas
8

Chúng tôi chỉ nhập gấu trúc cần thiết

Bước 2 - Thiết lập dữ liệu

Chúng tôi đã tạo một từ điển dữ liệu và chuyển nó vào pd. DataFrame để tạo khung dữ liệu với các cột 'first_name', 'last_name', 'age', 'Comedy_Score' và 'Rating_Score'.

$ pip install pandas
9

Bước 3 - Lưu DataFrame

Vì vậy, bây giờ chúng ta phải lưu tập dữ liệu mà chúng ta đã tạo. Chúng tôi lưu nó ở nhiều định dạng, ở đây chúng tôi đang thực hiện nó trong csv và excel bằng cách sử dụng hàm to_csv và to_excel tương ứng.

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
0 Vì vậy, đầu ra là hai tệp đã lưu, một ở định dạng csv và một ở định dạng excel

Mặc dù bạn có thể đọc và ghi các tệp CSV bằng Python bằng cách sử dụng hàm

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
1 tích hợp sẵn hoặc mô-đun csv chuyên dụng - bạn cũng có thể sử dụng Pandas

Trong bài viết này, bạn sẽ thấy cách sử dụng thư viện Pandas của Python để đọc và ghi tệp CSV

Tệp CSV là gì?

Hãy nhanh chóng tóm tắt lại tệp CSV là gì - không gì khác hơn là một tệp văn bản đơn giản, tuân theo một số quy ước định dạng. Tuy nhiên, đây là phương pháp phổ biến nhất, đơn giản và dễ dàng nhất để lưu trữ dữ liệu dạng bảng. Định dạng này sắp xếp các bảng theo một cấu trúc cụ thể được chia thành các hàng và cột. Chính những hàng và cột này chứa dữ liệu của bạn

Một dòng mới kết thúc mỗi hàng để bắt đầu hàng tiếp theo. Tương tự, dấu phân cách, thường là dấu phẩy, phân tách các cột trong mỗi hàng

Ví dụ: chúng ta có thể có một bảng trông như thế này

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |

Nếu chúng tôi chuyển đổi nó sang định dạng CSV, nó sẽ trông như thế này

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million

Mặc dù tên [Giá trị được phân tách bằng dấu phẩy] vốn đã sử dụng dấu phẩy làm dấu phân cách, nhưng bạn cũng có thể sử dụng các dấu phân cách [dấu phân cách] khác, chẳng hạn như dấu chấm phẩy [

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
2]. Mỗi hàng của bảng là một dòng mới của tệp CSV và đó là một cách rất ngắn gọn và súc tích để biểu thị dữ liệu dạng bảng

Bây giờ, hãy xem hàm

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
3

Đọc và ghi tệp CSV bằng Pandas

Pandas là một khung rất mạnh mẽ và phổ biến để phân tích và thao tác dữ liệu. Một trong những tính năng nổi bật nhất của Pandas là khả năng đọc và ghi nhiều loại tệp khác nhau bao gồm CSV và Excel. Bạn có thể thao tác các tệp CSV một cách hiệu quả và dễ dàng trong Pandas bằng các chức năng như

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
3 và
import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
5

Cài đặt gấu trúc

Chúng tôi phải cài đặt Pandas trước khi sử dụng nó. Hãy sử dụng

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
6

________số 8

Đọc tệp CSV bằng read_csv[]

Hãy nhập Bộ dữ liệu Titanic, có thể lấy trên GitHub

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']

Theo lẽ tự nhiên, gấu trúc sẽ tìm kiếm tệp này trong thư mục của tập lệnh và chúng tôi chỉ cung cấp đường dẫn tệp cho tệp mà chúng tôi muốn phân tích dưới dạng đối số bắt buộc duy nhất của phương pháp này

Hãy xem

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
7 của tập dữ liệu này để đảm bảo rằng nó được nhập chính xác

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
1

Kết quả này trong

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
2

Ngoài ra, bạn cũng có thể đọc các tệp CSV từ các tài nguyên trực tuyến, chẳng hạn như GitHub, chỉ bằng cách chuyển URL của tài nguyên tới hàm

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
3. Trước tiên, hãy đọc tệp CSV này từ kho lưu trữ GitHub mà không cần tải tệp xuống máy cục bộ của chúng tôi

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
4

Điều này cũng dẫn đến

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
5

Theo mặc định, phương pháp

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
3 sử dụng hàng đầu tiên của tệp CSV làm tiêu đề cột. Đôi khi, những tiêu đề này có thể có tên lạ và bạn có thể muốn sử dụng tiêu đề của riêng mình. Bạn có thể đặt tiêu đề sau khi đọc tệp, chỉ bằng cách gán trường
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
10 của phiên bản
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 vào một danh sách khác hoặc bạn có thể đặt tiêu đề trong khi đọc CSV ngay từ đầu

Hãy xác định danh sách tên cột và sử dụng các tên đó thay vì tên từ tệp CSV

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
9

Hãy chạy mã này

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
0

Hmm, bây giờ chúng tôi đã có các tiêu đề tùy chỉnh của mình, nhưng hàng đầu tiên của tệp CSV, ban đầu được sử dụng để đặt tên cột cũng được bao gồm trong

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11. Chúng tôi sẽ muốn bỏ qua dòng này, vì nó không còn giữ bất kỳ giá trị nào đối với chúng tôi nữa

Bỏ qua hàng khi đọc CSV

Hãy giải quyết vấn đề này bằng cách sử dụng đối số

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
13

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
0

Bây giờ, hãy chạy mã này

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
1

Hoạt động như một nét duyên dáng. Đối số

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
13 chấp nhận danh sách các hàng bạn muốn bỏ qua. Bạn có thể bỏ qua, ví dụ,
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
15 nếu bạn cũng muốn

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
2

Điều này sẽ dẫn đến một

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 không có một số hàng mà chúng ta đã thấy trước đây

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
3

Hãy xem hướng dẫn thực hành, thực tế của chúng tôi để học Git, với các phương pháp hay nhất, tiêu chuẩn được ngành chấp nhận và bao gồm bảng gian lận. Dừng các lệnh Git trên Google và thực sự tìm hiểu nó

Hãy nhớ rằng việc bỏ qua các hàng xảy ra trước khi

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 được hình thành đầy đủ, vì vậy bạn sẽ không thiếu bất kỳ chỉ mục nào của chính
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11, tuy nhiên, trong trường hợp này, bạn có thể thấy rằng trường
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
19 [được nhập từ tệp CSV] bị thiếu

Bạn cũng có thể quyết định loại bỏ hoàn toàn tiêu đề, điều này sẽ dẫn đến một

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 chỉ có các cột tiêu đề
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
23, bằng cách đặt đối số
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
24 thành
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
25

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
4

Bạn cũng sẽ muốn bỏ qua hàng đầu tiên ở đây, vì nếu không, các giá trị từ hàng đầu tiên sẽ thực sự được đưa vào hàng đầu tiên

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
5

Chỉ định dấu phân cách

Như đã nêu trước đó, cuối cùng bạn có thể gặp một tệp CSV không thực sự sử dụng dấu phẩy để phân tách dữ liệu. Trong những trường hợp như vậy, bạn có thể sử dụng đối số

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
26 để chỉ định các dấu phân cách khác

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
6

Viết tệp CSV bằng to_csv[]

Một lần nữa,

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 là dạng bảng. Biến một
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 thành một tệp CSV cũng đơn giản như chuyển một tệp CSV thành một
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 - chúng tôi gọi hàm
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
40 trên phiên bản
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11

Khi ghi

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 vào tệp CSV, bạn cũng có thể thay đổi tên cột, sử dụng đối số ________ 110 hoặc chỉ định dấu phân cách thông qua đối số ________ 126. Nếu bạn không chỉ định một trong hai điều này, thì bạn sẽ nhận được tệp Giá trị được phân tách bằng dấu phẩy chuẩn

Hãy chơi xung quanh với điều này

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
7

Ở đây, chúng tôi đã tạo một

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 đơn giản với hai thành phố và tiểu bang tương ứng của chúng. Sau đó, chúng tôi đã tiếp tục và lưu dữ liệu đó vào tệp CSV bằng cách sử dụng
import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
5 và cung cấp tên tệp

Điều này dẫn đến một tệp mới trong thư mục làm việc của tập lệnh bạn đang chạy, chứa

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
8

Mặc dù, điều này không thực sự được định dạng tốt. Chúng tôi vẫn có các chỉ mục từ

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11, điều này cũng đặt một vị trí bị thiếu kỳ lạ trước tên cột. Nếu chúng tôi nhập lại CSV này vào một
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11, nó sẽ trở thành một mớ hỗn độn

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
9

Kết quả này trong

$ pip install pandas
0

Các chỉ số từ

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 cuối cùng đã trở thành một cột mới, bây giờ là
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
50

Khi lưu tệp, hãy đảm bảo bỏ chỉ mục của

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11

$ pip install pandas
1

Bây giờ, điều này dẫn đến một tệp có chứa

$ pip install pandas
2

Hoạt động như một nét duyên dáng. Nếu chúng tôi nhập lại và in nội dung, thì

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 được xây dựng tốt

City,State,Capital,Population
Philadelphia,Pennsylvania,No,1.581 Million
Sacramento,California,Yes,0.5 Million
New York,New York,No,8.623 Million
Austin,Texas,Yes,0.95 Million
Miami,Florida,No,0.463 Million
9

Kết quả này trong

$ pip install pandas
4

Hãy thay đổi tiêu đề cột từ tiêu đề mặc định

$ pip install pandas
5

Chúng tôi đã tạo một danh sách

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
53, chứa các giá trị khác nhau cho các cột của chúng tôi. Sau đó, sử dụng đối số
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
24, chúng tôi đã đặt những tên này thay vì tên cột ban đầu. Điều này tạo ra một
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
55 với những nội dung này

$ pip install pandas
6

Tùy chỉnh dấu phân cách

Hãy thay đổi dấu phân cách từ giá trị mặc định [

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
56] sang giá trị mới

$ pip install pandas
7

Điều này dẫn đến một tệp

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
55 có chứa

$ pip install pandas
8

Xử lý các giá trị bị thiếu

Đôi khi, các

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
11 có các giá trị bị thiếu mà chúng tôi để lại là
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
59 hoặc
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
90. Trong những trường hợp như vậy, bạn có thể muốn định dạng chúng khi viết chúng ra tệp CSV. Bạn có thể sử dụng đối số
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
91 và đặt giá trị được đặt thay vì giá trị bị thiếu

$ pip install pandas
9

Ở đây, chúng ta có hai cặp thành phố-bang hợp lệ, nhưng

| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
92 thiếu trạng thái của nó. Nếu chúng tôi chạy mã này, nó sẽ dẫn đến một
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
55 với các nội dung sau

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
0

Phần kết luận

Bài viết hướng dẫn cách đọc và ghi file CSV bằng thư viện Pandas của Python. Để đọc tệp CSV, phương pháp

import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
3 của thư viện Pandas được sử dụng. Bạn cũng có thể chuyển tên tiêu đề tùy chỉnh trong khi đọc tệp CSV thông qua thuộc tính
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
95 của phương thức
import pandas as pd
titanic_data = pd.read_csv['titanic.csv']
3. Cuối cùng, để ghi tệp CSV bằng Pandas, trước tiên bạn phải tạo một đối tượng Pandas DataFrame và sau đó gọi phương thức
| City         | State        | Capital | Population    |
| ------------ | ------------ | ------- | ------------- |
| Philadelphia | Pennsylvania | No      | 1.581 Million |
| Sacramento   | California   | Yes     | 0.5 Million   |
| New York     | New York     | No      | 8.623 Million |
| Austin       | Texas        | Yes     | 0.95 Million  |
| Miami        | Florida      | No      | 0.463 Million |
97 trên DataFrame

Làm cách nào để xuất Pandas DataFrame sang CSV?

Để ghi DataFrame gấu trúc vào tệp CSV, bạn sẽ cần DataFrame. to_csv . Hàm này cung cấp nhiều đối số với các giá trị mặc định hợp lý mà bạn sẽ không cần phải ghi đè thường xuyên hơn để phù hợp với trường hợp sử dụng cụ thể của mình.

Làm cách nào chúng tôi có thể tạo tệp CSV bằng DataFrame?

Ghi Khung dữ liệu Pandas vào tệp CSV .
Tạo dữ liệu dạng bảng hai chiều, có thể thay đổi kích thước, có khả năng không đồng nhất, df
In DataFrame đầu vào
sử dụng df. to_csv để lưu các giá trị của DataFrame vào tệp CSV [các giá trị được phân tách bằng dấu phẩy]

Chủ Đề