Đọc JSON
Các bộ dữ liệu lớn thường được lưu trữ hoặc trích xuất dưới dạng JSON.
JSON là văn bản đơn giản, nhưng có định dạng của một đối tượng, và được biết đến trong thế giới lập trình, bao gồm cả gấu trúc.
Trong các ví dụ của chúng tôi, chúng tôi sẽ sử dụng tệp JSON có tên là 'data.json'.
Mở dữ liệu.json.
Thí dụ
Tải tệp JSON vào DataFrame:
nhập khẩu gấu trúc dưới dạng PD
df = pd.read_json ['data.json']
print[df.to_string[]]
Hãy tự mình thử »
Mẹo: Sử dụng to_string[]
để in toàn bộ khung dữ liệu. use to_string[]
to print the entire DataFrame.
Từ điển là json
JSON = Từ điển Python
Các đối tượng JSON có định dạng giống như từ điển Python.
Nếu mã JSON của bạn không có trong một tệp, nhưng trong từ điển Python, bạn có thể tải nó trực tiếp vào DataFrame:
Thí dụ
Tải tệp JSON vào DataFrame:
nhập khẩu gấu trúc dưới dạng PD
df = pd.read_json ['data.json']
"Duration":{
"0":60,
"1":60,
"2":60,
"3":45,
"4":45,
"5":60
},
"Pulse":{
"0":110,
"1":117,
"2":103,
"3":109,
"4":117,
"5":102
},
"Maxpulse":{
"0":130,
"1":145,
"2":135,
"3":175,
"4":148,
"5":127
},
"Calories":{
"0":409,
"1":479,
"2":340,
"3":282,
"4":406,
"5":300
}
}
Hãy tự mình thử »
print[df]
Hãy tự mình thử »
Tìm kiếm để tải một chuỗi JSON vào Pandas DataFrame?
Nếu vậy, bạn có thể sử dụng mẫu sau để tải chuỗi JSON của mình vào DataFrame:
import pandas as pd pd.read_json [r'Path where you saved the JSON file\File Name.json']
Trong hướng dẫn ngắn này, tôi sẽ xem xét các bước để tải các chuỗi JSON khác nhau vào Python bằng gấu trúc.
Bước 1: Chuẩn bị chuỗi JSON
Để bắt đầu với một ví dụ đơn giản, hãy để nói rằng bạn có dữ liệu sau về các sản phẩm khác nhau và giá của chúng:
Sản phẩm | Giá bán |
Máy tính desktop | 700 |
Máy tính bảng | 250 |
điện thoại Iphone | 800 |
Máy tính xách tay | 1200 |
Dữ liệu này có thể được ghi lại dưới dạng chuỗi JSON:
{"Product":{"0":"Desktop Computer","1":"Tablet","2":"iPhone","3":"Laptop"},"Price":{"0":700,"1":250,"2":800,"3":1200}}
Bước 2: Tạo tệp JSON
Khi bạn đã sẵn sàng chuỗi JSON của mình và NBSP; lưu nó trong tệp JSON.
Ngoài ra, bạn có thể sao chép chuỗi JSON vào Notepad, sau đó lưu tệp đó bằng phần mở rộng tệp .json.
Ví dụ: Mở Notepad, sau đó sao chép chuỗi JSON vào đó:
Sau đó, lưu notepad với tên tệp mong muốn của bạn và thêm tiện ích mở rộng & nbsp; .json ở cuối tên tệp. Ở đây, tôi đặt tên tệp là data.json:data.json:
Bước 3: & NBSP; Tải tệp JSON vào Pandas DataFrame
Cuối cùng, hãy tải tệp JSON của bạn vào Pandas DataFrame bằng cách sử dụng mẫu mà bạn đã thấy ở đầu hướng dẫn này:
import pandas as pd pd.read_json [r'Path where you saved the JSON file\File Name.json']
Trong trường hợp của tôi, tôi đã lưu trữ tệp JSON trên máy tính để bàn của mình, theo đường dẫn này:
C: \ Users \ ron \ Desktop \ data.json
Vì vậy, đây là mã mà tôi đã sử dụng để tải tệp JSON vào DataFrame:
import pandas as pd df = pd.read_json [r'C:\Users\Ron\Desktop\data.json'] print [df]
Chạy mã trong Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được dữ liệu sau:
3 chuỗi khác nhau & nbsp; JSON
Dưới đây là 3 cách khác nhau mà bạn có thể ghi dữ liệu dưới dạng chuỗi JSON.
Mỗi chuỗi đó sẽ tạo ra một khung dữ liệu với một định hướng khác nhau khi tải các tệp vào Python.
[1] Định hướng chỉ số
{"0":{"Product":"Desktop Computer","Price":700},"1":{"Product":"Tablet","Price":250},"2":{"Product":"iPhone","Price":800},"3":{"Product":"Laptop","Price":1200}}
[2] Định hướng giá trị
[["Desktop Computer",700],["Tablet",250],["iPhone",800],["Laptop",1200]]
[3] Định hướng cột
{"Product":{"0":"Desktop Computer","1":"Tablet","2":"iPhone","3":"Laptop"},"Price":{"0":700,"1":250,"2":800,"3":1200}}
Sau đó, bạn có thể chọn chuỗi JSON sẽ tạo ra dữ liệu mong muốn của bạn. Bạn có thể tìm hiểu thêm về read_json bằng cách truy cập tài liệu gấu trúc.
Bây giờ điều gì sẽ xảy ra nếu bạn muốn xuất DataFrame của mình sang JSON thì sao?
Nếu trường hợp đó, bạn có thể muốn kiểm tra hướng dẫn sau đây cho các bước để xuất Pandas DataFrame sang tệp JSON.