Hướng dẫn how do i go to a specific column in python? - làm cách nào để chuyển đến một cột cụ thể trong python?

Bạn có thể sử dụng các chức năng LỘC và ILOC để truy cập các cột trong khung dữ liệu gấu trúc. Hãy để xem làm thế nào.

Trước tiên chúng tôi sẽ đọc trong tệp CSV của mình bằng cách chạy dòng mã sau:

Report_Card = pd.read_csv("Report_Card.csv")

Điều này sẽ cung cấp cho chúng tôi một khung dữ liệu trông giống như sau:

Hướng dẫn how do i go to a specific column in python? - làm cách nào để chuyển đến một cột cụ thể trong python?

Nếu chúng tôi muốn truy cập một cột nhất định trong DataFrame của chúng tôi, ví dụ như cột Lớp, chúng tôi chỉ cần sử dụng hàm LỘC và chỉ định tên của cột để lấy lại.

Report_Card.loc[:,"Grades"]

Hướng dẫn how do i go to a specific column in python? - làm cách nào để chuyển đến một cột cụ thể trong python?

Đối số đầu tiên (:) biểu thị các hàng nào chúng tôi muốn lập chỉ mục và đối số thứ hai (lớp) cho phép chúng tôi lập chỉ mục cột chúng tôi muốn. Bán kết trả về tất cả các hàng từ cột chúng tôi đã chỉ định.

Kết quả tương tự cũng có thể thu được bằng cách sử dụng hàm ILOC. Đối số ILOC yêu cầu chỉ số giá trị nguyên thay vì tên có giá trị chuỗi. Để tái tạo ví dụ cột lớp của chúng tôi, chúng tôi có thể sử dụng đoạn mã sau:

Report_Card.iloc[:,3]

Vì cột tên là cột 0, nên cột lớp sẽ có giá trị chỉ mục số là 3.

Chúng tôi cũng có thể truy cập nhiều cột cùng một lúc bằng cách sử dụng chức năng LỘC bằng cách cung cấp một mảng các đối số, như sau:

Report_Card.loc[:,["Lectures","Grades"]]

Để có được kết quả tương tự với hàm ILOC, chúng tôi sẽ cung cấp một loạt các số nguyên cho đối số thứ hai. & NBSP;

Report_Card.iloc[:,[2,3]]

Cả hai ví dụ chức năng ILOC và LỘC sẽ tạo ra dữ liệu sau:

Hướng dẫn how do i go to a specific column in python? - làm cách nào để chuyển đến một cột cụ thể trong python?

Điều quan trọng cần lưu ý là thứ tự của các tên cột chúng tôi đã sử dụng khi chỉ định mảng ảnh hưởng đến thứ tự của các cột trong khung dữ liệu kết quả, như có thể thấy trong hình trên.

Dữ liệu làm sạch

Khi làm sạch dữ liệu, đôi khi chúng ta sẽ cần phải đối phó với NANS (không phải giá trị số). Để tìm kiếm các cột có các giá trị bị thiếu, chúng tôi có thể thực hiện các như sau: & nbsp;

nans_indices = Report_Card.columns[Report_Card.isna().any()].tolist()

nans = Report_Card.loc[:,nans]

Khi chúng tôi sử dụng báo cáo_card.isna (). Bất kỳ () đối số chúng tôi sẽ nhận được một đối tượng loạt các giá trị boolean, trong đó các giá trị sẽ đúng nếu cột có bất kỳ dữ liệu bị thiếu nào trong bất kỳ hàng nào của chúng. Đối tượng loạt này sau đó được sử dụng để lấy các cột của DataFrame của chúng tôi với các giá trị bị thiếu và biến nó thành một danh sách bằng hàm Tolist (). Cuối cùng, chúng tôi sử dụng các chỉ số này để có được các cột có các giá trị bị thiếu.Report_Card.isna().any() argument we get a Series Object of boolean values, where the values will be True if the column has any missing data in any of their rows. This Series Object is then used to get the columns of our DataFrame with missing values, and turn it into a list using the tolist() function. Finally we use these indices to get the columns with missing values.

Hình dung

Vì bây giờ chúng ta có cột có tên là các lớp, chúng ta có thể cố gắng hình dung nó. Thông thường chúng tôi sẽ sử dụng một gói Python khác để vẽ dữ liệu, nhưng may mắn là Pandas cung cấp một số chức năng trực quan tích hợp. Ví dụ: chúng ta có thể nhận được một biểu đồ của cột Lớp bằng dòng mã sau:

/ * Khối mã */

Grades.hist()

/ * Khối mã */

Điều này sẽ tạo ra biểu đồ sau đây cho chúng tôi, nơi chúng tôi có thể kiểm tra phân phối các lớp. Vì dữ liệu của chúng tôi không phải là hữu cơ và rất hạn chế về số lượng, phân phối của chúng tôi cũng khá phi thực tế. Tuy nhiên, đây là biểu đồ:

Hướng dẫn how do i go to a specific column in python? - làm cách nào để chuyển đến một cột cụ thể trong python?

Python cho khoa học dữ liệu

Được đóng gói trước với các gói mà các nhà khoa học dữ liệu quan trọng nhất cần, ActivePython được biên dịch sẵn để bạn và nhóm của bạn không phải lãng phí thời gian để cấu hình phân phối nguồn mở. Bạn có thể tập trung vào những gì mà các thuật toán xây dựng thời gian và các mô hình dự đoán quan trọng hơn của cộng đồng đối với các nguồn dữ liệu lớn của bạn và ít thời gian hơn trên cấu hình hệ thống.

Một số gói Python phổ biến cho Khoa học dữ liệu/Dữ liệu lớn/Máy học Bạn được biên dịch sẵn-với ActivePython

  • gấu trúc & nbsp; (phân tích dữ liệu)(data analysis)
  • Numpy & nbsp; (Mảng đa chiều) (multi-dimensional arrays)
  • Scipy & nbsp; (thuật toán để sử dụng với Numpy) (algorithms to use with numpy)
  • HDF5 & NBSP; (Lưu trữ & Thao tác dữ liệu) (store & manipulate data)
  • Matplotlib & nbsp; (trực quan hóa dữ liệu) (data visualization)
  • Jupyter & NBSP; (Hợp tác nghiên cứu) (research collaboration)
  • Pytables & nbsp; (quản lý bộ dữ liệu HDF5) (managing HDF5 datasets)
  • HDFS & NBSP; (Vòng bao C/C ++ cho Hadoop) (C/C++ wrapper for Hadoop)
  • Pymongo & nbsp; (Người lái xe MongoDB) (MongoDB driver)
  • SQLALCHEMY & NBSP; (Bộ công cụ Python SQL) (Python SQL Toolkit)

Với nguồn gốc sâu thẳm trong nguồn mở, và là thành viên sáng lập của Quỹ Python, Activeestate đã tích cực đóng góp cho cộng đồng Python. Chúng tôi cung cấp sự tiện lợi, bảo mật và hỗ trợ mà doanh nghiệp của bạn cần trong khi tương thích với phân phối nguồn mở của Python.

Tải xuống ActivePython Community Edition & nbsp; để bắt đầu hoặc & nbsp; liên hệ với chúng tôi & nbsp; để tìm hiểu thêm về việc sử dụng ActivePython trong tổ chức của bạn.to get started or contact us to learn more about using ActivePython in your organization.

Bạn cũng có thể bắt đầu bằng cách thử thời gian chạy ML mini của chúng tôi cho & nbsp; Linux & nbsp; hoặc & nbsp; Windows & nbsp; bao gồm hầu hết các gói phổ biến cho khoa học máy và khoa học dữ liệu, được biên dịch sẵn và sẵn sàng để sử dụng trong các dự án từ các công cụ khuyến nghị đến bảng điều khiển.