Python tổng của cột trong danh sách

“Bài viết này sẽ trình bày cách tính tổng tất cả hoặc các cột cụ thể trong Khung dữ liệu Pandas bằng Python. khung dữ liệu. hàm sum[] sẽ được sử dụng cùng với một số tham số hữu ích trong nhiều ví dụ của hướng dẫn này. ”

Khi hướng dẫn này kết thúc, bạn có thể biết cách

    • Tìm tổng của Cột khung dữ liệu trong Pandas
    • Thêm các cột khung dữ liệu lại với nhau
    • Thêm Cột vào Khung dữ liệu Pandas đáp ứng Điều kiện đã chỉ định
    • Xác định tổng sau khi nhóm dữ liệu của khung dữ liệu

Làm cách nào để xác định tổng các cột Dataframe?

“khung dữ liệu. hàm sum[]” trong Pandas trả về tổng số tiền cho trục đã chỉ định. Nếu đầu vào là một trục của chỉ mục, hàm sẽ thêm các giá trị của từng cột riêng lẻ, sau đó thực hiện tương tự cho từng cột, trả về một chuỗi lưu trữ tổng dữ liệu/giá trị trong mỗi cột. Ngoài ra, nó hỗ trợ tính tổng của khung dữ liệu bằng cách bỏ qua các giá trị bị thiếu

cú pháp. Khung dữ liệu. tổng [trục = Không, bỏ qua = Không, cấp độ = Không, numeric_only = Không, min_count = 0, **kwargs]

Ở đâu,

trục. {cột [1], chỉ mục [0]}

bỏ qua. Bỏ qua các giá trị NA/null khi tính toán kết quả

mức độ. Nếu trục được chỉ định là trục có thứ bậc [đa chỉ mục], hãy đếm đến một mức chỉ mục cụ thể trước khi chuyển đổi thành Sê-ri

Chỉ số. Chỉ cần các cột float, int và boolean là được chấp nhận. Nếu Không, hãy cố gắng sử dụng mọi thứ; . Đối với sê-ri, không được triển khai

min_count. Số lượng giá trị có thể được yêu cầu để hoàn thành thao tác. Kết quả sẽ là NA nếu có ít giá trị không phải NA hơn min_count

trả lại. DataFrame [nếu mức được chỉ định] hoặc Sê-ri

Ví dụ #01. Xác định Tổng của Cột Dataframe và Tất cả các Cột

Trước tiên, chúng tôi đã yêu cầu một khung dữ liệu với các kiểu dữ liệu hợp lệ, tôi. e. , int, float, v.v. , cột hoặc các cột mà chúng ta có thể tìm thấy tổng dữ liệu. Khung dữ liệu sẽ được tạo bằng cách sử dụng lệnh pd. Hàm DataFrame[]


Chúng tôi đã tạo khung dữ liệu cần thiết từ từ điển python bên trong pd. Hàm DataFrame[]. Trong khung dữ liệu được tạo ở trên, có bốn cột “Tên”, “ngày 1”, “ngày 2” và “ngày 3”. Trong số bốn cột, ba cột tôi. e. “day1”, “day2”, và “day3” là các cột số với các giá trị dữ liệu [4, 4, 3, 2, 4, 6, 5, 3], [2, 4, 5, 2, 3, 4, . Chúng tôi chỉ có thể tìm tổng cho ba cột này. Tổng của cả hai chuỗi [i. e. , một cột] và toàn bộ khung dữ liệu có thể được xác định bằng phương thức sum[]. Hãy bắt đầu bằng cách dạy cách tính tổng tất cả dữ liệu trong cột Pandas


Để xác định tổng, chúng tôi đã sử dụng phương thức sum[] trên cột “day2”. Hàm đã trả về giá trị tổng là 28. Tương tự như vậy, chúng tôi có thể xác định tổng của từng cột Dataframe. Chỉ cần sử dụng phương thức sum[] trên toàn bộ khung dữ liệu sẽ thực hiện được điều này


Như có thể thấy, tổng của cột “ngày 1” là 31;

Ví dụ #02. Sử dụng hàm sum[] để tổng hợp các giá trị cột Dataframe cùng nhau

Như bạn có thể thấy từ đầu ra của ví dụ trước, hàm không trả về dữ liệu cột khung dữ liệu thực tạo thành tổng. Tuy nhiên, bằng cách gán phương thức “DataFrame. sum[]”  vào cột DataFrame, bạn có thể truy cập mọi cột trong DataFrame, kể cả cột tổng. Đầu tiên, chúng tôi tạo một khung dữ liệu khác cho ví dụ này


Sử dụng pd. DataFrame[] khung dữ liệu của chúng tôi đã được tạo. Chúng tôi đã tạo khung dữ liệu với ba cột. mặt hàng, giá cả và thuế. Mục cột chứa các giá trị chuỗi [“bút”, “bút đánh dấu”, “thước kẻ”, “tẩy”, “bút chì”, “bảng kẹp”, “kim bấm”, “ghim”], giá cột lưu trữ các giá trị [20, . Bây giờ, hãy cộng các giá trị cột giá và thuế và lưu kết quả vào một cột mới bằng cách giữ các cột khung dữ liệu ban đầu


Như có thể nhận thấy cùng với cột mới “tổng”, các cột ban đầu của khung dữ liệu đã cho cũng được trả về bởi hàm. Cột “tổng” lưu trữ tổng giá trị của cột “giá” và “thuế” đối với từng dữ liệu “mặt hàng”

Ví dụ #03. Sử dụng hàm sum[] để xác định tổng của các cột khung dữ liệu được chỉ định

Để tính tổng nhiều cột của khung dữ liệu với nhau, chúng ta có thể chỉ định một danh sách có nhãn của các cột và sau đó áp dụng phương thức sum[] trên danh sách để tìm tổng. Giống như các ví dụ trước, trước tiên chúng ta sẽ tạo khung dữ liệu


Chúng tôi đã tạo khung dữ liệu của mình với bốn cột “sinh viên”, “marks1”, “marks2” và “marks3”. Cột “học sinh” lưu trữ dữ liệu [“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”] và cột “marks1” lưu trữ dữ liệu.


Đầu tiên, chúng tôi đã tạo một đối tượng danh sách với các nhãn cột “students”, “marks1” và “marks3”. Sau đó, phương thức sum[] được áp dụng cho danh sách. Hàm chỉ tính tổng các giá trị của cột mark1 và mark3 vì cột “sinh viên” không phải là số nên hàm sum[] không thể tìm thấy tổng cho các giá trị của cột “sinh viên”. Chúng tôi đã lưu trữ tổng giá trị của các cột “marks1” và “marks3” trong cột “sum”

Ví dụ #04. Thêm các cột của khung dữ liệu Pandas thỏa mãn một điều kiện đã chỉ định

Trong ví dụ này, chúng tôi sẽ thêm các giá trị của các cột được chỉ định nếu chúng đáp ứng điều kiện đã chỉ định


Có 5 cột trong khung dữ liệu mới được tạo, tôi. e. , “công ty”, “doanh số_tuần1”, “doanh số tuần2”, “doanh số tuần3” và “chi nhánh”. Bây giờ, giả sử chúng ta không muốn thêm giá trị của cột cuối cùng khi chúng ta đang thêm hoặc tìm tổng giá trị của các hàng trong khung dữ liệu đã cho. Giả sử chúng ta chỉ muốn thêm các giá trị cột có từ “tuần” vào nhãn của chúng. Khả năng hiểu danh sách có thể được tạo để xác định xem từ “tuần” có xuất hiện trong nhãn cột hay không


Bây giờ chúng tôi đã tìm nạp các cột có từ “tuần” trong nhãn của chúng. Chúng ta có thể tóm tắt các cột có chứa từ “tuần” bằng cách sử dụng đối số axis=1 trong hàm sum[]


Theo cách này, chúng tôi có thể tổng hợp dữ liệu một cách an toàn trên các cột theo hàng mà không bao gồm bất kỳ cột nào chúng tôi không muốn

Ví dụ #5. Xác định tổng sau khi nhóm dữ liệu của khung dữ liệu

Chúng tôi cũng có thể tìm tổng của các cột khung dữ liệu sau khi nhóm dữ liệu của một hoặc nhiều cột. Phương thức groupby[] sẽ được sử dụng để nhóm dữ liệu thành các danh mục bên trong cột. Hãy tạo một khung dữ liệu để chúng ta có thể nhóm dữ liệu của một trong các cột của nó


Bây giờ chúng ta sẽ nhóm dữ liệu trong cột “tuổi” và tính tổng các giá trị của cột “score1” và “score2” cho từng danh mục của nhóm


Chúng ta có thể thấy rằng việc tổng hợp dữ liệu trong khung dữ liệu sau lần đầu tiên nhóm các giá trị dữ liệu theo độ tuổi sẽ dẫn đến một tổng theo cột tùy thuộc vào các nhóm tuổi

Sự kết luận

Trong hướng dẫn này, chúng tôi đã cố gắng hướng dẫn bạn cách tính tổng trên các khung dữ liệu bằng phương pháp tổng Pandas. Chúng tôi đã thảo luận về việc bổ sung các giá trị theo hàng và theo cột trong các ví dụ của bài đăng này. Ngoài ra, bạn đã học cách thêm các cột theo điều kiện và cách tính tổng các giá trị sau khi nhóm cột của khung dữ liệu. Bây giờ bạn có thể cộng các cột của khung dữ liệu lại với nhau hoặc tự mình tính tổng các giá trị trong cột khung dữ liệu

Chủ Đề