Python có thể tạo bảng tổng hợp trong Excel không?
Bảng tổng hợp là một cách cần thiết để hiểu dữ liệu của bạn. Nhóm dữ liệu cho phép bạn xem các mẫu và truy xuất thông tin chi tiết mà nếu không bạn sẽ bỏ lỡ bằng cách xem tập dữ liệu thô. Tôi thấy bảng tổng hợp là hình thức trực quan hóa dữ liệu cơ bản nhất. Mặc dù không có màu sắc, hoạt ảnh hoặc đồ họa, nhưng các bảng tổng hợp có thể vẽ nên một bức tranh cực kỳ rõ ràng về dữ liệu của bạn và cho phép hiểu biết nhanh chóng, có thể chia sẻ. Tôi thường thấy rằng bảng tổng hợp sẽ truyền đạt phân tích của tôi hiệu quả hơn biểu đồ Show
Trong Excel, các bảng tổng hợp khá dễ định cấu hình — tất cả những gì bạn phải làm là chọn các hàng, cột và giá trị trong menu điểm và nhấp Các bảng tổng hợp Python khó hơn. Hàm pivot_table có 11 đối số tiềm năng mà bạn có thể điền vào Nhận khóa học Python hoàn chỉnh miễn phíXây dựng sự nghiệp khoa học dữ liệu của bạn với bằng cấp được ngành công nhận trên toàn cầu. Có được tư duy, sự tự tin và các kỹ năng khiến Nhà khoa học dữ liệu trở nên có giá trị
trả lại
Làm thế nào để tạo một bảng tổng hợp?Sử dụng hàm 9 và chỉ định tính năng nào sẽ xuất hiện trong các hàng và cột bằng cách sử dụng các tham số 0 và 1 tương ứng. Tính năng nên được sử dụng để điền vào các giá trị ô phải được chỉ định trong tham số 2Hãy tạo một tập dữ liệu mẫu
Sử dụng tham số 3 và `values`
Ở đây, chúng tôi đã tạo một bảng tổng hợp cơ bản trong gấu trúc để hiển thị mức lương trung bình của từng loại nhân viên cho mỗi bộ phận. Vì không có tham số do người dùng xác định nào được chuyển, nên các đối số còn lại đã nhận các giá trị mặc định của chúng. Chúng tôi cũng có thể tạo các bảng tổng hợp hiển thị nhiều giá trị thống kê cùng một lúc Bảng tổng hợp với nhiều chức năng tổng hợpNếu thông số 4 không được chỉ định, nó sẽ tổng hợp dựa trên thông số 0
Ở đây, bảng tổng hợp hiển thị tổng và giá trị trung bình của tiền lương của từng loại nhân viên và số lượng nhân viên của từng loại.
Làm cách nào để tính tổng cộng của hàng và cột trong pivot_table?Bây giờ, chúng ta hãy xem tổng số tiền lương của từng loại nhân viên. Đối với điều này, chúng tôi sẽ sử dụng lề và tham số margins_name
Làm cách nào để tổng hợp nhiều tính năng trong bảng tổng hợp?Chúng tôi cũng có thể thực hiện các tập hợp khác nhau trên các tính năng khác nhau. Điều này giúp áp dụng các thao tác phù hợp trên các tính năng khác nhau mà không phải tạo nhiều bảng tổng hợp
Thay thế các giá trị bị thiếuTrong bảng cuối cùng của phần trước, chúng ta có thể thấy tổng lương mà nhân viên trong từng bộ phận nhận được và kinh nghiệm trung bình của nhân viên trong từng bộ phận Tuy nhiên, có những NaN có trong bảng đó Chúng ta có thể thay thế các NaN bằng một giá trị phù hợp bằng tham số fill_value. Trong trường hợp này, chúng tôi sẽ thay thế NaN bằng 'Không áp dụng'
Tham số fill_value có thể được sử dụng để thay thế NaN bằng bất kỳ giá trị phù hợp nào bao gồm giá trị trung bình, trung bình hoặc chế độ của các tính năng khác Bảng tổng hợp chỉ mục đa cấpCác bảng tổng hợp ở trên được tạo bằng cách sử dụng một chỉ mục cấp đơn i. e. , chỉ có một tính năng làm chỉ mục được sử dụng. Tuy nhiên, chúng ta cũng có thể sử dụng nhiều chỉ số để tạo bảng tổng hợp. Bảng tổng hợp chỉ mục đa cấp hiển thị chi tiết tóm tắt ở mức độ chi tiết cao hơn và chúng có thể rất hữu ích khi chúng ta xử lý dữ liệu phân cấp
Mẹo thiết thựcBảng Pivot có thể là một công cụ rất tiện dụng để phân tích dữ liệu. Dưới đây là một số mẹo có thể giúp bạn sử dụng bảng tổng hợp với tiềm năng tối đa của chúng Tạo thông tin chi tiết. Bảng Pivot có thể cung cấp chế độ xem nhanh toàn bộ tập dữ liệu giúp giảm bớt quá trình suy luận những hiểu biết hữu ích và thực hiện các quan sát quan trọng trong tập dữ liệu Đặt hàng các bảng tổng hợp chỉ mục đa cấp. Thứ tự các tính năng được chuyển dưới dạng chỉ mục cho bảng tổng hợp có thể ảnh hưởng đến các giá trị được hiển thị trong bảng
0chức năng GroupBy Các bảng tổng hợp tương tự như phương pháp gấu trúc 6 cũng được sử dụng để xem các đặc điểm thống kê của một đối tượng trong tập dữ liệuTuy nhiên, cần lưu ý rằng đối tượng được trả về bởi hàm 7 là một đối tượng 8 thay vì một khung dữ liệu. Do đó, các hoạt động khung dữ liệu thông thường sẽ không hoạt động trên đối tượng này 1 2 3Kết luậnChúng tôi đã thấy cách tạo bảng tổng hợp của khung dữ liệu gấu trúc và cách định cấu hình các tham số của nó để xem chi tiết thống kê ở các mức độ chi tiết khác nhau Kiểm tra kiến thức của bạnQ1. Trong bảng tổng hợp nhiều chỉ mục, thứ tự các chỉ số được chuyển không thành vấn đề. Đúng hay sai? Trả lời Sai. Bởi vì, các giá trị được hiển thị trong bảng tổng hợp thay đổi tùy thuộc vào thứ tự của các chỉ số được truyền quý 2. Tham số nào được sử dụng để thay đổi phương thức tổng hợp trong bảng tổng hợp? Trả lời aggfunc Q3. Làm cách nào chúng tôi có thể xem các tập hợp khác nhau trên các tính năng khác nhau trong cùng một bảng tổng hợp? Trả lời Chuyển tên tính năng và thao tác tổng hợp sẽ được thực hiện dưới dạng các cặp khóa-giá trị tương ứng trong từ điển cho hàm aggfunc. Ngoài ra, tên tính năng cũng phải được chuyển đến tham số giá trị Q4. Trả lời các câu hỏi sau bằng tập dữ liệu đã cho 4Tập dữ liệuQ4. 1. Số năm kinh nghiệm trung bình của mỗi loại nhân viên trong mỗi bộ phận là bao nhiêu? Trả lời 5Q4. 2. Tạo một bảng tổng hợp hiển thị mức lương trung bình cũng như số lượng nhân viên ở các bộ phận khác nhau. Họ nên được lập chỉ mục theo loại việc làm Trả lời 6Q4. 3. Lập bảng tổng hợp thể hiện mức lương trung bình của từng loại nhân viên trong từng bộ phận và tổng số năm kinh nghiệm (YoE) của từng nhân viên trong từng bộ phận Trả lời 7Bài viết này được đóng góp bởi Shreyansh MáyHọcPlusMachine Learning Plus được tạo thành từ một nhóm những người nhiệt tình đam mê Khoa học dữ liệu. Họ giúp các Nhà phát triển, Nhà quản lý doanh nghiệp và Nhà khoa học dữ liệu tuyệt vời trở nên giỏi hơn trong công việc của họ TrướcBài trướcMã thông báo trong Xử lý ngôn ngữ tự nhiên (NLP) là gì? Bài viết tiếp theoSê-ri PandasTiếp theo Chương trình Nhà khoa học Dữ liệu Công nghiệp ML Plus với Đảm bảo Việc làm
Biêt nhiêu hơn báo cáo quảng cáo này Bài đăng có liên quan
Làm cách nào để thực hiện các bài kiểm tra ý nghĩa thống kê phổ biến và tìm giá trị p?Hồi quy logistic - Hướng dẫn hoàn chỉnh với các ví dụ trong RSố liệu đánh giá cho các mô hình phân loại – Làm cách nào để đo lường hiệu suất của các mô hình học máy?Hướng dẫn và ví dụ về biểu thức chính quy Python. Hướng dẫn đơn giản hóaTìm hiểu cách giải quyết một dự án khoa học dữ liệu thực tế với khóa học Phát hiện phần mềm độc hại của Microsoft Tìm hiểu thêm |