Nếu bạn đã đạt đến điểm mà Excel không còn có thể xử lý những gì bạn ném vào nó, thì bạn có thể cần bắt đầu xem xét Python
Tôi yêu Microsoft Excel. Nó [gần như] là công cụ có giá trị nhất trong kho vũ khí của tôi để phân tích dữ liệu. Vâng, gần như. Nhưng dù Excel mạnh mẽ đến đâu, đã nhiều lần tôi ước mình có thể làm được nhiều hơn thế, đặc biệt là khi tôi đạt đến 'giới hạn' của Excel — và nếu bạn làm việc với Excel hàng ngày, bạn sẽ nhận thấy rằng có khá nhiều giới hạn
Tôi không ở đây để cố gắng làm cho Excel trông xấu đi, không, Excel vẫn là công cụ phổ biến nhất để thao tác dữ liệu — mặc dù ở quy mô hạn chế. Nếu bạn sử dụng Excel để phân tích dữ liệu đơn giản và báo cáo bảng điều khiển đơn giản, bạn có thể dễ dàng hoàn thành mà không cần lo lắng. Nhưng nếu bạn đã đạt đến điểm mà bạn ước mình có thể tự động hóa báo cáo của mình, thao tác với nhiều bộ dữ liệu lớn với tốc độ tốt hơn và ít kéo hơn hoặc thực hiện các phép tính mạnh mẽ hơn, thì rất có thể bạn nên đọc tiếp
Python không bị giới hạn bởi kích thướcExcel có thể xử lý hơn 1 triệu hàng [cụ thể là 1.048.576]. Tuy nhiên, khi bạn vượt quá 10.000 hàng, bạn sẽ nhận thấy rằng sổ làm việc bắt đầu chậm lại đáng kể. Hãy thử điều này với nhiều trang tính hơn và chắc chắn bạn sẽ gặp phải sự cố sổ làm việc thất thường khó chịu
Tuy nhiên, Python có thể xử lý hàng triệu triệu hàng mà không gặp bất kỳ rắc rối nào, bạn chỉ bị giới hạn bởi sức mạnh tính toán của PC
Python không bị giới hạn bởi bộ nhớThật không may, các tính toán sử dụng nhiều bộ nhớ như công thức mảng [CSE] trong Excel có thể dễ dàng làm hỏng sổ làm việc của bạn. Nhiều cải tiến đã được Microsoft thực hiện thông qua các công cụ quyền lực [PowerQuery, PowerPivot, PowerBI, v.v.] nhưng giới hạn bộ nhớ vẫn chưa biến mất. Mặt khác, Python, sử dụng các thư viện như numpy và pandas, có thể xử lý các tính toán rất phức tạp mà không phải đổ mồ hôi
Python không có giới hạn tích hợpKhông có công cụ phân tích dữ liệu nào có nhiều khả năng tích hợp hơn Python. Bạn có thể kết nối với tệp CSV, trang web HTML, cơ sở dữ liệu SQL và thậm chí cả cơ sở dữ liệu NoSQL. Các nhà phát triển liên tục viết các công cụ và thư viện hiệu quả hơn để tích hợp các ứng dụng của họ với Python
Đáng tiếc là không thể tự động hóa với ExcelExcel không được thiết kế để tự động hóa các tác vụ, vì vậy yêu cầu tự động hóa Excel sẽ không công bằng. Sử dụng các công cụ Lập lịch tác vụ, người dùng Excel đã có thể thực hiện tự động hóa ở cấp độ đầu vào phụ thuộc nhiều vào tính khả dụng của Excel trong PC người dùng. Tuy nhiên, khả năng tự động hóa các tác vụ của Python đơn giản là vô hạn. Thay vì phải mở tệp hàng tuần để chạy phân tích trước khi đính kèm kết quả vào email để gửi, bạn chỉ có thể tự động hóa quy trình công việc này bằng Python và loại bỏ hoàn toàn nhu cầu tương tác của con người trong quy trình — để lại hành động duy nhất cần thiết cho
Khả năng đa nền tảngBạn đã từng gặp phải sự cố trong đó một số công thức trong trang tính của bạn không hoạt động trên máy Mac vì bạn đã thực hiện phân tích trên máy Windows chưa? . Các thư viện có thể có các chức năng không dùng nữa khi chuyển từ phiên bản này sang phiên bản tiếp theo [rõ ràng là với tất cả các bản nâng cấp phần mềm], nhưng khả năng tương thích đa nền tảng không ảnh hưởng đến phân tích dữ liệu trong Python
Cộng đồng nguồn mở và hỗ trợPython hoàn toàn miễn phí và mã nguồn mở. Không phí cấp phép, không gia hạn, không cần cam kết tài chính để duy trì dự án phân tích dữ liệu của bạn. Và với sự hỗ trợ đông đảo của cộng đồng, bạn gần như không bao giờ gặp khó khăn nếu gặp bất kỳ rắc rối nào. Có rất nhiều tài nguyên mà bạn có thể dễ dàng nhận được giải pháp cho các thách thức [tài liệu Python, Stack Overflow, Medium, v.v.]
Vậy tôi có nên bỏ Excel?Không, bạn không cần phải. Các thư viện Python như gấu trúc đã được thiết kế để bạn có thể dễ dàng nhập dữ liệu của mình từ Excel sang Python và quay lại Excel. Vì vậy, thay vì cố gắng tạo 'trang chính' đó trong Excel để chứa hàng trăm sổ làm việc nguồn của bạn, bạn có thể sử dụng Python để kết nối tất cả các sổ làm việc nguồn đó để phân tích, sau đó xuất kết quả phân tích của bạn trở lại Excel để trình bày cho ban quản lý. Với kiến thức về Python, bạn có thể nâng cao khả năng phân tích và báo cáo Excel của mình
Đôi khi tôi còn nghe nói rằng “Python là Excel mới. ” Nó thực sự như thế nào?
Mục lục
- Python và Excel không có cùng mục đích
- con trăn. chiến lược hơn, nhưng phức tạp hơn
- Excel vẫn đang phát triển
- Sự kết luận
- Để đi xa hơn
Python và Excel không có cùng mục đích
Khi tôi nghe mọi người so sánh cả hai công cụ, tôi nhận ra rằng họ đang thiếu một điểm quan trọng. chúng được thiết kế cho các chức năng rất khác nhau
Excel trước hết là một bảng tính. sự đơn giản của giao diện đồ họa của nó cho phép bất kỳ người dùng nào thao tác dữ liệu mà không cần bất kỳ khái niệm nào về mã cơ bản
Python là một ngôn ngữ lập trình. việc sử dụng nó không giới hạn trong việc quản lý dữ liệu; . Rõ ràng là cần phải học cách viết mã để sử dụng Python
Vậy tại sao chúng ta thường đánh đồng hai công cụ này?
Đơn giản vì tính linh hoạt tuyệt vời của Python cho phép nó tái tạo khá nhanh các tính năng chính của Excel. lưu trữ các giá trị trên một hàng, trên một cột, trên một bảng và thực hiện các phép tính trên cùng các giá trị đó. Bạn thậm chí có thể sử dụng các thư viện để trực quan hóa dữ liệu, vẽ biểu đồ… Python không có giới hạn về phân tích dữ liệu
Ví dụ: đây là hồi quy tuyến tính đơn giản trên bộ dữ liệu Doanh số bán hàng hàng năm gồm 2 mặt hàng
Trong Excel, tất cả đều tương tác. chúng ta có thể ghi dữ liệu ngay vào bảng và thực hiện hồi quy với tùy chọn đường cong xu hướng của đồ thị Excel. Với Python, mọi thứ phải được mã hóa bằng các gói mã nguồn mở
Vì vậy, chúng tôi có thể thực hiện phân tích dữ liệu trên cả hai công cụ, nhưng Python hoàn toàn là về lập trình và phát triển và không dành cho bất kỳ Người dùng doanh nghiệp ngẫu nhiên nào sử dụng. Điều có thể xảy ra trong tương lai là Tự động hóa do các nhóm lập trình Python dẫn đầu sẽ loại bỏ nhu cầu thực hiện một số nhiệm vụ bởi các chuyên gia Chuỗi cung ứng trên Excel. Nhưng nó sẽ là một hệ quả kinh doanh cấp cao, không chỉ thay thế phần mềm này bằng phần mềm khác ở cấp độ người dùng
con trăn. chiến lược hơn, nhưng phức tạp hơn
Python là ngôn ngữ chiến lược trong Chuỗi cung ứng
Khối lượng dữ liệu do các công ty quản lý ngày càng tăng và các chuyên gia chuỗi cung ứng có quyền truy cập vào nhiều dữ liệu hơn cả về số lượng và chủng loại. Khối lượng càng lớn, càng khó quản lý chúng bằng các công cụ máy tính để bàn đơn giản. Python là một giải pháp tuyệt vời để xử lý lượng lớn thông tin. Sức mạnh tính toán của nó không thua gì Excel
Nó cũng mang đến cơ hội mang lại nhiều trí thông minh hơn thông qua các thuật toán Machine Learning. Python vượt trội trong lĩnh vực này
Nó có cú pháp tương đối đơn giản với ít dòng mã so với các ngôn ngữ khác. Nó phổ biến trong cộng đồng khoa học, vì nó được hưởng lợi từ nhiều thư viện nguồn mở cho phép các mô hình học máy và thống kê được áp dụng khá nhanh
Tuy nhiên, Python phức tạp hơn nhiều để nắm bắt. Để cung cấp cho bạn một mức độ lớn, tôi muốn nói rằng phải mất ít nhất 50 giờ học để bắt đầu đạt được kết quả [giả sử bạn đã biết cách viết mã. ]. Vì nó chỉ là một ngôn ngữ lập trình nên nó không có giao diện đồ họa tiêu chuẩn của riêng nó và bị so sánh với giao diện rất trực quan của Excel. Đây là một trong những khó khăn chính của tôi khi bắt đầu với Python
Một điểm quan trọng khác. xung quanh bạn sẽ không có nhiều người có thể hiểu và cập nhật các chương trình của bạn bằng Python. Trừ khi bạn cộng tác với một nhóm các nhà phát triển Python hoặc Nhà khoa học dữ liệu, khả năng duy trì các chương trình của bạn sẽ khó khăn. Và bạn sẽ tự xử lý khi thuật toán của bạn gặp sự cố
Excel vẫn đang phát triển
Chúng ta có xu hướng quên rằng Microsoft tiếp tục đổi mới khá nhất quán về tính năng của các công cụ văn phòng của mình. Các mô-đun Excel như Power Query và Power Pivot đã đạt đến mức hoàn thiện tốt trong những năm gần đây. Chúng đặc biệt phù hợp với các vấn đề chúng ta gặp phải trong lĩnh vực hậu cần
Bất kể bối cảnh nào trong Chuỗi cung ứng, thường cần phải trải qua 7 bước này khi phân tích dữ liệu
- Nhập dữ liệu
- Làm sạch nó
- củng cố nó
- Tạo hình cho nó
- Thiết lập KPI và tính toán
- Hợp nhất nó trên bảng điều khiển
- Và phân tích nó để đưa ra quyết định đúng đắn
Power Query được sử dụng để nhập dữ liệu và Power Pivot để xây dựng mô hình dữ liệu [bạn có thể xem thêm chi tiết về cách chúng hoạt động trên trang web chính thức của Microsoft]. Vì vậy, hai mô-đun này rất bổ sung cho nhau và cho phép bạn tự động hóa các bước từ 1 đến 4. Nhiều dự án tự động hóa phức tạp trước đây, yêu cầu nhiều mã VBA, giờ đây có thể được thực hiện bằng các công cụ trực quan hơn nhiều
Ngoài ra, Power Query và Power Pivot đang làm cho Macro Visual Basic trở nên lỗi thời, phức tạp hơn và kém hiệu quả hơn
Chúng tôi thấy rõ điều này trên lượng tìm kiếm của Google
Vì vậy, Microsoft Excel vẫn còn nhiều năm phía trước. Tôi biết từ kinh nghiệm rằng nhiều người không sử dụng hết tiềm năng của nó, thường là không nhận ra điều đó
Sự kết luận
Vậy… Python hay Excel? . Tuy nhiên, chúng có thể so sánh được trong Chuỗi cung ứng, theo nghĩa là chúng có thể được sử dụng cho cùng mục đích trích xuất, xử lý và phân tích dữ liệu từ Hệ thống thông tin. Trong khi Excel cung cấp sự đơn giản, trực quan hóa và phân tích nhanh, thì Python cung cấp các giải pháp về khả năng mở rộng, sức mạnh tính toán và các thuật toán phức tạp
Tùy thuộc vào trình độ lập trình và nhu cầu kinh doanh của bạn, có thể đáng để tham gia Python. Tuy nhiên, bài phát biểu của tôi luôn giống nhau, trước tiên hãy nắm vững nền tảng của doanh nghiệp của bạn trước khi đi sâu vào sự phức tạp
Bắt đầu với việc thành thạo Excel ở cấp độ rất nâng cao và tự động hóa càng nhiều càng tốt. Riêng với Power Query/Pivot. Bằng cách này, bạn sẽ đạt được rất nhiều năng suất và nổi bật trên thị trường việc làm. Chỉ sau đó, nếu bạn có niềm yêu thích với các con số, bạn có thể bắt đầu đào tạo về Python. Nếu bạn là Nhà khoa học dữ liệu ngày nay, rõ ràng bạn cần phải thành thạo Python, nhưng phần lớn các Nhà khoa học dữ liệu mà tôi biết đều đã rất xuất sắc về Excel
Trong mọi trường hợp, bạn nên đưa ra ý kiến của riêng mình, hãy tự kiểm tra Power Query/Pivot và Python
Để đi xa hơn
Nếu bạn muốn phát triển kỹ năng và tăng sức hấp dẫn của mình, hãy xem các bài viết của tôi
- Làm thế nào để trở thành một nhà quản lý chuỗi cung ứng. 6 trụ cột
- Ngôn ngữ lập trình cho Chuỗi cung ứng
- Phần mềm chuỗi cung ứng & ERP
Edouard Thieuleux
Người sáng lập AbcSupplyChain. Chuyên gia chuỗi cung ứng. 15 năm kinh nghiệm tại 6 quốc gia khác nhau –> Theo dõi tôi trên LinkedIn