Hướng dẫn python and excel for data analysis - python và excel để phân tích dữ liệu
Bạn có biết cách sử dụng Microsoft Excel và muốn tìm hiểu cách phân tích dữ liệu với Python không? Bạn là người may mắn. Chúng tôi vừa xuất bản một khóa học trên kênh YouTube Freecodecamp.org sẽ dạy bạn cách phân tích dữ liệu với Python. Khóa học này sẽ đặc biệt hữu ích nếu bạn có kinh nghiệm với Excel, nhưng điều đó không bắt buộc. Frank Andrade đã phát triển khóa học này. Frank là một nhà khoa học dữ liệu và giáo viên xuất sắc. Trong khóa học này, bạn sẽ tìm hiểu cách tạo các bảng xoay, làm việc với dữ liệu và thực hiện trực quan hóa bằng cách sử dụng máy tính xách tay Python, Gandas và Jupyter. Dưới đây là tất cả các chủ đề bạn sẽ tìm hiểu trong khóa học này: Xem toàn bộ khóa học bên dưới hoặc trên kênh YouTube freecodecamp.org (đồng hồ 4 giờ). Học mã miễn phí. Chương trình giảng dạy nguồn mở của Freecodecamp đã giúp hơn 40.000 người có được việc làm với tư cách là nhà phát triển. Bắt đầu Đăng ký một tài khoản miễn phí và thử các khóa học tương tác của chúng tôi tại Python, R, SQL, v.v. Làm thế nào để bạn phân tích dữ liệu trong Excel bằng Python? Phân tích dữ liệu với Python cho khóa học người dùng Excel. Hướng dẫn này giả định rằng bạn có kiến thức cấp trung gian về Excel, bao gồm sử dụng các công thức và bảng trục. Chúng tôi sẽ sử dụng Python Library Pandas, được thiết kế tạo điều kiện phân tích dữ liệu bằng Python, nhưng bạn không cần bất kỳ kiến thức Python hoặc Pandas nào cho hướng dẫn này.pandas, which is designed facilitate data analysis in Python, but you don’t need any Python or pandas knowledge for this tutorial. Tại sao sử dụng Python vs Excel?Trước khi chúng tôi bắt đầu, bạn có thể tự hỏi tại sao Python thậm chí còn đáng để xem xét. Tại sao bạn không thể tiếp tục sử dụng Excel? Mặc dù Excel là tuyệt vời, có một số lĩnh vực làm cho một ngôn ngữ lập trình như Python tốt hơn cho một số loại phân tích dữ liệu nhất định. Dưới đây là một số lý do từ bài viết 9 lý do người dùng Excel nên xem xét việc học lập trình:
Để rõ ràng, chúng tôi không ủng hộ việc bỏ lại Excel - đó là một công cụ mạnh mẽ với nhiều công dụng! Nhưng là một người dùng Excel, việc cũng có thể tận dụng sức mạnh của Python có thể giúp bạn tiết kiệm hàng giờ và mở ra các cơ hội thăng tiến nghề nghiệp. Nó có giá trị ghi nhớ hai công cụ có thể hoạt động tốt song song và bạn có thể thấy rằng một số nhiệm vụ tốt nhất còn lại trong Excel, trong khi những công cụ khác sẽ được hưởng lợi từ sức mạnh, tính linh hoạt và tính minh bạch mà Python cung cấp. Nhập dữ liệu của chúng tôiHãy để bắt đầu bằng cách làm quen với dữ liệu mà chúng tôi sẽ làm việc cho hướng dẫn này. Chúng tôi sẽ sử dụng dữ liệu hư cấu về một công ty với nhân viên bán hàng. Ở đây, dữ liệu của chúng tôi trông như thế nào trong Excel: Dữ liệu của chúng tôi được lưu dưới dạng tệp CSV được gọi là Mã trên nhập gấu trúc và bí danh vào cú pháp Để đọc tệp của chúng tôi, chúng tôi sử dụng Chúng tôi đã chỉ định kết quả của Ngay lập tức, chúng ta có thể nhận thấy một vài khác biệt giữa cách gấu trúc đại diện cho dữ liệu so với những gì chúng ta đã thấy trong Excel:
Trước khi chúng tôi tìm hiểu hoạt động của Pandas đầu tiên, chúng tôi sẽ nhanh chóng tìm hiểu một chút về cách lưu trữ dữ liệu của chúng tôi. Hãy để sử dụng chức năng Đầu ra này cho chúng ta biết rằng biến Sắp xếp dữ liệuHãy cùng học cách sắp xếp dữ liệu của chúng tôi trong Excel và Python. Hiện tại, dữ liệu của chúng tôi không được sắp xếp. Trong Excel, nếu chúng tôi muốn sắp xếp dữ liệu của mình theo cột
Trong gấu trúc, chúng tôi sử dụng phương pháp Chúng tôi cung cấp tên cột cho phương thức để cho nó biết cột nào sẽ sắp xếp bằng cách: Đăng ký một tài khoản miễn phí và thử các khóa học tương tác của chúng tôi tại Python, R, SQL, v.v. Tóm tắt các giá trị bán hàngBa cột cuối cùng của dữ liệu của chúng tôi chứa các giá trị bán hàng trong ba tháng đầu năm, được gọi là quý đầu tiên. Nhiệm vụ tiếp theo của chúng tôi sẽ là tổng hợp các giá trị đó trong cả Excel và Python. Hãy bắt đầu bằng cách nhìn vào cách chúng ta đạt được điều này trong Excel:
Trong gấu trúc, khi chúng tôi thực hiện một thao tác, nó sẽ tự động áp dụng nó cho mỗi hàng cùng một lúc. Chúng tôi sẽ bắt đầu bằng cách chọn cột ba bằng cách sử dụng tên của họ trong danh sách: Tiếp theo, chúng tôi sẽ sử dụng phương thức Trong Pandas, công thức của người Viking mà chúng tôi đã sử dụng được lưu trữ. Thay vào đó, các giá trị kết quả được thêm trực tiếp vào DataFrame của chúng tôi. Nếu chúng tôi muốn thực hiện điều chỉnh các giá trị trong cột mới của chúng tôi, chúng tôi cần phải viết mã mới để thực hiện. Tham gia dữ liệu Trình quản lýTrong bảng tính của chúng tôi, chúng tôi cũng có một bảng dữ liệu nhỏ về ai quản lý từng đội: Hãy cùng xem xét cách tham gia dữ liệu này trong cột
Để làm việc với dữ liệu này trong gấu trúc, trước tiên chúng tôi sẽ cần nhập nó từ CSV thứ hai, Đăng ký một tài khoản miễn phí và thử các khóa học tương tác của chúng tôi tại Python, R, SQL, v.v.
Nếu điều này có vẻ hơi khó hiểu lúc đầu, thì đó là OK. Mô hình tham gia dữ liệu trong Python khác với những gì được sử dụng trong Excel, nhưng nó cũng mạnh hơn rất nhiều. Lưu ý rằng trong Python, chúng tôi có thể chỉ định chính xác cách chúng tôi tham gia dữ liệu của chúng tôi bằng cách sử dụng tên Clear Cú pháp và cột. Thêm một cột có điều kiệnNếu chúng ta nhìn vào cột Bắt đầu với Excel, để thêm cột này, chúng tôi:
Trong gấu trúc, chúng tôi sử dụng hàm Bảng xoay vòngMột trong những tính năng Excel mạnh mẽ nhất là các bảng trục, tạo điều kiện phân tích dữ liệu bằng cách sử dụng tổng hợp. Chúng tôi sẽ xem xét hai ứng dụng bảng xoay khác nhau trong Excel và Python. Chúng tôi sẽ bắt đầu với một bảng trục trong Excel, tính số lượng nhân viên trong mỗi bộ phận: Hoạt động này - đếm số lần một giá trị xảy ra trong một cột - rất phổ biến đến mức trong gấu trúc, nó có cú pháp riêng: Loại sê -ri là mới trong hướng dẫn này, nhưng nó khá giống với một khung dữ liệu, mà chúng tôi đã tìm hiểu. Sê -ri chỉ là biểu diễn gấu trúc của một hàng hoặc cột. Hãy để sử dụng phương pháp PANDAS để tính toán số lượng nhân viên trong mỗi bộ phận: Ví dụ bảng trục thứ hai cũng tổng hợp theo bộ phận, nhưng thay vào đó tính toán doanh số Q1 trung bình: Để tính toán điều này trong gấu trúc, chúng tôi sẽ sử dụng phương pháp
Excel vs Python: Tóm tắtTrong hướng dẫn này, chúng tôi đã học được tương đương Python cho chức năng Excel sau:
Đối với mỗi ví dụ chúng tôi đã xem xét, cú pháp Pandas có độ phức tạp tương tự như các công thức hoặc tùy chọn menu bạn sẽ sử dụng trong Excel. Nhưng Python cung cấp một số lợi thế, giống như xử lý nhanh hơn nhiều bộ dữ liệu lớn, tùy chỉnh và phức tạp hơn và tính minh bạch hơn để kiểm tra và kiểm tra lỗi (vì mọi thứ bạn đã thực hiện rõ ràng đều được trình bày rõ ràng trong mã, thay vì ẩn trong các ô). Ai đó thành thạo Excel không chỉ có khả năng thực hiện bước nhảy vọt để làm việc trong Python. Thêm các kỹ năng Python vào bộ kỹ năng của bạn sẽ giúp bạn trở thành một nhà phân tích nhanh hơn và mạnh mẽ hơn về lâu dài và bạn sẽ khám phá các quy trình công việc mới tận dụng cả Excel và Python để phân tích dữ liệu hiệu quả và mạnh mẽ hơn bạn có thể làm với Excel một mình . Nếu bạn muốn học cách phân tích dữ liệu trong Python, nhà phân tích dữ liệu của chúng tôi trong Python Path là thiết kế để dạy bạn mọi thứ bạn cần biết, ngay cả khi bạn chưa bao giờ mã hóa trước đây. Bạn sẽ bắt đầu với hai khóa học dạy cho bạn các nguyên tắc cơ bản của Python trước khi bạn chuyển sang học thư viện Pandas mà chúng tôi đã làm việc trong hướng dẫn này. Học kỹ năng dữ liệuNhận mức tăng tiếp theo hoặc chuyển sang nghề nghiệp trong khoa học dữ liệu bằng cách học các kỹ năng dữ liệu. Đăng ký một tài khoản miễn phí và thử các khóa học tương tác của chúng tôi tại Python, R, SQL, v.v.free account and try our interactive courses in Python, R, SQL, and more! Làm thế nào để bạn phân tích dữ liệu trong Excel bằng Python?Phân tích dữ liệu với Python cho khóa học người dùng Excel.. Cài đặt Notebook Python và Jupyter với Anaconda .. Giao diện Notebook Jupyter .. Các loại ô và chế độ ô .. Phím tắt máy tính xách tay Jupyter .. Mô -đun 1 - Hello World .. Loại dữ liệu.. Variables.. Lists.. Tôi có thể sử dụng Python với Excel không?Điều này cho phép bạn chạy Python bên trong Excel để mở rộng khả năng của Excel với mã Python của riêng bạn!Cũng có thể tương tác với Excel bằng cách sử dụng một công nghệ gọi là COM.Điều này cho phép một quá trình riêng biệt gọi vào Excel và tập lệnh.! It is also possible to interact with Excel using a technology called COM. This allows a separate process to call into Excel and script it.
Python có thể được sử dụng để phân tích dữ liệu không?Python là một ngôn ngữ lập trình cấp cao, cấp cao được biết đến với cú pháp trực quan bắt chước ngôn ngữ tự nhiên.Bạn có thể sử dụng mã Python cho nhiều tác vụ khác nhau, nhưng ba ứng dụng phổ biến bao gồm: Khoa học dữ liệu và phân tích dữ liệu.three popular applications include: Data science and data analysis. |