Đào tạo Python
Đây là một khóa học dành cho các nhà khoa học và kỹ sư quan tâm đến việc sử dụng Python để giải quyết các vấn đề tính toán phát sinh trong công việc hàng ngày và tự động hóa việc xử lý các loại dữ liệu khoa học khác nhau.
Điều kiện tiên quyết
Một số quen thuộc với các khái niệm lập trình [trong bất kỳ ngôn ngữ nào] được giả định.
Kết quả mong đợi
Đến cuối khóa học, bạn sẽ có tất cả kiến thức bạn cần sử dụng Python để giải quyết các vấn đề liên quan đến việc sử dụng các bộ dữ liệu khoa học khác nhau. Bạn sẽ biết những gì có sẵn với Python, cách cấu trúc mã của bạn và cách sử dụng các cấu trúc dữ liệu của Python một cách thành thạo để viết mã hiệu quả, sạch sẽ. Bạn sẽ có kinh nghiệm sử dụng Python cho các tác vụ thao tác dữ liệu và kịch bản khác nhau, bao gồm dễ dàng tạo các lô đẹp, thực hiện mô phỏng Monte Carlo và phân tích hình ảnh, phân tích dữ liệu chuỗi thời gian, xây dựng các mô hình thống kê và mở rộng quy mô để xử lý cỡ trung bình [phụ [phụ phụ [phụ -terabyte] dữ liệu.
Giáo trình khóa học
Ngày 1: Những điều cơ bản của Python
Ngày 1 bao gồm cách sử dụng Python cho các tác vụ kịch bản và tự động hóa cơ bản, bao gồm các mẹo và thủ thuật để làm cho điều này dễ dàng:
- Tại sao Python? Những gì có thể?
- The & nbsp; Jupyter & nbsp; Notebook để tạo mẫu nhanh chóng Jupyter notebook for rapid prototyping
- Mô -đun và gói
- Các khái niệm Python: Giới thiệu thông qua các ví dụ
- Các loại dữ liệu cần thiết: Chuỗi, bộ dữ liệu, danh sách, dicts
- Ví dụ hoạt động: & NBSP; Truy xuất dữ liệu thời gian thực từ API Web REST
- Tăng và xử lý ngoại lệ
Ngày 2: & NBSP; Xử lý, phân tích và trình bày dữ liệu trong Python Handling, Analyzing, and Presenting Data in Python
Python & nbsp; cung cấp năng suất đáng kinh ngạc & nbsp; công cụ & nbsp; như & nbsp; pandas & nbsp; để làm việc với các loại dữ liệu khác nhau. Ngày 2 đưa ra A & NBSP; Giới thiệu kỹ lưỡng về phân tích và trực quan hóa dữ liệu một cách dễ dàng: like Pandas for working with different kinds of data. Day 2 gives a thorough introduction to analyzing and visualizing data easily:
- Đọc và viết các định dạng dữ liệu cần thiết: CSV, Excel, SQL, sê-ri thời gian [khác theo yêu cầu]
- Lập chỉ mục và chọn dữ liệu trong & nbsp; gấu trúc Pandas
- Fusion dữ liệu: Tham gia và hợp nhất bộ dữ liệu
- Tóm tắt với các hoạt động của nhóm bởi các hoạt động của nhóm; Bảng xoay vòng
- Trực quan hóa và đồ họa thống kê với & nbsp; Plotly Express Plotly Express
- Ví dụ hoạt động: Tạo báo cáo tự động
- Tạo bảng điều khiển tương tác với & nbsp; Streamlit
Ngày 3: Chuỗi thời gian, mô phỏng, phân cụm, phát hiện ngoại lệ
Ngày 3 & nbsp; cho bạn biết cách & nbsp; thao tác với chuỗi thời gian và dữ liệu ma trận/vector. Sau đó, nó đưa ra các ví dụ về mô phỏng Monte Carlo và chỉ cho bạn cách áp dụng các kỹ thuật mạnh mẽ cho hồi quy tuyến tính, phân cụm và phát hiện ngoại lệ / bất thường:
- Phân tích sê-ri Tiime: Ngày phân tích cú pháp; lấy mẫu lại; nội suy
- Giới thiệu về Numpy để thao tác dữ liệu vectơ và ma trận: & nbsp; Kiểu dữ liệu, lập chỉ mục mạnh mẽ, định hình lại, UFUNCS
- Mô phỏng và ứng dụng Monte Carlo
- Phân cụm với scikit-learn: & nbsp; & nbsp; ứng dụng cho hồ sơ khách hàng, điều chỉnh văn bản, định lượng hóa
- Phát hiện ngoại lệ và bất thường với Pyod; Ứng dụng cho chuỗi thời gian
Ngày 4: Học máy
Ngày 4 cung cấp cho bạn một giới thiệu thực tế và toàn diện về học máy để suy ra mạnh mẽ các mô hình phức tạp từ dữ liệu, với các ví dụ được chọn từ một loạt các ngành công nghiệp, bao gồm chuỗi thời gian và bộ dữ liệu không gian:
Trực giác đằng sau ML; Tổng quan về hệ sinh thái gói ML trong Python
Hồi quy tuyến tính và phi tuyến; Ứng dụng cho dự báo chuỗi thời gian
Phân loại; Áp dụng để chẩn đoán, hệ thống AI, hình ảnh vệ tinh, ...
Xác nhận và lựa chọn mô hình; Công cụ chẩn đoán; & NBSP; Yellowbrick yellowbrick
Tính năng Kỹ thuật và Lựa chọn; & NBSP; ELI5 eli5
Triển khai các mô hình học máy trong sản xuất
Tổng quan về các thuật toán ML Core với & nbsp; Scikit-learn: & nbsp; & nbsp; naive Bayes, hồi quy logistic, SVM, rừng ngẫu nhiên scikit-learn: Naive Bayes, logistic regression, SVMs, random forests
Ngày 5: Điện toán khoa học với Python
Ngày 5 dạy cho bạn các công cụ chuyên dụng trong Python cho máy tính khoa học và kỹ thuật. Nó cung cấp cho bạn một giới thiệu toàn diện về SCIPY và hệ sinh thái gói rộng hơn. Sau đó, nó dạy bạn cách lập cấu hình và tăng tốc mã số chậm và cách song song hóa mã cho các bộ dữ liệu lớn trên một số lõi/bộ xử lý hoặc phân phối chúng một cụm.
Buổi sáng: Điện toán khoa học
- Tham quan các gói SCIPY và liên quan, với các bản demo ưa thích:
- Đại số tuyến tính dày đặc & thưa thớt
- Nội suy [ví dụ: đối với dữ liệu có lưới]
- Tối ưu hóa và phù hợp với đường cong
- Mô hình thống kê và ước tính mật độ
- Tích hợp / ODes
- Xử lý tín hiệu & hình ảnh
- Xử lý các đơn vị khoa học và sự không chắc chắn
Chiều: nhân rộng
- Tăng tốc mã từ 4x đến 10.000x:
- hồ sơ, vector hóa, tổng hợp JIT với numba
- Tính toán song song và phân tán với & nbsp; dask dask
Giúp đỡ cá nhân
Chúng tôi & nbsp; rất vui khi cung cấp giải quyết vấn đề tại chỗ sau mỗi ngày của khóa đào tạo & nbsp; để bạn hỏi một chọi một-cho dù về nội dung và bài tập khóa học hoặc về các vấn đề cụ thể mà bạn gặp phải trong công việc và làm thế nào để giải quyết chúng. Nếu bạn muốn chúng tôi chuẩn bị trước cho việc này, bạn được chào đón đến & nbsp; gửi cho chúng tôi thông tin cơ bản trước khóa học. are happy to offer on-the-spot problem-solving after each day of the training for you to ask one-on-one questions — whether about the course content and exercises or about specific problems you face in your work and how to solve them. If you would like us to prepare for this in advance, you are welcome to send us background info before the course.
Thông tin khác
Format:
Các khóa học được thực hiện trực tuyến thông qua cuộc họp video bằng máy chủ Notebook Cloud của Python Charmers để chia sẻ mã với [các] huấn luyện viên.
Computer:
Phần cứng: & nbsp; chúng tôi đề xuất & nbsp; ≥ & nbsp; 8 GB RAM và webcam. Tốt nhất cũng là nhiều màn hình và một phòng yên tĩnh [hoặc mic tai nghe]. we recommend ≥ 8 GB of RAM and a webcam. Preferably also multiple screens and a quiet room [or headset mic].
Phần mềm: & nbsp; Trình duyệt hiện đại: Chrome, Firefox hoặc Safari [không phải IE hay Edge]; và phóng to. a modern browser: Chrome, Firefox, or Safari [not IE or Edge]; and Zoom.
Mã hóa: & nbsp; Chúng tôi có một máy chủ mã hóa dựa trên đám mây hỗ trợ mã chạy và chia sẻ mã với [các] huấn luyện viên. we have a cloud-based coding server that supports running code and sharing code with the trainer[s].
Timing:
Hầu hết các khóa học & nbsp; sẽ chạy từ 9:00 đến khoảng 17:00 [AEST] mỗi ngày, với giờ nghỉ & nbsp; 50 phút & nbsp; cho bữa trưa và & nbsp; 20 phút mỗi buổi sáng và buổi chiều.
Giấy chứng nhận hoàn thành:
Chúng tôi sẽ cung cấp cho bạn một chứng chỉ nếu bạn hoàn thành khóa học và trả lời thành công phần lớn các câu hỏi tập thể dục.
Materials:
Bạn sẽ có quyền truy cập vào tất cả các tài liệu khóa học thông qua máy chủ đám mây.
Chúng tôi cũng sẽ gửi cho bạn một bản sao ràng buộc của các ghi chú khóa học, bảng gian lận và một thanh USB chứa các tài liệu, giải pháp tập thể dục và tài nguyên tiếp theo.