Hướng dẫn probability and statistics with python github - xác suất và thống kê với python github

Một thẻ đã tồn tại với tên chi nhánh được cung cấp. Nhiều lệnh GIT chấp nhận cả tên thẻ và tên chi nhánh, vì vậy việc tạo nhánh này có thể gây ra hành vi bất ngờ. Bạn có chắc là bạn muốn tạo chi nhánh này?

DSE210x-Statistics-and-Probability-in-Data-Science-using-Python

UCSANDIEGOX EDX Khóa học DSE210X Thống kê và xác suất trong khoa học dữ liệu bằng cách sử dụng Python https://courses.edx.org/courses/course-v1:ucsandiegox+dse210x+3t2017/course/

Chào mừng bạn đến với số liệu thống kê và xác suất trong khoa học dữ liệu bằng Python! Chúng tôi rất vui mừng được chào đón bạn đến số liệu thống kê và xác suất trong khoa học dữ liệu bằng Python. Trong khóa học này, bạn sẽ học được động lực, trực giác và lý thuyết đằng sau các nền tảng xác suất và thống kê của khoa học dữ liệu, và sẽ được thử nghiệm và thực hành với các khái niệm này thông qua các chương trình Python và nền tảng Notebook Jupyter.

Giảng viên nhân viên khóa học Alon Orlitsky, Giáo sư, Bộ phận ECE và CSE, UC San Diego Yoav Freund, Giáo sư, Bộ CSE, UC San Diego

Trợ lý giảng dạy Matthew Elliot, sinh viên tốt nghiệp, CSE, UC San Diego Rohit Parasnis, sinh viên tốt nghiệp, ECE, UC San Diego Hanwen Yao, Sinh viên tốt nghiệp, ECE, UC San Diego Zhen Zhai, sinh viên tốt nghiệp, CSE, UC San Diego

Bạn cần biết gì để thành công? Khóa học dành cho người học có bằng đại học hoặc sinh viên năm cuối quan tâm đến việc mở rộng sự hiểu biết của họ về xác suất và thống kê. Chúng tôi sẽ giả định kiến ​​thức cơ bản về các chủ đề sau đây

Logic (ví dụ: Luật của De Morgan) đặt ra lý thuyết (ví dụ: các chức năng là gì) tính toán (ví dụ: tính toán tích phân và dẫn xuất) lập trình (ví dụ: kinh nghiệm cơ bản với bất kỳ ngôn ngữ lập trình nào) sẽ được sử dụng trong suốt khóa học. Nếu bạn muốn học hoặc thực hành nhiều hơn với Python, vui lòng xem xét xem hoặc tham gia khóa học đầu tiên trong các micromasters này, Python cho khoa học dữ liệu.

Tổng quan Khóa học sẽ bao gồm các chủ đề sau:

Đếm và tổ hợp các xác suất xác suất riêng biệt và xác suất liên tục và các biến số ngẫu nhiên của Bayes kỳ vọng, phương sai, và tương quan các gia đình phân phối phổ biến các đặc điểm xác suất và các thời điểm tập trung và giới hạn các lý thuyết về giả thuyết thử nghiệm và sự tự tin Bạn làm thế nào để hình dung, hiểu và lý do về các khái niệm xác suất và thống kê và cách áp dụng kiến ​​thức của bạn để phân tích các bộ dữ liệu và rút ra kết luận có ý nghĩa từ dữ liệu. Chúng tôi sẽ bao gồm cả các khía cạnh lý thuyết và thực tế, và sẽ bắt đầu từng chủ đề với động lực và trực giác và sẽ tiến hành các lập luận nghiêm ngặt và các kỹ thuật có thể chứng minh. Mỗi chủ đề sẽ được kèm theo một cuốn sổ tay Python mà bạn có thể chạy và sửa đổi để thử nghiệm các tài liệu đã học và cảm nhận tốt hơn về tài liệu được bảo hiểm.

Khóa học phác thảo khóa học bao gồm 10 đơn vị. Trong mỗi khóa học 10 tuần đầu tiên, chúng tôi sẽ phát hành một đơn vị và bạn sẽ có sáu tuần để hoàn thành nó.

● Tuần 1 - Giới thiệu

● Tuần 2 - Bộ

● Tuần 3 - Đếm và Kết hợp

● Tuần 4 - Xác suất và điều hòa

● Tuần 5 - Biến ngẫu nhiên, kỳ vọng và phương sai

● Tuần 6 - Các gia đình phân phối riêng biệt và liên tục

● Tuần 7 - Định lý bất bình đẳng và tập trung

● Tuần 8 - Lấy mẫu, khoảng tin cậy và kiểm tra giả thuyết

● Tuần 9 - Phân tích thành phần hồi quy và chính

● Tuần 10 - Entropy và nén

Python-for-Probability-Statistics-and-Machine-Learning-2E

Hướng dẫn probability and statistics with python github - xác suất và thống kê với python github

Phiên bản thứ hai của văn bản Springer Python cho xác suất, thống kê và học máyPython for Probability, Statistics, and Machine Learning

Cuốn sách này, được cập nhật đầy đủ cho Python phiên bản 3.6+, bao gồm các ý tưởng chính liên kết xác suất, thống kê và máy học được minh họa bằng các mô -đun Python trong các lĩnh vực này. Tất cả các số liệu và kết quả số có thể tái tạo bằng cách sử dụng các mã Python được cung cấp. Tác giả phát triển các trực giác quan trọng trong học máy bằng cách làm việc các ví dụ có ý nghĩa bằng nhiều phương pháp phân tích và mã trăn, do đó kết nối các khái niệm lý thuyết với việc triển khai cụ thể. Bằng chứng chi tiết cho một số kết quả quan trọng cũng được cung cấp. Các mô-đun Python hiện đại như Gandas, Sympy, Scikit-Learn, Tensorflow và Keras được áp dụng để mô phỏng và trực quan hóa các khái niệm học máy quan trọng như sự đánh đổi sai lệch/phương sai, xác thực chéo và chính quy hóa. Nhiều ý tưởng toán học trừu tượng, chẳng hạn như sự hội tụ trong lý thuyết xác suất, được phát triển và minh họa bằng các ví dụ bằng số.

Phiên bản cập nhật này hiện bao gồm thử nghiệm chính xác của Fisher và thử nghiệm Mann-Whitney-Wilcoxon. Một phần mới về phân tích sinh tồn đã được bao gồm cũng như sự phát triển đáng kể của các mô hình tuyến tính tổng quát. Phần học sâu mới để xử lý hình ảnh bao gồm một cuộc thảo luận chuyên sâu về các phương pháp giảm độ dốc làm nền tảng cho tất cả các thuật toán học sâu. Như với phiên bản trước, có các mẹo lập trình mới và cập nhật mà các mô -đun và phương pháp Python Python hiệu quả cho lập trình khoa học và học máy. Có 445 khối mã có khả năng chạy với các đầu ra tương ứng đã được kiểm tra độ chính xác. Hơn 158 trực quan đồ họa (hầu hết tất cả được tạo bằng Python) minh họa các khái niệm được phát triển cả về mã và trong toán học. Chúng tôi cũng thảo luận và sử dụng các mô-đun Python quan trọng như Numpy, Scikit-Learn, Sympy, Scipy, Lifelines, CVXPy, Theano, Matplotlib, Pandas, Tensorflow, StatSmodels và Keras.

Cuốn sách này phù hợp cho bất kỳ ai có trình độ đại học tiếp xúc với xác suất, số liệu thống kê hoặc học máy và với kiến ​​thức thô sơ về lập trình Python.

Hướng dẫn thiết lập Conda

Nếu bạn đang sử dụng conda, bạn có thể bắt đầu bằng cách nhân bản kho lưu trữ này và sử dụng tệp environment.yaml như trong phần sau:

conda env create -n pyPSML -f environment.yaml

và sau đó kích hoạt môi trường bằng cách sử dụng các mục sau,

Sau đó, bạn có thể chạy jupyter notebook và điều hướng các máy tính xách tay Jupyter cho các chương riêng lẻ. Tất cả các máy tính xách tay đều có chức năng đầy đủ trong môi trường được tạo ra này. Lưu ý rằng có các số liệu được nhúng trong các máy tính xách tay Jupyter có nghĩa là để xác nhận các đầu ra của các mã matplotlib trong đó.

Hướng dẫn thiết lập Docker

Nếu bạn đang sử dụng Docker, có một Dockerfile bao gồm. Sau khi nhân bản kho lưu trữ này, bạn có thể xây dựng hình ảnh với phần sau,

docker build -t pypsml2e .

và sau đó chạy nó cục bộ bằng cách sử dụng,

docker container run -it -p 8888:8888 pypsml2e

Sau đó, điều hướng đến URL đầu ra và bạn có thể khám phá các máy tính xách tay Jupyter cho mỗi chương. Xen kẽ, nếu bạn không muốn xây dựng hình ảnh của riêng mình, bạn có thể làm

docker run -p 8888:8888 unpingco/pypsml2e

Để có được hình ảnh Docker từ https://hub.docker.com/r/ungingco/pypsml2e. Lưu ý rằng điều này có thể không được cập nhật như tự xây dựng nó từ kho lưu trữ này, nhưng vẫn nên hoạt động tốt.not be as up-to-date as building it yourself from this repository, but should still work fine.

Nhận xét của bạn (bao gồm cả Errata) được hoan nghênh trong liên kết các vấn đề ở trên.

Chúc may mắn! Tôi hy vọng bạn tìm thấy những tài liệu này hữu ích.