Hướng dẫn python install
Hướng dẫn cài đặt, lập trình Python trên Windows 10 (Xem thêm: Hướng dẫn cài đặt Python trên Ubuntu (Linux)) Download và cài đặt PythonDownload file cài đặt python tại https://www.python.org/downloads/windows/ Chọn version mà bạn muốn cài
đặt. Ở đây mình cài version 3.7 bản Click đúp vào file .exe vừa tải về để cài đặt Chọn tick vào ô Add Python 3.7 to PATH (lựa chọn này giúp bạn chạy lệnh python trên cmd, powershell trên windows) Và click vào Install Now (Bạn có thể đổi đường dẫn folder cài đặt bằng cách chọn phần Customize installation ở dưới) Ngồi chờ python cài đặt. Kết quả: DemoMở thư mục cài đặt Python và click đúp vào Như bạn thấy khi mở cửa sổ terminal nó sẽ hiện version của python mà bạn đã cài. Nhập Thay vì mở file Okay, Done! (Xem thêm: Code ví dụ Python Hello World) References: https://docs.python.org/3/ Cài đặt PythonĐể cài đặt Python lên máy tính, ta cần tải bộ cài Python tại https://www.python.org/downloads/ và cài theo hướng dẫn. Cài đặt pip
Nếu bạn sử dụng Python phiên bản từ 2.7.9 trở lên (đối với Python 2) hoặc 3.4 trở lên (với Python 3), mặc định pip đã được cài đặt sẵn cùng Python. Trong trường hợp bạn đáng sử dụng Python phiên bản thấp hơn như đã nêu ở trên, bạn cần cài đặt pip theo hướng dẫn từ trang chủ https://pip.pypa.io/en/stable/installing/
NumPyĐược tạo bởi Travis Oliphant, NumPy là một “ngựa kéo” phân tích thực sự của Python. Nó cung cấp cho người dùng cách làm việc với các mảng nhiều chiều, cùng một số lượng lớn các hàm để xử lý trên các toán tử toán học nhiều chiều trên các mảng đó. Mảng là các khối dữ liệu được sắp xếp theo nhiều chiều dựa trên các véc tơ và ma trận trong toán học. Mảng thường hữu ích không chỉ trong việc lưu dữ liệu mà cả việc tính toán nhanh các ma trận, điều không thể thiếu khi giải quyết các vấn đề liên quan đến khoa học dữ liệu.
Trang chủ: http://www.numpy.org SciPyLà một dự án gốc bởi Travis Oliphant, Pearu Peterson, and Eric Jones, SciPy hoàn thiện các tính năng của NumPy, nhằm cung cấp các thuật toán cho đại số tuyến tính, không gian ma trận, xử lý tín hiệu và xử lý ảnh, tối ưu, biến đổi Fourier,…
Trang chủ: http://www.scipy.org pandaspandas là thư viện thực hiện mọi thứ mà NymPy và SciPy không thể làm. Nó làm việc với các đối tượng cấu trúc dữ liệu, DataFrames và Chuỗi (Series). pandas cho phép bạn có thể xử lý các bảng dữ liệu phức tạp của nhiều loại khác nhau (điều mà các mảng của NumPy thông thể làm được) và chuỗi thời gian. Bạn sẽ dễ dàng tải dữ liệu từ nhiều nguồn khác nhau, sau đó slide, dice, xử lý các thành phần còn thiếu, thêm, đổi tên, tổng hợp (aggregate), reshape và cuối cùng là trực quan dữ liệu theo ý của bạn.
Trang chủ: http://pandas.pydata.org Scikit-learnBắt đầu như một phần của SciKits, Scikit-learn là lõi hoạt động của khoa học dữ liệu trên Python. Nó cung cấp tất cả những gì bạn cần để tiền xử lý dữ liệu, học giám sát và không giám sát, lựa chọn mô hình, validate và error metrics.
Trang chủ: http://scikit-learn.org/stable IPythonMột cách tiếp cận khoa học yêu cầu thử nghiệm nhanh các giả thuyết khác nhau trong một khoảng thời gian. IPython được tạo bởi Fernando Perez để giải quyết việc cần thiết một lệnh Shell Python (dựa trên shell, trình duyệt web, và giao diện ứng dụng) với đồ họa tích hợp, các lệnh có thể tùy chỉnh, lịch sử phong phú (dưới định dạng JSON) và khả năng tính toán song song để cải thiện hiểu năng tính toán.
Trang chủ: http://ipython.org MatplotlibĐược phát triển bởi John Hunte, matplotlib là một thư viện xây dựng các khối cần thiết để tạo các biểu đồ chất lượng từ mảng và trực quan và tương tác với chúng.
Trang chủ: http://matplotlib.org StatsmodelsTrước đây là một phần của SciKits, Statsmodels bổ sung các tính năng thống kê cho SciPy. Nó bao gồm các mô hình tuyến tính tổng quát (generalized linear models), mô hình lựa chọn rời rạc (discrete choice models), phân tích chuỗi thời gian (time series analysis) và một chuỗi các thống kê mô tả như kiểm định tham số và kiểm định phi tham số (parametric and nonparametric tests).
Trang chủ: http://statsmodels.sourceforge.net |