Sử dụng cài đặt numpy python

Trong bài viết này, chúng ta sẽ tìm hiểu khái niệm Numpy là gì, kèm theo đó là hướng dẫn cài đặt và chạy chương trình Hello World bằng Numpy, một thư viện của Python

Bài viết này đã được đăng tại freetuts. net , không được sao chép dưới mọi hình thức.

Chắc chắn Numpy là thư viện mà bạn phải học khi muốn nghiên cứu về Data Science, vì vậy đừng bỏ lỡ những bài viết được chia sẻ tại freetuts nhé

1. Numpy là gì?

NumPy là một thư viện dành cho ngôn ngữ lập trình Python, hỗ trợ lý lý cho các mảng và ma trận lớn, nhiều chiều, cùng với rất nhiều hàm toán học, đây là công cụ xử lý không thể thiếu cho một người bắt đầu với

Lưu trữ và xử lý trên các mảng dữ liệu là nền tảng cơ sở của Khoa học Dữ liệu [Khoa học Dữ liệu]. Các nguồn dữ liệu có thể có rất nhiều định dạng khác nhau, chẳng hạn như một bộ ảnh, các tệp âm thanh, video,. Dù định dạng không đồng nhất, chúng ta có thể hiểu cơ bản rằng, tất cả các dữ liệu đó đều có thể biểu diễn bên dưới các mảng, và các mảng đó đều chứa các con số

Bài viết này đã được đăng tại [free tuts. mạng lưới]

Hạn chế, ta có thể hiểu các hình ảnh trên máy tính chính là các mảng 2 chiều, một hình ảnh có kích thước 64x64 có thể biểu diễn bên dưới mảng 2 chiều kích thước 64x64, với mỗi phần tử chính là 1 pixel tương ứng. Hay các tệp âm thanh có thể biểu diễn bên dưới mảng 1 chiều, trong đó mỗi phần đại diện tử cho tần số tương ứng trong khoảng thời gian định trước

Các giới hạn như ảnh bên dưới

There could not be export to a array 2 width as after

Bất kể loại dữ liệu mà ta có là gì, thì bước đầu tiên trong xử lý công việc chính là biểu diễn chúng dưới dạng các mảng số. Và NumPy chính là thư viện mạnh nhất để làm việc đó

2. Numpy used to do what?

Python là một trong những ngôn ngữ được sử dụng nhiều nhất trong Khoa học dữ liệu. Hệ sinh thái của Python dành cho Data Science bao gồm. NumPy, SciPy, Matplotlib, IPython, Sympy và Pandas, thì NumPy [viết tắt cho Numerical Python] chính là phần cốt lõi, sử dụng NumPy là bắt buộc nếu ta cần làm việc trên bất cứ mảng nào của Data Science

Từ cơ bản thứ hai trong công việc xử lý và thao tác trên các mảng dữ liệu đơn giản, để nâng cao như xử lý các mảng với số lượng lớn, tính toán [cộng, nhân, nghịch đảo, chuyển vị trí ma trận,. ] vốn rất khó để xử lý nếu ta sử dụng List đơn thuần trong Python [và tốc độ cũng kém hơn khá nhiều]

NumPy có thể được sử dụng để thực hiện các phép toán trên mảng như quy trình lượng giác, thống kê và đại số, nó chứa một lượng lớn các hàm toán học, đại số và biến đổi. Bên cạnh đó, NumPy hỗ trợ rất nhiều hàm tạo ngẫu nhiên ngẫu nhiên [các trình tạo số ngẫu nhiên], và vì vốn được viết trên C, cũng như hỗ trợ rất nhiều hàm, NumPy rất nhanh [nhanh hơn nhiều so với List], cũng như . Ứng dụng của NumPy rất đa dạng, và hầu như ai muốn học về Khoa học dữ liệu cũng cần phải học về NumPy

3. Hướng dẫn cài đặt NumPy

To install NumPy, dĩ nhiên, ta cần phải có Python. Nếu như bạn chưa cài đặt Python thì mình khuyến khích sử dụng Anaconda, nó bao gồm Python, NumPy và các thư viện phổ biến được sử dụng khác nhau để tính toán khoa học và xử lý dữ liệu

Ngoài ra, NumPy hoàn toàn có thể cài đặt như một gói Python thông thường, bạn có thể cài đặt qua Pip bằng câu lệnh

pip install numpy

Or if used conda

conda install numpy

Với người mới, mình khuyến khích các bạn làm theo các bước sau

1. Cài đặt Anaconda [giúp cài đặt tất cả các gói bạn cần và tất cả các công cụ khác được cập nhật ở bên dưới]

2. Để viết mã, sử dụng sổ ghi chép trong JupyterLab

3. Sử dụng Anaconda Navigator để quản lý các gói sẽ cài đặt

4. Viết ứng dụng Hello World với NumPy

Đầu tiên, chúng ta có thể kiểm tra phiên bản của NumPy như dưới đây [trong thời điểm viết bài thì phiên bản NumPy là 1. 19. 2]

In [1]: 

import numpy as np np.__version__ 

Out[1]: '1.19.2'

Từ bài viết này trở về sau, và trong tất cả các chương trình liên quan đến Khoa học dữ liệu, ta sẽ mặc định sử dụng np làm bí danh cho NumPy [ở đây cũng là biến bí danh phổ biến được sử dụng trong cộng đồng NumPy]

* Lưu ý. Nếu sử dụng Jupyter Notebook, thì bạn có thể đọc bài viết về IPython, đây là một công cụ hữu ích giúp ta tăng hiệu suất làm việc với NumPy

Không giới hạn, hiển thị tất cả các không gian tên bằng cách nhấn TAB

Hoặc hiển thị tài liệu có sẵn của NumPy bằng cách bổ sung “?”

5. Tổng kết

Qua bài viết này, chúng tôi đã tìm hiểu được cơ bản về NumPy là gì, cũng như cách sử dụng và cách cài đặt NumPy. Đây là một công cụ rất quan trọng nếu bạn đang muốn tìm hiểu về Data Science. Trong bài tiếp theo, chúng ta sẽ cùng bắt đầu làm việc và thao tác với NumPy. Hẹn gặp các bạn ở bài tiếp theo nhé

Chủ Đề