Hướng dẫn how do you find the sparse matrix in python? - làm thế nào để bạn tìm thấy ma trận thưa thớt trong python?

Gói mảng thưa thớt Scipy 2-D cho dữ liệu số.

Ghi chú

Gói này đang chuyển sang giao diện mảng, tương thích với các mảng numpy, từ giao diện ma trận cũ hơn. Chúng tôi khuyên bạn nên sử dụng các đối tượng mảng (bsr_array,

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
0, v.v.) cho tất cả các công việc mới.

Khi sử dụng giao diện mảng, xin lưu ý rằng:

  • >>> np.dot(A.toarray(), v)
    array([ 1, -3, -1], dtype=int64)
    
    1 không còn thực hiện phép nhân ma trận, mà là phép nhân theo phần tử (giống như với các mảng numpy). Để làm cho mã hoạt động với cả mảng và ma trận, hãy sử dụng
    >>> np.dot(A.toarray(), v)
    array([ 1, -3, -1], dtype=int64)
    
    2 để nhân ma trận.

  • Các hoạt động như tổng, được sử dụng để tạo ra các ma trận dày đặc, hiện tạo ra các mảng, có hành vi nhân khác nhau khác nhau.

  • Mảng thưa thớt hiện phải có hai chiều. Điều này cũng có nghĩa là tất cả các hoạt động cắt trên các đối tượng này phải tạo ra kết quả hai chiều hoặc chúng sẽ dẫn đến lỗi. Điều này sẽ được giải quyết trong một phiên bản trong tương lai.

Các tiện ích xây dựng (

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
3,
>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
4,
>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
5,
>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
6, v.v.) vẫn chưa được chuyển, nhưng kết quả của chúng có thể được gói thành các mảng:

Contents#

Các lớp mảng thưa thớt#

bsr_array(arg1[, shape, dtype, copy, blocksize])

Khối mảng hàng thưa thớt

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
0(arg1[, shape, dtype, copy])

Một mảng thưa thớt ở định dạng tọa độ.

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
9(arg1[, shape, dtype, copy])

Mảng cột thưa thớt nén

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
0(arg1[, shape, dtype, copy])

Mảng hàng thưa thớt nén

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
1(arg1[, shape, dtype, copy])

Mảng thưa thớt với lưu trữ đường chéo

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
2(arg1[, shape, dtype, copy])

Từ điển của mảng thưa thớt dựa trên chìa khóa.

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
3(arg1[, shape, dtype, copy])

Danh sách danh sách dựa trên hàng

Các lớp ma trận thưa thớt#

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
4(arg1[, shape, dtype, copy, blocksize])

Chặn ma trận hàng thưa thớt

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
5(arg1[, shape, dtype, copy])

Một ma trận thưa thớt ở định dạng tọa độ.

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
6(arg1[, shape, dtype, copy])

Ma trận cột thưa thớt nén

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
7(arg1[, shape, dtype, copy])

Ma trận hàng thưa thớt nén

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
8(arg1[, shape, dtype, copy])

Ma trận thưa thớt với lưu trữ đường chéo

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand
9(arg1[, shape, dtype, copy])

Từ điển của ma trận thưa thớt dựa trên chìa khóa.

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
0(arg1[, shape, dtype, copy])

Danh sách danh sách dựa trên hàng Ma trận thưa thớt

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
1([maxprint])

Lớp này cung cấp một lớp cơ sở cho tất cả các ma trận thưa thớt.

Functions#

Xây dựng ma trận thưa thớt:

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
3(m[, n, k, dtype, format])

Ma trận thưa thớt với các con đường chéo

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
3(n[, dtype, format])

Ma trận nhận dạng ở định dạng thưa thớt

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
4(A, B[, format])

sản phẩm kronecker của ma trận thưa thớt a và b

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
5(A, B[, format])

tổng hợp kronecker của ma trận thưa thớt a và b

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
6(diagonals[, offsets, shape, format, dtype])

Xây dựng một ma trận thưa thớt từ các đường chéo.

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
7(data, diags[, m, n, format])

Trả về một ma trận thưa thớt từ các đường chéo.

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
8(mats[, format, dtype])

Xây dựng một ma trận thưa thớt đường chéo từ các ma trận được cung cấp.

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))
9(A[, k, format])

Trả về phần hình tam giác thấp hơn của ma trận ở định dạng thưa thớt

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
0(A[, k, format])

Trả về phần hình tam giác phía trên của ma trận ở định dạng thưa thớt

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
1(blocks[, format, dtype])

Xây dựng một ma trận thưa thớt từ các khối phụ thưa thớt

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
2(blocks[, format, dtype])

Stack Ma trận thưa thớt theo chiều ngang (cột khôn ngoan)

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
3(blocks[, format, dtype])

Stack Ma trận thưa thớt theo chiều dọc (hàng khôn ngoan)

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
4(m, n[, density, format, dtype, ...])

Tạo một ma trận thưa thớt của hình dạng và mật độ đã cho với các giá trị phân phối đồng đều.

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)
5(m, n[, density, format, dtype, ...])

Tạo một ma trận thưa thớt của hình dạng và mật độ đã cho với các giá trị phân phối ngẫu nhiên.

Lưu và tải ma trận thưa thớt:

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
6(file, matrix[, compressed])

Lưu ma trận thưa thớt vào một tệp bằng định dạng

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
7.

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
8(file)

Tải một ma trận thưa thớt từ một tệp bằng định dạng

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)
7.

Công cụ ma trận thưa thớt:

>>> x_ = solve(A.toarray(), b)
0(A)

Trả về các chỉ số và giá trị của các phần tử khác của ma trận

Xác định ma trận thưa thớt:

>>> x_ = solve(A.toarray(), b)
1(x)

X có phải là loại ma trận thưa thớt không?

>>> x_ = solve(A.toarray(), b)
2(x)

X có phải là loại ma trận thưa thớt không?

>>> x_ = solve(A.toarray(), b)
3(x)

X của CSC_Matrix có phải là loại không?

>>> x_ = solve(A.toarray(), b)
4(x)

X của loại csr_matrix có phải là không?

>>> x_ = solve(A.toarray(), b)
5(x)

X có phải là loại BSR_Matrix không?

>>> x_ = solve(A.toarray(), b)
6(x)

X của lil_matrix loại?

>>> x_ = solve(A.toarray(), b)
7(x)

X của DOK_MATRIX có phải là loại không?

>>> x_ = solve(A.toarray(), b)
8(x)

X của COO_Matrix có phải là loại không?

>>> x_ = solve(A.toarray(), b)
9(x)

X của Dia_Matrix có phải là loại không?

Submodules#

>>> err = norm(x-x_)
>>> err < 1e-10
True
0

Các thói quen đồ thị thưa thớt nén (scipy.sparse.csgraph)

>>> err = norm(x-x_)
>>> err < 1e-10
True
1

Đại số tuyến tính thưa thớt (scipy.sparse.linalg)

Exceptions#

>>> err = norm(x-x_)
>>> err < 1e-10
True
2

>>> err = norm(x-x_)
>>> err < 1e-10
True
3

Thông tin sử dụng#

Có bảy loại ma trận thưa thớt có sẵn:

  1. CSC_Matrix: Định dạng cột thưa thớt nén

  2. CSR_Matrix: Định dạng hàng thưa thớt nén

  3. BSR_MATRIX: Định dạng hàng thưa thớt

  4. LIL_MATRIX: Danh sách định dạng danh sách

  5. DOK_MATRIX: Dictionary of Keys định dạng

  6. COO_Matrix: Định dạng tọa độ (còn gọi là IJV, định dạng bộ ba)

  7. Dia_Matrix: Định dạng đường chéo

Để xây dựng một ma trận một cách hiệu quả, hãy sử dụng DOK_MATRIX hoặc LIL_MATRIX. Lớp LIL_MATRIX hỗ trợ cắt lát cơ bản và lập chỉ mục ưa thích với một cú pháp tương tự như các mảng numpy. Như được minh họa dưới đây, định dạng COO cũng có thể được sử dụng để xây dựng ma trận hiệu quả. Mặc dù sự tương đồng của chúng với các mảng numpy, nhưng việc sử dụng các chức năng numpy trực tiếp trên các ma trận này không có thể chuyển đổi đúng cách cho các tính toán, dẫn đến kết quả bất ngờ (và không chính xác). Nếu bạn muốn áp dụng chức năng numpy cho các ma trận này, trước tiên hãy kiểm tra xem Scipy có triển khai riêng cho lớp ma trận thưa thớt đã cho hay chuyển đổi ma trận thưa Đầu tiên trước khi áp dụng phương pháp.strongly discouraged to use NumPy functions directly on these matrices because NumPy may not properly convert them for computations, leading to unexpected (and incorrect) results. If you do want to apply a NumPy function to these matrices, first check if SciPy has its own implementation for the given sparse matrix class, or convert the sparse matrix to a NumPy array (e.g., using the toarray() method of the class) first before applying the method.

Để thực hiện các thao tác như phép nhân hoặc đảo ngược, trước tiên hãy chuyển đổi ma trận thành định dạng CSC hoặc CSR. Định dạng LIL_MATRIX dựa trên hàng, do đó chuyển đổi sang CSR là hiệu quả, trong khi chuyển đổi sang CSC là ít hơn.

Tất cả các chuyển đổi giữa các định dạng CSR, CSC và COO là các hoạt động hiệu quả, thời gian tuyến tính.

Sản phẩm vector ma trận#

Để thực hiện một sản phẩm vectơ giữa ma trận thưa thớt và vectơ chỉ cần sử dụng phương thức DOT ma trận, như được mô tả trong tài liệu của nó:

>>> import numpy as np
>>> from scipy.sparse import csr_matrix
>>> A = csr_matrix([[1, 2, 0], [0, 0, 3], [4, 0, 5]])
>>> v = np.array([1, 0, -1])
>>> A.dot(v)
array([ 1, -3, -1], dtype=int64)

Cảnh báo

Kể từ Numpy 1.7, NP.DOT không biết về ma trận thưa thớt, do đó sử dụng nó sẽ dẫn đến kết quả hoặc lỗi không mong muốn. Thay vào đó, mảng dày đặc tương ứng phải được lấy trước tiên: thay vào đó:

>>> np.dot(A.toarray(), v)
array([ 1, -3, -1], dtype=int64)

Nhưng sau đó tất cả các lợi thế hiệu suất sẽ bị mất.

Định dạng CSR đặc biệt phù hợp cho các sản phẩm vector ma trận nhanh.

Ví dụ 1#

Xây dựng 1000x1000 lil_matrix và thêm một số giá trị vào nó:

>>> from scipy.sparse import lil_matrix
>>> from scipy.sparse.linalg import spsolve
>>> from numpy.linalg import solve, norm
>>> from numpy.random import rand

>>> A = lil_matrix((1000, 1000))
>>> A[0, :100] = rand(100)
>>> A[1, 100:200] = A[0, :100]
>>> A.setdiag(rand(1000))

Bây giờ hãy chuyển đổi nó thành định dạng CSR và giải A x = B cho x:

>>> A = A.tocsr()
>>> b = rand(1000)
>>> x = spsolve(A, b)

Chuyển đổi nó thành một ma trận dày đặc và giải quyết, và kiểm tra xem kết quả có giống nhau không:

>>> x_ = solve(A.toarray(), b)

Bây giờ chúng ta có thể tính toán định mức của lỗi với:

>>> err = norm(x-x_)
>>> err < 1e-10
True

Nó phải nhỏ :)

Ví dụ 2#

Xây dựng một ma trận ở định dạng COO:

>>> from scipy import sparse
>>> from numpy import array
>>> I = array([0,3,1,0])
>>> J = array([0,3,1,2])
>>> V = array([4,5,7,9])
>>> A = sparse.coo_matrix((V,(I,J)),shape=(4,4))

Lưu ý rằng các chỉ số không cần phải được sắp xếp.

Các mục trùng lặp (i, j) được tổng hợp khi chuyển đổi sang CSR hoặc CSC.

>>> I = array([0,0,1,3,1,0,0])
>>> J = array([0,2,1,3,1,0,0])
>>> V = array([1,1,1,1,1,1,1])
>>> B = sparse.coo_matrix((V,(I,J)),shape=(4,4)).tocsr()

Điều này rất hữu ích cho việc xây dựng độ cứng nguyên tố hữu hạn và ma trận khối lượng.

Biết thêm chi tiết#

Chỉ số cột CSR không nhất thiết phải được sắp xếp. Tương tự như vậy đối với các chỉ số hàng CSC. Sử dụng các phương thức .sorted_indices () và .sort_indices () khi các chỉ số được sắp xếp được yêu cầu (ví dụ: khi chuyển dữ liệu cho các thư viện khác).

Làm thế nào để bạn tìm thấy sự thưa thớt của một ma trận?

Số lượng các phần tử có giá trị bằng không chia cho tổng số phần tử (ví dụ: M × N cho ma trận M × N) được gọi là độ thưa của ma trận (bằng 1 trừ mật độ của ma trận). (e.g., m × n for an m × n matrix) is called the sparsity of the matrix (which is equal to 1 minus the density of the matrix).

Làm thế nào để bạn thêm một ma trận thưa thớt trong Python?

Một cách đơn giản và hiệu quả để thêm ma trận thưa thớt là chuyển đổi chúng thành dạng bộ ba thưa thớt, nối các bộ ba, sau đó chuyển đổi trở lại định dạng cột thưa thớt.convert them to sparse triplet form, concatenate the triplets, and then convert back to sparse column format.

Làm thế nào để bạn viết một ma trận thưa thớt?

S = thưa thớt (a) Chuyển đổi một ma trận đầy đủ thành dạng thưa thớt bằng cách vắt ra bất kỳ phần tử 0 nào.Nếu một ma trận chứa nhiều số không, việc chuyển đổi ma trận thành lưu trữ thưa thớt sẽ lưu bộ nhớ.S = thưa thớt (m, n) tạo ra một ma trận m -by -n tất cả không.. If a matrix contains many zeros, converting the matrix to sparse storage saves memory. S = sparse( m,n ) generates an m -by- n all zero sparse matrix.

Làm thế nào để bạn chuyển đổi một ma trận thành một ma trận thưa thớt trong Python?

Approach:..
Tạo một danh sách trống sẽ đại diện cho danh sách ma trận thưa thớt ..
Lặp qua ma trận 2D để tìm các phần tử không phải là không ..
Nếu một phần tử không phải là 0, hãy tạo một danh sách trống tạm thời ..
Nối giá trị hàng, giá trị cột và phần tử không phải là không vào danh sách tạm thời ..