Python thử nghiệm tính quy tắc đa biến
Thử nghiệm Henze-Zirkler [1] có sức mạnh tổng thể tốt so với các lựa chọn thay thế cho quy tắc và hoạt động đối với mọi kích thước và cỡ mẫu Show
Được điều chỉnh cho Python từ mã Matlab [2] của Antonio Trujillo-Ortiz và được thử nghiệm với gói MVN R Các hàng có giá trị bị thiếu sẽ tự động bị xóa Người giới thiệu 1Henze, N. , & Zirkler, B. (1990). Một lớp các bài kiểm tra nhất quán bất biến cho tính quy tắc đa biến. Truyền thông trong Thống kê-Lý thuyết và Phương pháp, 19(10), 3595-3617 2Trujillo-Ortiz, A. , R. Hernandez-Walls, K. Barba-Rojo và L. Cupul-Magana. (2007). HZmvntest. Kiểm tra tính quy tắc đa biến của Henze-Zirkler. Một tập tin MATLAB (CI[0,0] * (x - mX) + CI[1,0] * (y - mY) , CI[0,1] * (x - mX) + CI[1,1] * (y - , là ma trận 2x2, likeisSau đó, kết quả hiện tại, là vectơ hàng 2D, được nhân (tích bên trong) với vectơ cột , cuối cùng mang lại cho chúng ta vô hướngCI[0,0](x - mX)^2 + (CI[1,0] + CI[0,1])(y - mY)(x - mX) + CI[1,1](y - mY Việc triển khai biểu thức này bằng NumPy sẽ dễ dàng hơn so với , mặc dù chúng có cùng giá trị.
Kết quả Tệp này chứa văn bản Unicode hai chiều có thể được diễn giải hoặc biên dịch khác với nội dung hiển thị bên dưới. Để xem lại, hãy mở tệp trong trình chỉnh sửa hiển thị các ký tự Unicode bị ẩn. Tìm hiểu thêm về các ký tự Unicode hai chiều Ngẫu nhiên là ngẫu nhiên như thế nào? . Bất cứ khi nào bạn đang tạo dữ liệu, chuỗi hoặc số ngẫu nhiên trong Python, bạn nên có ít nhất một ý tưởng sơ bộ về cách dữ liệu đó được tạo Tại đây, bạn sẽ đề cập đến một số tùy chọn khác nhau để tạo dữ liệu ngẫu nhiên trong Python, sau đó xây dựng để so sánh từng tùy chọn về mức độ bảo mật, tính linh hoạt, mục đích và tốc độ của nó Tôi hứa rằng hướng dẫn này sẽ không phải là một bài học về toán học hay mật mã, những thứ mà ngay từ đầu tôi đã không được trang bị tốt để giảng bài. Bạn sẽ học toán nhiều như cần thiết, và không còn nữa Ngẫu nhiên là ngẫu nhiên như thế nào?Đầu tiên, một tuyên bố từ chối trách nhiệm nổi bật là cần thiết. Hầu hết dữ liệu ngẫu nhiên được tạo bằng Python không hoàn toàn ngẫu nhiên theo nghĩa khoa học của từ này. Thay vào đó, nó là giả ngẫu nhiên. được tạo bằng trình tạo số giả ngẫu nhiên (PRNG), về cơ bản là bất kỳ thuật toán nào để tạo dữ liệu có vẻ ngẫu nhiên nhưng vẫn có thể tái tạo Các số ngẫu nhiên “đúng” có thể được tạo bởi, bạn đoán xem, một bộ tạo số ngẫu nhiên thực (TRNG). Một ví dụ là liên tục nhặt một con súc sắc trên sàn, tung nó lên không trung và để nó tiếp đất theo cách nó có thể. Giả sử rằng cú tung của bạn không thiên vị, bạn thực sự không biết con súc sắc sẽ rơi vào số nào. Tung xúc xắc là một hình thức sử dụng phần cứng thô sơ để tạo ra một con số không mang tính quyết định. (Hoặc, bạn có thể nhờ xúc xắc làm việc này cho bạn. ) TRNG nằm ngoài phạm vi của bài viết này nhưng dù sao cũng đáng được đề cập để so sánh PRNG, thường được thực hiện bằng phần mềm thay vì phần cứng, hoạt động hơi khác một chút. Đây là một mô tả ngắn gọn
Bạn có thể đã được yêu cầu “đọc tài liệu. " tại một số điểm. Chà, những người đó không sai. Đây là một đoạn trích đặc biệt đáng chú ý từ tài liệu của mô-đun 2 mà bạn không muốn bỏ lỡ
Bạn có thể đã thấy 3, 4, hoặc tương tự, trong Python. Lệnh gọi hàm này đang khởi tạo trình tạo số ngẫu nhiên cơ bản được sử dụng bởi mô-đun 2 của Python. Đó là những gì làm cho các cuộc gọi tiếp theo để tạo các số ngẫu nhiên mang tính xác định. đầu vào A luôn tạo ra đầu ra B. Phước lành này cũng có thể là một lời nguyền nếu nó được sử dụng ác ýCó lẽ thuật ngữ “ngẫu nhiên” và “tất định” dường như không thể tồn tại cạnh nhau. Để làm cho điều đó rõ ràng hơn, đây là một phiên bản rút gọn của 6 lặp đi lặp lại tạo ra một số "ngẫu nhiên" bằng cách sử dụng 7. 8 ban đầu được định nghĩa là một giá trị hạt giống và sau đó biến thành một chuỗi số xác định dựa trên hạt giống đó________số 8 Đừng lấy ví dụ này theo nghĩa đen, vì nó chủ yếu nhằm minh họa khái niệm. Nếu bạn sử dụng giá trị khởi đầu 1234, chuỗi lệnh gọi tiếp theo tới 6 phải luôn giống hệt nhau>>> 0Bạn sẽ sớm thấy một minh họa nghiêm túc hơn về điều này Loại bỏ các quảng cáo“Bảo mật bằng mật mã” là gì?Nếu bạn chưa có đủ với các từ viết tắt của RNG RNG, hãy thêm một từ nữa vào hỗn hợp. CSPRNG hoặc PRNG bảo mật bằng mật mã. CSPRNG phù hợp để tạo dữ liệu nhạy cảm như mật khẩu, trình xác thực và mã thông báo. Đưa ra một chuỗi ngẫu nhiên, thực tế không có cách nào để Malicious Joe xác định chuỗi nào xuất hiện trước hoặc sau chuỗi đó trong một chuỗi các chuỗi ngẫu nhiên Một thuật ngữ khác mà bạn có thể thấy là entropy. Tóm lại, điều này đề cập đến mức độ ngẫu nhiên được giới thiệu hoặc mong muốn. Ví dụ: một mô-đun Python mà bạn sẽ đề cập ở đây xác định 10, số byte sẽ trả về theo mặc định. Các nhà phát triển cho rằng đây là byte "đủ" để tạo ra đủ tiếng ồnGhi chú. Thông qua hướng dẫn này, tôi giả sử rằng một byte đề cập đến 8 bit, như nó đã có từ những năm 1960, chứ không phải là một số đơn vị lưu trữ dữ liệu khác. Bạn có thể gọi đây là một octet nếu bạn thích Một điểm quan trọng về CSPRNG là chúng vẫn là giả ngẫu nhiên. Chúng được thiết kế theo một cách nào đó mang tính tất định nội bộ, nhưng chúng thêm một số biến khác hoặc có một số thuộc tính khiến chúng “đủ ngẫu nhiên” để cấm sao lưu vào bất kỳ chức năng nào thực thi thuyết tất định Những gì bạn sẽ trình bày ở đâyVề mặt thực tế, điều này có nghĩa là bạn nên sử dụng PRNG đơn giản để lập mô hình thống kê, mô phỏng và để tái tạo dữ liệu ngẫu nhiên. Chúng cũng nhanh hơn đáng kể so với CSPRNG, như bạn sẽ thấy ở phần sau. Sử dụng CSPRNG cho các ứng dụng bảo mật và mật mã khi bắt buộc phải có độ nhạy của dữ liệu Ngoài việc mở rộng các trường hợp sử dụng ở trên, trong hướng dẫn này, bạn sẽ đi sâu vào các công cụ Python để sử dụng cả PRNG và CSPRNG
Bạn sẽ chạm vào tất cả những điều trên và kết thúc bằng một so sánh cấp cao PRNG trong PythonMô-đun >>> random.seed(444) >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 >>> random.seed(444) # Re-seed >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 2Có lẽ công cụ được biết đến rộng rãi nhất để tạo dữ liệu ngẫu nhiên trong Python là mô-đun 2 của nó, sử dụng thuật toán Mersenne Twister PRNG làm trình tạo cốt lõi của nóTrước đó, bạn đã chạm vào một thời gian ngắn trên 18 và bây giờ là thời điểm tốt để xem nó hoạt động như thế nào. Trước tiên, hãy xây dựng một số dữ liệu ngẫu nhiên mà không cần gieo hạt. Hàm 19 trả về một số float ngẫu nhiên trong khoảng [0. 0, 1. 0). Kết quả sẽ luôn nhỏ hơn điểm cuối bên phải (1. 0). Đây còn được gọi là phạm vi bán mở>>> 1Nếu bạn tự chạy mã này, tôi cá rằng số tiền tiết kiệm cả đời của tôi sẽ được trả về trên máy của bạn sẽ khác. Mặc định khi bạn không khởi tạo trình tạo là sử dụng thời gian hệ thống hiện tại của bạn hoặc "nguồn ngẫu nhiên" từ hệ điều hành của bạn nếu có sẵn Với 18, bạn có thể tái tạo kết quả và chuỗi cuộc gọi sau 18 sẽ tạo ra cùng một chuỗi dữ liệu>>>
Lưu ý sự lặp lại của các số "ngẫu nhiên". Chuỗi số ngẫu nhiên trở nên xác định hoặc hoàn toàn được xác định bởi giá trị hạt giống, 444 Hãy xem xét một số chức năng cơ bản hơn của 2. Ở trên, bạn đã tạo một số float ngẫu nhiên. Bạn có thể tạo một số nguyên ngẫu nhiên giữa hai điểm cuối trong Python bằng hàm 63. Điều này kéo dài toàn bộ khoảng thời gian [x, y] và có thể bao gồm cả hai điểm cuối>>> 1Với 64, bạn có thể loại trừ phía bên phải của khoảng, nghĩa là số được tạo luôn nằm trong [x, y) và sẽ luôn nhỏ hơn điểm cuối bên phải>>> 6Nếu bạn cần tạo số float ngẫu nhiên nằm trong khoảng [x, y] cụ thể, bạn có thể sử dụng 65, lấy từ phân phối đồng đều liên tục>>> 1Để chọn một phần tử ngẫu nhiên từ một chuỗi không trống (như danh sách hoặc bộ dữ liệu), bạn có thể sử dụng 66. Ngoài ra còn có 67 để chọn nhiều phần tử từ một chuỗi có thay thế (có thể trùng lặp) 4Để bắt chước lấy mẫu mà không cần thay thế, hãy sử dụng 68>>> 6Bạn có thể chọn ngẫu nhiên một chuỗi tại chỗ bằng cách sử dụng 69. Điều này sẽ sửa đổi đối tượng trình tự và ngẫu nhiên hóa thứ tự của các phần tử>>> 8Nếu bạn không muốn thay đổi danh sách ban đầu, trước tiên bạn cần tạo một bản sao và sau đó xáo trộn bản sao. Bạn có thể tạo các bản sao của danh sách Python bằng mô-đun 10 hoặc chỉ 11 hoặc 12, trong đó 8 là danh sáchTrước khi chuyển sang tạo dữ liệu ngẫu nhiên với NumPy, hãy xem xét thêm một ứng dụng có liên quan một chút. tạo ra một chuỗi các chuỗi ngẫu nhiên duy nhất có độ dài đồng đều Nó có thể giúp suy nghĩ về thiết kế của chức năng đầu tiên. Bạn cần chọn từ một “nhóm” các ký tự như chữ cái, số và/hoặc dấu chấm câu, kết hợp chúng thành một chuỗi duy nhất, sau đó kiểm tra xem chuỗi này chưa được tạo chưa. Python 14 hoạt động tốt cho loại thử nghiệm thành viên này 00 15 nối các chữ cái từ 67 thành một mã Python duy nhất 17 có độ dài 18. Mã thông báo này được thêm vào tập hợp, không được chứa các bản sao và vòng lặp 19 thực thi cho đến khi tập hợp có số lượng phần tử mà bạn chỉ địnhNguồn. Mô-đun 40 của Python chứa một số hằng số hữu ích. 41, 42, 43, 44, và một số khácHãy thử chức năng này >>> 01Đối với phiên bản tinh chỉnh của hàm này, câu trả lời Stack Overflow này sử dụng các hàm tạo, liên kết tên và một số thủ thuật nâng cao khác để tạo phiên bản 45 nhanh hơn, an toàn bằng mật mã ở trênLoại bỏ các quảng cáoPRNG cho mảng. >>> random.seed(444) >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 >>> random.seed(444) # Re-seed >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 12Một điều bạn có thể nhận thấy là phần lớn các hàm từ 2 trả về một giá trị vô hướng (một 48, 49 hoặc đối tượng khác). Nếu bạn muốn tạo một chuỗi các số ngẫu nhiên, một cách để đạt được điều đó là hiểu danh sách Python>>> 02Nhưng có một tùy chọn khác được thiết kế riêng cho việc này. Bạn có thể nghĩ gói 12 của riêng NumPy giống như gói 2 của thư viện chuẩn, nhưng đối với mảng NumPy. (Nó cũng được tải với khả năng rút ra từ nhiều phân phối thống kê hơn. )Hãy lưu ý rằng 12 sử dụng PRNG của riêng nó, tách biệt với 2 cũ đơn giản. Bạn sẽ không tạo ra các mảng NumPy ngẫu nhiên một cách xác định bằng một lệnh gọi tới 18 của chính Python>>> 03Không có gì khó chịu, đây là một vài ví dụ để kích thích sự thèm ăn của bạn >>> 04Trong cú pháp của 65, các tham số 66 là tùy chọn và cho biết hình dạng của đối tượng cuối cùng. Ở đây, 67 tạo một mảng 2d có 3 hàng và 4 cột. dữ liệu sẽ là tôi. i. d. , nghĩa là mỗi điểm dữ liệu được vẽ độc lập với các điểm khácMột thao tác phổ biến khác là tạo một chuỗi các giá trị Boolean ngẫu nhiên, 68 hoặc 69. Một cách để làm điều này là với 80. Tuy nhiên, trên thực tế, việc chọn từ 81 và sau đó chuyển đổi các số nguyên này thành các giá trị Boolean tương ứng của chúng nhanh hơn khoảng 4 lần>>> 05Còn việc tạo dữ liệu tương quan thì sao? . Một cách để giải quyết vấn đề này là sử dụng hàm 82 của NumPy, hàm này tính đến ma trận hiệp phương sai. Nói cách khác, để rút ra từ một biến ngẫu nhiên phân phối bình thường, bạn cần chỉ định giá trị trung bình và phương sai (hoặc độ lệch chuẩn) của nóĐể lấy mẫu từ phân phối chuẩn đa biến, bạn chỉ định ma trận phương tiện và hiệp phương sai, và bạn kết thúc bằng nhiều chuỗi dữ liệu tương quan, mỗi chuỗi dữ liệu được phân phối xấp xỉ chuẩn Tuy nhiên, thay vì hiệp phương sai, tương quan là thước đo quen thuộc và trực quan hơn đối với hầu hết mọi người. Đó là hiệp phương sai được chuẩn hóa bằng tích của các độ lệch chuẩn và do đó bạn cũng có thể xác định hiệp phương sai theo tương quan và độ lệch chuẩn Vì vậy, bạn có thể lấy các mẫu ngẫu nhiên từ phân phối chuẩn đa biến bằng cách chỉ định ma trận tương quan và độ lệch chuẩn không? . Ở đây, S là một vectơ của độ lệch chuẩn, P là ma trận tương quan của chúng và C là ma trận hiệp phương sai (hình vuông) kết quả Điều này có thể được thể hiện bằng NumPy như sau 06Bây giờ, bạn có thể tạo hai chuỗi thời gian tương quan nhưng vẫn ngẫu nhiên >>> 07Bạn có thể coi 83 là 500 cặp điểm dữ liệu tương quan nghịch. Đây là cách kiểm tra độ chính xác mà bạn có thể quay lại đầu vào ban đầu, xấp xỉ 84, 85 và 86 từ phía trên>>> 08Trước khi chúng tôi chuyển sang CSPRNG, có thể hữu ích khi tóm tắt một số chức năng 2 và các đối tác 12 của chúngPython 2 ModuleNumPy CounterpartUse 6 001Random float trong [0. 0, 1. 0) 002 003Random integer in [a, b] 004 005Random integer in [a, b) 006 007Random float in [a, b] 008 009Random element from 010 011 009Random 18 elements from 010 with replacement 015 009 with 017Random 18 elements from 010 without replacement 020 021Shuffle the sequence 8 in place 023 or Ghi chú. NumPy chuyên dùng để xây dựng và thao tác với các mảng lớn, đa chiều. Nếu bạn chỉ cần một giá trị duy nhất, thì 2 là đủ và có thể sẽ nhanh hơn nữa. Đối với các chuỗi nhỏ, 2 thậm chí có thể nhanh hơn, bởi vì NumPy đi kèm với một số chi phíBây giờ bạn đã đề cập đến hai tùy chọn cơ bản cho PRNG, hãy chuyển sang một vài tùy chọn thích ứng an toàn hơn Loại bỏ các quảng cáoCSPRNG trong Python>>> random.seed(444) >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 >>> random.seed(444) # Re-seed >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 030. Giới thiệu ngẫu nhiên như nó có đượcHàm 030 của Python được sử dụng bởi cả 14 và 15 (cả hai hàm này bạn sẽ thấy ngay sau đây). Không đi vào quá nhiều chi tiết, 030 tạo các byte ngẫu nhiên phụ thuộc vào hệ điều hành có thể được gọi là bảo mật bằng mật mã một cách an toàn
Với 030, không có khái niệm gieo thủ công. Mặc dù về mặt kỹ thuật vẫn là giả ngẫu nhiên, chức năng này phù hợp hơn với cách chúng ta nghĩ về tính ngẫu nhiên. Đối số duy nhất là số byte cần trả về>>> 09Trước khi chúng ta tiếp tục, đây có thể là thời điểm tốt để đi sâu vào một bài học nhỏ về mã hóa ký tự. Nhiều người, bao gồm cả tôi, có một số phản ứng dị ứng khi họ nhìn thấy các đối tượng 038 và một hàng dài các ký tự 039. Tuy nhiên, thật hữu ích khi biết các chuỗi như 8 ở trên cuối cùng được chuyển thành chuỗi hoặc số như thế nào 030 trả về một chuỗi các byte đơn>>> 10Nhưng làm thế nào để điều này cuối cùng lại biến thành một Python 17 hoặc một dãy số?Đầu tiên, hãy nhớ lại một trong những khái niệm cơ bản của điện toán, đó là một byte được tạo thành từ 8 bit. Bạn có thể coi một bit là một chữ số duy nhất là 0 hoặc 1. Một byte chọn một cách hiệu quả giữa 0 và 1 tám lần, vì vậy cả 043 và 044 đều có thể đại diện cho byte. Hãy thử điều này, sử dụng chuỗi f Python được giới thiệu trong Python 3. 6, trong thông dịch viên của bạn>>> 11Điều này tương đương với 045, với một số định dạng đặc biệt. 046 chuyển đổi một số nguyên thành biểu diễn nhị phân của nó dưới dạng một chuỗiĐiều đó để chúng ta ở đâu? . (Không có ý định chơi chữ. ) Cho rằng chúng tôi được phép có 8 bit, mỗi bit có 2 lựa chọn, có thể có các tổ hợp _______1048 byte. ” Điều này có nghĩa là mỗi byte ánh xạ tới một số nguyên từ 0 đến 255. Nói cách khác, chúng ta sẽ cần nhiều hơn 8 bit để biểu diễn số nguyên 256. Bạn có thể xác minh điều này bằng cách kiểm tra xem 049 hiện là 9 chứ không phải 8Được rồi, bây giờ hãy quay lại kiểu dữ liệu 038 mà bạn đã thấy ở trên, bằng cách xây dựng một chuỗi các byte tương ứng với các số nguyên từ 0 đến 255>>> 12Nếu bạn gọi 051, bạn sẽ quay lại danh sách Python chạy từ 0 đến 255. Nhưng nếu bạn chỉ in 052, bạn sẽ nhận được một chuỗi trông xấu xí với đầy dấu gạch chéo ngược>>> 13Các dấu gạch chéo ngược này là các chuỗi thoát và 053 đại diện cho ký tự có giá trị hex 054. Một số thành phần của 052 được hiển thị theo nghĩa đen (các ký tự có thể in được như chữ cái, số và dấu chấm câu). Hầu hết được thể hiện với lối thoát. 056 đại diện cho khoảng lùi của bàn phím, trong khi 057 là dấu xuống dòng (một phần của dòng mới, trên hệ thống Windows)Nếu bạn cần xem lại hệ thập lục phân, Charles Petzold's Code. The Hidden Language là một nơi tuyệt vời cho điều đó. Hex là một hệ thống đánh số cơ số 16, thay vì sử dụng từ 0 đến 9, sử dụng từ 0 đến 9 và a đến f làm các chữ số cơ bản của nó Cuối cùng, hãy quay lại nơi bạn đã bắt đầu, với chuỗi byte ngẫu nhiên 8. Hy vọng rằng điều này có ý nghĩa hơn một chút bây giờ. Gọi 059 trên một đối tượng 038 sẽ cho một 17 số thập lục phân, với mỗi số tương ứng với một số thập phân từ 0 đến 255>>> 14Một câu hỏi cuối cùng. làm thế nào là 062 dài 12 ký tự ở trên, mặc dù 8 chỉ có 6 byte? . Phiên bản 17 của 038 sẽ luôn dài gấp đôi tầm mắt của chúng taNgay cả khi byte (chẳng hạn như 066) không cần biểu diễn đủ 8 bit, thì 062 sẽ luôn sử dụng hai chữ số hex trên mỗi byte, do đó, số 1 sẽ được biểu thị là 068 thay vì chỉ 069. Tuy nhiên, về mặt toán học, cả hai đều có cùng kích thướcChi tiết kỹ thuật. Điều bạn chủ yếu mổ xẻ ở đây là làm thế nào một đối tượng 038 trở thành một 17 Python. Một tính kỹ thuật khác là làm thế nào mà 038 do 030 tạo ra được chuyển đổi thành 49 trong khoảng thời gian [0. 0, 1. 0), như trong phiên bản bảo mật bằng mật mã của 19. Nếu bạn muốn khám phá điều này hơn nữa, đoạn mã này sẽ minh họa cách 076 thực hiện chuyển đổi ban đầu thành số nguyên, sử dụng hệ thống đánh số cơ sở 256Với điều đó trong vành đai của bạn, hãy chạm vào một mô-đun được giới thiệu gần đây, 14, mô-đun này giúp tạo mã thông báo bảo mật thân thiện hơn nhiều với người dùngLoại bỏ các quảng cáoPython được giữ tốt nhất >>> random.seed(444) >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 >>> random.seed(444) # Re-seed >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 14Được giới thiệu trong Python 3. 6 bởi một trong những PEP nhiều màu sắc hơn hiện có, mô-đun 14 được dự định là mô-đun Python trên thực tế để tạo các chuỗi và byte ngẫu nhiên được bảo mật bằng mật mãBạn có thể kiểm tra mã nguồn của mô-đun, mã này ngắn và dễ hiểu với khoảng 25 dòng mã. 14 về cơ bản là một trình bao bọc xung quanh 030. Nó chỉ xuất một số hàm để tạo số, byte và chuỗi ngẫu nhiên. Hầu hết các ví dụ này nên khá tự giải thích>>> 15Bây giờ, làm thế nào về một ví dụ cụ thể? . com hay bit. ly biến một URL khó sử dụng thành một cái gì đó như https. //chút. ly/2IcCp9u. Hầu hết các trình rút gọn không thực hiện bất kỳ thao tác băm phức tạp nào từ đầu vào đến đầu ra; Giả sử rằng sau khi xem Cơ sở dữ liệu vùng gốc, bạn đã đăng ký trang web ngắn. ly. Đây là một chức năng giúp bạn bắt đầu với dịch vụ của mình 16Đây có phải là một minh họa thực tế đầy đủ? . Tôi sẽ đặt cược chút đó. ly thực hiện mọi thứ theo cách nâng cao hơn một chút so với việc lưu trữ mỏ vàng của nó trong từ điển Python toàn cầu không liên tục giữa các phiên Ghi chú. Nếu bạn muốn xây dựng một công cụ rút ngắn URL chính thức của riêng mình, thì hãy xem Xây dựng một công cụ rút ngắn URL với FastAPI và Python Tuy nhiên, nó gần như chính xác về mặt khái niệm >>> 17Giữ lấy. Một điều bạn có thể nhận thấy là cả hai kết quả này đều có độ dài 7 khi bạn yêu cầu 5 byte. Đợi đã, tôi nghĩ rằng bạn nói rằng kết quả sẽ dài gấp đôi? . Có một điều nữa đang xảy ra ở đây. 082 sử dụng mã hóa base64, trong đó mỗi ký tự là 6 bit dữ liệu. (Đó là từ 0 đến 63 và các ký tự tương ứng. Các ký tự là A-Z, a-z, 0-9 và +/. )Nếu ban đầu bạn chỉ định một số byte nhất định 083, thì độ dài kết quả từ 084 sẽ là 085, bạn có thể chứng minh và điều tra thêm nếu tò mòĐiểm mấu chốt ở đây là, trong khi 14 thực sự chỉ là một trình bao bọc xung quanh các hàm Python hiện có, thì nó có thể là mục tiêu của bạn khi bảo mật là mối quan tâm hàng đầu của bạnMột ứng cử viên cuối cùng. >>> random.seed(444) >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 >>> random.seed(444) # Re-seed >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 15Một tùy chọn cuối cùng để tạo mã thông báo ngẫu nhiên là hàm 088 từ mô-đun 15 của Python. UUID là Mã định danh duy nhất toàn cầu, một chuỗi 128 bit ( 17 có độ dài 32) được thiết kế để “đảm bảo tính duy nhất trong không gian và thời gian. ” 088 là một trong những chức năng hữu ích nhất của mô-đun và chức năng này cũng sử dụng 030>>> 18Điều thú vị là tất cả các hàm của 15 đều tạo ra một thể hiện của lớp 094, lớp này đóng gói ID và có các thuộc tính như 095, 096 và 097>>> 19Bạn cũng có thể đã thấy một số biến thể khác. 098, 099 và 100. Sự khác biệt chính giữa những chức năng này và 088 là ba chức năng đó đều có một số dạng đầu vào và do đó không đáp ứng định nghĩa về “ngẫu nhiên” trong phạm vi mà UUID phiên bản 4 đáp ứng
Ngược lại, 088 hoàn toàn là giả ngẫu nhiên (hoặc ngẫu nhiên). Nó bao gồm nhận 16 byte thông qua 030, chuyển đổi số này thành số nguyên lớn cuối và thực hiện một số thao tác theo bit để tuân thủ thông số kỹ thuật chính thứcHy vọng rằng đến giờ bạn đã hiểu rõ về sự khác biệt giữa các “loại” dữ liệu ngẫu nhiên khác nhau và cách tạo chúng. Tuy nhiên, một vấn đề khác có thể xuất hiện trong đầu là va chạm Trong trường hợp này, một xung đột chỉ đơn giản đề cập đến việc tạo hai UUID phù hợp. Cơ hội của điều đó là gì? . có thể có giá trị 107 hoặc 340 tỷ tỷ giá trị 108. Vì vậy, tôi sẽ để bạn tự đánh giá xem điều này có đủ đảm bảo để có một giấc ngủ ngon hay không.Một cách sử dụng phổ biến của 15 là ở Django, có một 110 thường được sử dụng làm khóa chính trong cơ sở dữ liệu quan hệ cơ bản của mô hìnhLoại bỏ các quảng cáoTại sao không chỉ “Mặc định là” >>> random.seed(444) >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 >>> random.seed(444) # Re-seed >>> random.random() 0.3088946587429545 >>> random.random() 0.01323751590501987 111?Ngoài các mô-đun bảo mật được thảo luận ở đây, chẳng hạn như 14, mô-đun 2 của Python thực sự có một lớp ít được sử dụng gọi là 111 sử dụng 030. ( 111, ngược lại, cũng được sử dụng bởi 14. Tất cả chỉ là một trang web có nguồn gốc từ 118. )Tại thời điểm này, bạn có thể tự hỏi tại sao bạn không chỉ "mặc định" phiên bản này? Tôi đã đề cập đến một lý do. đôi khi bạn muốn dữ liệu của mình mang tính xác định và có thể tái tạo để người khác theo dõi cùng Nhưng lý do thứ hai là CSPRNG, ít nhất là trong Python, có xu hướng chậm hơn đáng kể so với PRNG. Hãy kiểm tra điều đó bằng một tập lệnh, 120, so sánh các phiên bản PRNG và CSPRNG của 005 bằng cách sử dụng 122 của Python 0Bây giờ để thực hiện điều này từ trình bao 1Sự khác biệt về thời gian gấp 5 lần chắc chắn là một sự cân nhắc hợp lệ bên cạnh bảo mật bằng mật mã khi lựa chọn giữa hai Vụn vặt. bămMột khái niệm chưa được chú ý nhiều trong hướng dẫn này là băm, có thể được thực hiện với mô-đun 123 của PythonBăm được thiết kế để trở thành ánh xạ một chiều từ giá trị đầu vào sang chuỗi có kích thước cố định mà hầu như không thể đảo ngược kỹ thuật. Như vậy, mặc dù kết quả của hàm băm có thể “trông giống” dữ liệu ngẫu nhiên, nhưng nó không thực sự đủ điều kiện theo định nghĩa ở đây Tóm tắt lạiBạn đã bao phủ rất nhiều nền tảng trong hướng dẫn này. Tóm lại, đây là so sánh cấp cao về các tùy chọn có sẵn cho bạn về tính ngẫu nhiên kỹ thuật trong Python Gói/Mô-đun Mô tả Bảo mật bằng mật mã 2Dữ liệu ngẫu nhiên nhanh chóng và dễ dàng bằng cách sử dụng Mersenne TwisterKhông 12Giống như 2 nhưng đối với các mảng (có thể là đa chiều)Không 13Chứa 118, cơ sở của các chức năng khác được đề cập ở đâyCó 14Được thiết kế để trở thành mô-đun thực tế của Python để tạo các số, byte và chuỗi ngẫu nhiên an toànCó 15Trang chủ cho một số chức năng cho Vui lòng để lại một số nhận xét hoàn toàn ngẫu nhiên bên dưới và cảm ơn vì đã đọc Liên kết bổ sung
Đánh dấu là đã hoàn thành Xem ngay Hướng dẫn này có một khóa học video liên quan do nhóm Real Python tạo. Xem nó cùng với hướng dẫn bằng văn bản để hiểu sâu hơn. Tạo dữ liệu ngẫu nhiên bằng Python 🐍 Thủ thuật Python 💌 Nhận một Thủ thuật Python ngắn và hấp dẫn được gửi đến hộp thư đến của bạn vài ngày một lần. Không có thư rác bao giờ. Hủy đăng ký bất cứ lúc nào. Được quản lý bởi nhóm Real Python Gửi cho tôi thủ thuật Python » Giới thiệu về Brad Solomon Brad là một kỹ sư phần mềm và là thành viên của Nhóm hướng dẫn Python thực sự » Thông tin thêm về BradMỗi hướng dẫn tại Real Python được tạo bởi một nhóm các nhà phát triển để nó đáp ứng các tiêu chuẩn chất lượng cao của chúng tôi. Các thành viên trong nhóm đã làm việc trong hướng dẫn này là Adriana Geir Arne Joanna Bậc thầy Kỹ năng Python trong thế giới thực Với quyền truy cập không giới hạn vào Python thực Tham gia với chúng tôi và có quyền truy cập vào hàng nghìn hướng dẫn, khóa học video thực hành và cộng đồng các Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bậc thầy Kỹ năng Python trong thế giới thực Tham gia với chúng tôi và có quyền truy cập vào hàng ngàn hướng dẫn, khóa học video thực hành và cộng đồng Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bạn nghĩ sao? Đánh giá bài viết này Tweet Chia sẻ Chia sẻ EmailBài học số 1 hoặc điều yêu thích mà bạn đã học được là gì? Mẹo bình luận. Những nhận xét hữu ích nhất là những nhận xét được viết với mục đích học hỏi hoặc giúp đỡ các sinh viên khác. Nhận các mẹo để đặt câu hỏi hay và nhận câu trả lời cho các câu hỏi phổ biến trong cổng thông tin hỗ trợ của chúng tôi |