Hướng dẫn python heapify time complexity - Python đống thời gian phức tạp
Nó đòi hỏi phân tích cẩn thận hơn, chẳng hạn như bạn sẽ tìm thấy ở đây. Cái nhìn sâu sắc cơ bản là chỉ có gốc của đống thực sự có độ sâu 0. Xuống tại các nút trên một chiếc lá - nơi một nửa các nút sống - một chiếc lá được đâm vào vòng lặp vòng trong đầu tiên. Show
Đạo hàm "chính xác"Vẫy tay một số, khi thuật toán đang nhìn vào một nút ở gốc của cây con với các phần tử 1, có khoảng 2 các phần tử trong mỗi đống đơn. Vì vậy, tổng thời gian 4 cần thiết là về
Đó là một sự tái phát không phổ biến. Phương pháp AkraTHER Bazzi có thể được sử dụng để suy luận rằng đó là 5.Tôi nghĩ rằng nhiều thông tin hơn, và chắc chắn là satifying hơn, là để rút ra một giải pháp chính xác từ đầu. Để đạt được điều đó, tôi sẽ chỉ nói về những cây nhị phân hoàn chỉnh: đầy đủ nhất có thể ở mọi cấp độ. Sau đó, có tổng cộng 6, và tất cả các cây con cũng là những cây nhị phân hoàn chỉnh. Những chi tiết vô nghĩa này về cách tiến hành khi mọi thứ không cân bằng chính xác.Khi chúng ta nhìn vào một cây con với các yếu tố 7, hai phần tử con của nó có chính xác các yếu tố ____88 mỗi phần tử và có các cấp 9. Ví dụ, đối với một cây có 7 phần tử, có 1 phần tử ở gốc, 2 phần tử ở cấp độ thứ hai và 4 phần ba. Sau khi các cây con bị đặn, gốc phải di chuyển vào vị trí, di chuyển nó xuống 0, 1 hoặc 2 cấp độ. Điều này đòi hỏi phải so sánh giữa các cấp 0 và 1, và cũng có thể giữa các cấp 1 và 2 (nếu gốc cần di chuyển xuống), nhưng không còn điều đó: công việc cần thiết tỷ lệ thuận với 0. Trong tất cả, sau đó,
Đối với một số 1 không đổi, giới hạn trường hợp xấu nhất để so sánh các yếu tố ở một cặp cấp độ liền kề.Còn 2 thì sao? MIỄN PHÍ! Một cây chỉ có 1 phần tử đã là một đống - không có gì để làm.
Một cấp trên những chiếc lá đó, cây có 3 yếu tố. Nó có giá (không hơn) 1 để di chuyển nhỏ nhất (cho một min-heap; lớn nhất cho một heap tối đa) sang đầu.
Một cấp độ trên rằng cây có 7 yếu tố. Nó có giá 4 để làm cho mỗi người bị con, và sau đó không nhiều hơn 5 để di chuyển gốc vào vị trí:
Tiếp tục theo cùng một cách:
trong đó dòng cuối cùng là một dự đoán ở dạng chung. Bạn có thể xác minh rằng "nó hoạt động" cho tất cả các dòng cụ thể trước đó, và sau đó thật đơn giản để chứng minh nó bằng cảm ứng. Vì vậy, trong đó 6,
trong đó cho thấy 4 được giới hạn ở trên bởi 8, do đó chắc chắn là 5. Người nói là sai trong trường hợp này. Chi phí thực tế là 8. Heapify chỉ được gọi trên các yếu tố 9 đầu tiên của Itable. Đó là 0, nhưng không đáng kể nếu 9 nhỏ hơn nhiều so với 2. Sau đó, tất cả các yếu tố còn lại được thêm vào "đống nhỏ" này thông qua 3, mỗi lần một. Điều đó mất 4 thời gian cho mỗi lần gọi 3. Độ dài của đống vẫn còn 9 trong suốt. Cuối cùng, đống được sắp xếp, có giá 7, nhưng điều đó cũng không đáng kể nếu 9 nhỏ hơn nhiều so với 2.Nội dung chính ShowShow
Vui vẻ với lý thuyết ;-)Tham khảo Python Tổng quan và hướng dẫn về mô -đun Python from heapq import nsmallest nsmallest(10, data) 6Tại sao bạn nên quan tâm đến đống và from heapq import nsmallest nsmallest(10, data) 6 Có được các bản ghi nhỏ nhất (và lớn nhất) từ bộ dữ liệuTham khảo PythonTổng quan và hướng dẫn về mô -đun Python from heapq import nsmallest nsmallest(10, data) 6Tại sao bạn nên quan tâm đến đống và from heapq import nsmallest nsmallest(10, data) 6Có được các bản ghi nhỏ nhất (và lớn nhất) từ bộ dữ liệu Hợp nhất các bộ dữ liệu được sắp xếp thành một bộ dữ liệu được sắp xếp Tạo và thao tác các đống Tóm lại là...
Tại sao bạn nên quan tâm đến đống và from heapq import nsmallest nsmallest(10, data) 6Có được các bản ghi nhỏ nhất (và lớn nhất) từ bộ dữ liệu Hợp nhất các bộ dữ liệu được sắp xếp thành một bộ dữ liệu được sắp xếp 6 78 9Mô-đun HEAPQ của Python thực hiện các bản heaps nhị phân bằng danh sách. Nó cung cấp một API để trực tiếp tạo và thao tác các đống, cũng như một bộ chức năng tiện ích cấp cao hơn: heapq.nsmallest, heapq.nlargest và heapq.merge. Có được các bản ghi nhỏ nhất (và lớn nhất) từ bộ dữ liệuNếu bạn có bộ dữ liệu, bạn có thể có được K nhỏ nhất hoặc lớn nhất bằng cách sắp xếp và cắt nó. Nhưng, nó có thể hiệu quả hơn khi sử dụng heapq.nsmallest và heapq.nlargest. Ví dụ. Tôi muốn 10 bản ghi nhỏ nhất từ bộ dữ liệu với 10.000.000 bản ghi:
Và, tôi cũng có thể sử dụng Heapq.nsmallest để làm điều này: 9 34 5Nhưng Heapq.nsmallest chạy một thứ tự nhanh hơn. Ví dụ. 0,29 giây so với 3,91 giây: 70 7172 73Điều này là do độ phức tạp về thời gian của việc lấy K bản ghi nhỏ nhất từ bộ dữ liệu của N phần tử là ...
Vì vậy, bạn nên sử dụng Sắp xếp hoặc Danh sách.Sort? Còn Min và Max thì sao?
Lý do mà tôi nói "nếu k là 'nhỏ'" là bởi vì - theo lý thuyết, mặc dù độ phức tạp về thời gian của heapq.nsmallest sẽ luôn luôn tốt như điều đó, o (n log n) - trong Thực hành, Timsort của Python có thể nhanh hơn khi k gần n. Cách tốt nhất để tìm ra nếu bạn nên sử dụng heapq.nsmallest hoặc được sắp xếp là thử cả hai và đo kết quả. Hợp nhất các bộ dữ liệu được sắp xếp thành một bộ dữ liệu được sắp xếpNếu bạn có một số bộ dữ liệu được sắp xếp và bạn muốn hợp nhất chúng thành một bộ dữ liệu được sắp xếp duy nhất, bạn có thể kết hợp chúng và sắp xếp kết quả. . Ví dụ. Tôi có 7 bộ dữ liệu được sắp xếp - trong các tệp trên đĩa - với 1.000.000 bản ghi: 74Tôi muốn hợp nhất các bộ dữ liệu này thành một bộ dữ liệu được sắp xếp - trên đĩa. Tôi có thể làm điều này bằng cách kết hợp các bộ dữ liệu với itertools.chain.from_iterable và sau đó sử dụng chức năng tích hợp được sắp xếp: 75Hoặc, tôi cũng có thể hợp nhất các bộ dữ liệu này với Heapq.merge: 76Mặc dù Heapq.merge chạy chậm hơn một chút - ví dụ: 10,9 s so với 6,7 giây - nó sử dụng bộ nhớ ít hơn nhiều - ví dụ: 144 kb so với 811.036 kb:slower -- e.g., 10.9 s vs. 6.7 s -- it uses much less memory -- e.g., 144 kB vs. 811,036 kB:slower -- e.g., 10.9 s vs. 6.7 s -- it uses much less memory -- e.g., 144 kB vs. 811,036 kB: 77 7879 8081 8283 84Sự cảnh báo ở đây là các bộ dữ liệu đầu vào phải được sắp xếp. Tạo và thao tác các đốngHeapq cung cấp một API để tạo trực tiếp và điều khiển một min-heap nhị phân. Heapq đại diện cho một danh sách tối thiểu nhị phân làm danh sách, vì vậy một đống trống chỉ là một danh sách trống: 85 85Một danh sách có thể được biến thành một đống tại chỗ bằng cách sử dụng Heapq.Heapify:in-place using heapq.heapify:in-place using heapq.heapify: 87 88Phần tử tối thiểu là phần tử đầu tiên của danh sách: 89 9091 5Bạn có thể đẩy các phần tử lên đống bằng Heapq.HeAppush và bạn có thể bật các phần tử ra khỏi đống bằng Heapq.HeAppop: 93 8895 9097 9899 0Heapq cũng cung cấp các phương thức phím tắt Heapq.HeAppushpop và Heapq.Heapreplace:
Nếu bạn muốn tạo một đống kích thước cố định:
Nếu bạn muốn tạo một heap tối đa (thay vì một min-heap):
Tóm lại là...Trong bài đăng tuần này, bạn đã tìm hiểu về mô -đun HEAPQ của Python. Bạn đã học cách trực tiếp tạo và thao tác các mục tiêu tối thiểu nhị phân, cũng như cách sử dụng các hàm tiện ích cấp cao để có được K nhỏ nhất (hoặc lớn nhất) từ bộ dữ liệu và hợp nhất nhiều bộ dữ liệu được sắp xếp vào một bộ dữ liệu được sắp xếp. Thử thách của tôi với bạn:
Nếu bạn thích bài đăng trong tuần này, hãy chia sẻ nó với bạn bè của bạn và theo dõi bài đăng vào tuần tới. Gặp bạn sau! (Nếu bạn phát hiện ra bất kỳ lỗi hoặc lỗi chính tả nào trên bài đăng này, liên hệ với tôi qua trang liên hệ của tôi.) Độ phức tạp về thời gian cho Heapq Nlargest là gì?Chi phí thực tế là o (n * log (t)). Heapify chỉ được gọi trên các yếu tố T đầu tiên của Itable. Đó là o (t), nhưng không đáng kể nếu t nhỏ hơn n nhiều. Sau đó, tất cả các yếu tố còn lại được thêm vào "đống nhỏ" này thông qua Heppushpop, mỗi lần một.O(n * log(t)) . Heapify is called only on the first t elements of the iterable. That's O(t) , but is insignificant if t is much smaller than n . Then all the remaining elements are added to this "little heap" via heappushpop , one at a time.O(n * log(t)) . Heapify is called only on the first t elements of the iterable. That's O(t) , but is insignificant if t is much smaller than n . Then all the remaining elements are added to this "little heap" via heappushpop , one at a time. Độ phức tạp thời gian là gì?Heapq là một đống nhị phân, với O (log n) đẩy và o (log n) pop.Xem mã nguồn Heapq.Thuật toán bạn hiển thị lấy o (n log n) để đẩy tất cả các mục lên đống, sau đó O ((n-k) log n) để tìm phần tử lớn nhất thứ k.Vì vậy, độ phức tạp sẽ là o (n log n).Nó cũng yêu cầu O (N) thêm không gian.O(log n) push and O(log n) pop . See the heapq source code. The algorithm you show takes O(n log n) to push all the items onto the heap, and then O((n-k) log n) to find the kth largest element. So the complexity would be O(n log n). It also requires O(n) extra space.O(log n) push and O(log n) pop . See the heapq source code. The algorithm you show takes O(n log n) to push all the items onto the heap, and then O((n-k) log n) to find the kth largest element. So the complexity would be O(n log n). It also requires O(n) extra space. Heapq có nhanh không?HEAPQ nhanh hơn so với sắp xếp trong trường hợp nếu bạn cần thêm các phần tử trên con ruồi, tức là bổ sung và chèn có thể theo thứ tự không xác định.Thêm phần tử mới bảo tồn thứ tự bên trong trong bất kỳ heap nào nhanh hơn so với mảng nghỉ dưỡng sau mỗi lần chèn. i.e. additions and insertions could come in unspecified order. Adding new element preserving inner order in any heap is faster than resorting array after each insertion. i.e. additions and insertions could come in unspecified order. Adding new element preserving inner order in any heap is faster than resorting array after each insertion. Heapq nlargest lớn nhất trong Python là gì?HEAPQ.nlargest (n, itable, key = none) trả về một danh sách với các phần tử lớn nhất từ bộ dữ liệu được xác định bởi ITable.Khóa, nếu được cung cấp, chỉ định hàm của một đối số được sử dụng để trích xuất một khóa so sánh từ mỗi phần tử trong ITable (ví dụ: key = str.Lower).Return a list with the n largest elements from the dataset defined by iterable. key, if provided, specifies a function of one argument that is used to extract a comparison key from each element in iterable (for example, key=str.lower ).Return a list with the n largest elements from the dataset defined by iterable. key, if provided, specifies a function of one argument that is used to extract a comparison key from each element in iterable (for example, key=str.lower ). |