Python tính toán độ chính xác từ ma trận nhầm lẫn như thế nào?

Ma trận nhầm lẫn là một trong những số liệu dễ dàng và trực quan nhất được sử dụng để tìm độ chính xác của mô hình phân loại, trong đó đầu ra có thể thuộc hai loại trở lên. Đây là phương pháp phổ biến nhất được sử dụng để đánh giá hồi quy logistic

Không chậm trễ nhiều, hãy bắt đầu

Ma trận nhầm lẫn trong python giúp chúng tôi mô tả hiệu suất của mô hình phân loại. Để xây dựng ma trận nhầm lẫn, tất cả những gì chúng ta cần làm là tạo một bảng giá trị thực và giá trị dự đoán

Ma trận nhầm lẫn khá đơn giản, nhưng các thuật ngữ liên quan có thể hơi khó hiểu. Được rồi, hãy để chúng tôi hiểu các thuật ngữ liên quan đến ma trận nhầm lẫn với sự trợ giúp của một ví dụ

Giả sử, chúng tôi có một bộ dữ liệu với dữ liệu của tất cả bệnh nhân trong bệnh viện. Chúng tôi xây dựng mô hình hồi quy logistic để dự đoán bệnh nhân có bị ung thư hay không. Có thể có bốn kết quả có thể xảy ra. Chúng ta hãy nhìn vào cả bốn

Tích cực thực sự

Tích cực thực sự không là gì ngoài trường hợp giá trị thực tế, cũng như giá trị dự đoán, là đúng. Bệnh nhân đã được chẩn đoán mắc bệnh ung thư và mô hình cũng dự đoán rằng bệnh nhân bị ung thư

Âm tính giả

Trong âm tính giả, giá trị thực tế là đúng, nhưng giá trị dự đoán là sai, có nghĩa là bệnh nhân bị ung thư, nhưng mô hình dự đoán rằng bệnh nhân không bị ung thư

Tăng 100%

Nắm vững các kỹ năng được yêu cầu nhiều nhất ngay bây giờ

dương tính giả

Đây là trường hợp giá trị dự đoán là đúng nhưng giá trị thực tế là sai. Ở đây, mô hình dự đoán bệnh nhân bị ung thư nhưng thực tế bệnh nhân không bị ung thư. Điều này còn được gọi là Lỗi Loại 1

Tiêu cực thực sự

Đây là trường hợp giá trị thực tế sai và giá trị dự đoán cũng sai. Nói cách khác, bệnh nhân không được chẩn đoán mắc bệnh ung thư và mô hình của chúng tôi dự đoán rằng bệnh nhân không mắc bệnh ung thư

Nếu bạn đang tìm Ma trận nhầm lẫn trong R, thì đây là video từ Intellipaat

Hiểu các số liệu hiệu suất khác nhau

Chúng tôi sẽ nhờ sự trợ giúp của một ma trận nhầm lẫn được đưa ra bên dưới để tìm các số liệu hiệu suất khác nhau

Được rồi, chúng ta hãy bắt đầu với độ chính xác

Độ chính xác hoặc phân loại Độ chính xác

  • Gì. Trong các vấn đề phân loại, 'độ chính xác' đề cập đến số lượng dự đoán chính xác được thực hiện bởi mô hình dự đoán so với phần còn lại của các dự đoán
  • Làm sao

  • Khi nào nên sử dụng. Khi các lớp biến mục tiêu trong dữ liệu gần như cân bằng
  • Khi nào không sử dụng. Khi các biến mục tiêu trong dữ liệu là đa số của một lớp
  • Gì. Ở đây, "độ chính xác" có nghĩa là tỷ lệ phần trăm của tất cả các dự đoán mà chúng tôi đưa ra bằng mô hình dự đoán của mình là thực sự đúng
  • Làm sao

  • Điều đó có nghĩa là, khi mô hình của chúng tôi dự đoán rằng một bệnh nhân không bị ung thư, nó đúng 76%
  • Gì. 'Thu hồi' không là gì ngoài thước đo cho biết tỷ lệ bệnh nhân thực sự mắc bệnh ung thư cũng được dự đoán là mắc bệnh ung thư. Nó trả lời câu hỏi, "Mức độ nhạy của trình phân loại trong việc phát hiện các trường hợp tích cực?"
  • Làm sao

  • Điều đó có nghĩa là 80% bệnh nhân ung thư được mô hình dự đoán chính xác là mắc bệnh ung thư
  • Gì. Nó trả lời câu hỏi, "Bộ phân loại cụ thể hoặc chọn lọc như thế nào trong việc dự đoán các trường hợp tích cực?"
  • Làm sao

  • Độ đặc hiệu của 0. 61 có nghĩa là 61 phần trăm của tất cả các bệnh nhân không bị ung thư được dự đoán chính xác
  • Gì. Đây không là gì ngoài ý nghĩa hài hòa của độ chính xác và thu hồi
  • Làm sao

  • Điểm F1 cao, tôi. e. , cả độ chính xác và độ thu hồi của bộ phân loại đều cho thấy kết quả tốt

Chuẩn bị sẵn sàng cho ngành bằng cách xem qua Các câu hỏi và câu trả lời phỏng vấn Python hàng đầu ngay bây giờ

Triển khai ma trận nhầm lẫn trong Python Sklearn – Ung thư vú

tập dữ liệu. Trong ví dụ về Ma trận nhầm lẫn trong Python này, tập dữ liệu Python mà chúng ta sẽ sử dụng là một tập hợp con của tập dữ liệu nổi tiếng về Ung thư vú Wisconsin [Chẩn đoán]. Một số điểm chính về tập dữ liệu này được đề cập bên dưới

  • Bốn biện pháp có giá trị thực của từng nhân tế bào ung thư được xem xét ở đây
    • Radius_mean đại diện cho bán kính trung bình của nhân tế bào
    • Texture_mean đại diện cho kết cấu trung bình của nhân tế bào
    • Perimeter_mean đại diện cho chu vi trung bình của nhân tế bào
    • Area_mean biểu thị diện tích trung bình của nhân tế bào
  • Dựa trên các biện pháp này, kết quả chẩn đoán được chia thành hai loại, ác tính và lành tính
    • Cột chẩn đoán gồm 2 loại ác tính [M] và lành tính [B]

Hãy nhìn vào tập dữ liệu

Bước 1. Tải tập dữ liệu

Bước 2. Xem qua tập dữ liệu

Bước 3. Hãy nhìn vào hình dạng của tập dữ liệu

Bước 4. Chia dữ liệu thành các bộ nhãn tính năng [X] và mục tiêu [y]

Hãy xem bộ tính năng

Hãy nhìn vào mục tiêu đặt ra

Bước 5. Chia dữ liệu thành các tập huấn luyện và kiểm tra nhập scikit learn

Quan tâm để trở thành một nhà khoa học dữ liệu?

Bước 6. Tạo và huấn luyện mô hình

Bước 7. Dự đoán kết quả bộ kiểm tra

Bước 8. Đánh giá mô hình bằng ma trận nhầm lẫn bằng sklearn

Ghi chú. Nơi đây,

  • Tích cực thực sự là 10
  • Âm tính thực sự là 7
  • Dương tính giả là 1
  • Âm tính giả là 2

Bước 9. Đánh giá mô hình bằng cách sử dụng các số liệu hiệu suất khác

Ghi chú. Một python ma trận nhầm lẫn cung cấp cho bạn bức tranh hoàn chỉnh về cách phân loại đang hoạt động. Nó cũng cho phép bạn tính toán các số liệu phân loại khác nhau và các số liệu này có thể hướng dẫn lựa chọn mô hình của bạn

Chúng ta đã học được gì cho đến nay?

Trong hướng dẫn này, chúng ta đã thảo luận về việc sử dụng ma trận nhầm lẫn trong Học máy và các thuật ngữ khác nhau của nó. Chúng tôi đã nói về các số liệu hiệu suất khác nhau như độ chính xác, độ chính xác, thu hồi và điểm f1. Cuối cùng, chúng tôi đã triển khai một ví dụ về ma trận nhầm lẫn bằng cách sử dụng sklearn. Trong mô-đun tiếp theo, chúng tôi sẽ tăng tỷ lệ chính xác và độ chính xác với sự trợ giúp của đường cong ROC và điều chỉnh ngưỡng. Hẹn gặp bạn ở đó

Python tính điểm chính xác như thế nào?

Cách tính toán độ chính xác cân bằng trong Python bằng sklearn .
Độ chính xác cân bằng = [Độ nhạy + Độ đặc hiệu] / 2
Độ chính xác cân bằng = [0. 75 + 9868] / 2
Độ chính xác cân bằng = 0. 8684

Python tính toán độ chính xác của các mô hình như thế nào?

Trong học máy, độ chính xác là một trong những chỉ số đánh giá hiệu suất quan trọng nhất đối với mô hình phân loại. Công thức toán học để tính toán độ chính xác của mô hình học máy là 1 – [Số lượng mẫu bị phân loại sai / Tổng số mẫu] .

Làm thế nào để Python tính toán độ chính xác và độ chính xác?

# sự chính xác. [tp + tn] / [p + n] độ chính xác = precision_score[testy, yhat_classes]
in ['Độ chính xác. %f' % độ chính xác] # độ chính xác tp / [tp + fp]
precision = precision_score[testy, yhat_classes] print['Precision. %f'% độ chính xác]
# Gợi lại. tp / [tp + fn].
print['Ghi lại. %f' % nhớ lại].
f1 = f1_score[testy, yhat_classes]

Làm thế nào để ma trận nhầm lẫn hoạt động trong Python?

Khóa đào tạo Python . Nó vẽ một bảng gồm tất cả các giá trị thực tế và dự đoán của một bộ phân loại. presents a table layout of the different outcomes of the prediction and results of a classification problem and helps visualize its outcomes. It plots a table of all the predicted and actual values of a classifier.

Chủ Đề