Hướng dẫn introduction to machine learning with python ppt - giới thiệu về học máy với ppt python

Chúng tôi đã cập nhật chính sách bảo mật của mình để chúng tôi tuân thủ việc thay đổi các quy định về quyền riêng tư toàn cầu và để cung cấp cho bạn cái nhìn sâu sắc về các cách hạn chế mà chúng tôi sử dụng dữ liệu của bạn.

Bạn có thể đọc các chi tiết dưới đây. Bằng cách chấp nhận, bạn đồng ý với Chính sách bảo mật được cập nhật.

Cảm ơn bạn!

Xem Chính sách bảo mật được cập nhật

Chúng tôi đã gặp một vấn đề, vui lòng thử lại.

Chúng tôi đã cập nhật chính sách bảo mật của mình để chúng tôi tuân thủ việc thay đổi các quy định về quyền riêng tư toàn cầu và để cung cấp cho bạn cái nhìn sâu sắc về các cách hạn chế mà chúng tôi sử dụng dữ liệu của bạn.

Bạn có thể đọc các chi tiết dưới đây. Bằng cách chấp nhận, bạn đồng ý với Chính sách bảo mật được cập nhật.

Cảm ơn bạn!

Xem Chính sách bảo mật được cập nhật

Chúng tôi đã gặp một vấn đề, vui lòng thử lại.

Trình bày về chủ đề: "Phát triển học máy bằng cách sử dụng Python" - Bảng điểm trình bày:

1 Phát triển học máy bằng Pythonrafie Tarabay Develop Machine Learning using Python
Rafie Tarabay

2 học máy Machine Learning

3 Máy học học máy hệ thống dựa trên máy không được lập trình rõ ràng mà học được từ dữ liệu. Một thuật toán học máy Infers mô hình và mối quan hệ giữa các biến khác nhau trong bộ dữ liệu sau đó sử dụng kiến ​​thức đó để khái quát hóa bộ dữ liệu đào tạo. MiningFeaturesLabelsModelsAccuracy và độ chính xác Machine Learning a machine learning-based system is not explicitly programmed but learnt from data. a machine learning algorithm infers patterns and relationships between different variables in a dataset then uses that knowledge to generalize beyond the training dataset. Terms used in the context of machine learning Data mining Features Labels Models Accuracy, and Precision

4 Thuật toán khai thác dữ liệu dữ liệu: 1. C4.5 2. K-meansdefinition: "Việc áp dụng các thuật toán cụ thể để trích xuất các mẫu từ dữ liệu." Khai thác dữ liệu là một quá trình, trong đó các thuật toán học máy được sử dụng làm công cụ để trích xuất Các mẫu có giá trị được tổ chức trong bộ dữ liệu. Khai thác là phân tích khám phá với thuật toán học máy không được giám sát - nghĩa là, các kiến ​​trúc mạng thần kinh với nhiều lớp ẩn - để giải quyết vấn đề. Học sâu là một quá trình, như khai thác dữ liệu, sử dụng các kiến ​​trúc mạng thần kinh sâu, là các loại thuật toán học máy cụ thể. C4.52. K-MEAN3. Hỗ trợ máy vector4. Apriori5. Em6. PAGERANK7. Adaboost8. kn9. Naive Bayes10. Cart để biết thêm thông tin Data Mining Data Mining algorithms: 1. C4.5 2. k-means
Definition: "the application of specific algorithms for extracting patterns from data." data mining is a process, during which machine learning algorithms are utilized as tools to extract potentially-valuable patterns held within datasets. Data mining is exploratory analysis with unsupervised machine learning algorithms The main application is text mining in a big data environment: Text parsing Sentiment analysis Opinion mining Natural language processing using *deep learning algorithm * deep learning is the process of applying deep neural network technologies - that is, neural network architectures with multiple hidden layers - to solve problems. Deep learning is a process, like data mining, which employs deep neural network architectures, which are particular types of machine learning algorithms. Data Mining algorithms: 1. C4.5 2. k-means 3. Support vector machines 4. Apriori 5. EM 6. PageRank 7. AdaBoost 8. kNN 9. Naive Bayes 10. CART For more information

5 tính năng Một tính năng đại diện cho một biến độc lập Một bộ dữ liệu bảng, một hàng đại diện cho một quan sát và cột biểu thị một tính năng. Các tính năng cũng được gọi chung là kích thước. . Các giá trị của một tính năng phân loại không có thứ tự.Gender là một tính năng phân loại. Nó chỉ có thể đảm nhận một trong hai giá trị Features a feature represents an independent variable
In a tabular dataset, a row represents an observation and column represents a feature. Features are also collectively referred to as dimensions. Categorical Features It can take on one of a fixed number of discrete values with name or a label. The values of a categorical feature have no ordering. gender is a categorical feature. It can take on only one of two values. Numerical Features It can take on any numerical value numerical feature have mathematical ordering discrete numerical feature : number of persons, number of rooms continuous numerical feature: temperature value

6 Nhãn Nhãn là một biến mà một máy học học được để dự đoán nhãn phân loại: Ex, Thể loại bài viết là một nhãn phân loại nhãn: Ex, Price là một nhãn số Labels label is a variable that a machine learning learns to predict
categorical label: ex, category of a news article is a categorical label numerical label: ex, price is a numerical label

7 cấu trúc toán học mô hình để thu thập các mẫu trong bộ dữ liệu và ước tính mối quan hệ giữa các biến phụ thuộc và độc lập và có khả năng dự đoán. và có thể tính toán hoặc dự đoán giá trị cho biến phụ thuộc khi nhận được các giá trị của các biến độc lập. Nhập mô hình là một tác vụ chuyên sâu tính toán, trong khi sử dụng nó không phải là tính toán chuyên sâu. Một mô hình thường được lưu vào đĩa, để nó có thể được sử dụng mà không cần chuyển sang bước đào tạo nữa. Dữ liệu [80% dữ liệu] Dữ liệu được sử dụng bởi thuật toán học máy để đào tạo dữ liệu mô hình nhất [20% dữ liệu] dữ liệu được sử dụng để đánh giá hiệu suất dự đoán của mô hình Models a mathematical construct for capturing patterns within a dataset and estimates the relationship between the dependent and independent variables and has predictive capability. and can calculate or predict the value for the dependent variable when get the values of the independent variables. Training a model is a compute intensive task, while using it is not as compute intensive. A model is generally saved to disk, so that it can be used without go to training step again. Training Data [80% of data] The data used by a machine learning algorithm to train a model Test Data [20% of data] The data used for evaluating the predictive performance of a model

8 Độ chính xác so với PrecisionAccuracy là giá trị đo gần với giá trị thực tế [true] thực tế là mức độ gần gũi với các giá trị đo được với nhau. Accuracy vs Precision Accuracy is how close a measured value is to the actual [true] value. Precision is how close the measured values are to each other.

9 Kỹ thuật học máy làm việc học tập chủ yếu có ba loại kỹ thuật học tập: Học tập học tập được giám sát Machine learning techniques
Machine learning mainly has three types of learning techniques: Supervised learning Unsupervised learning Reinforcement learning

10 Nhiệm vụ học máy Danh mục Chị phân rê -riClusteringanomaly Phát hiện Thẻ Machine Learning tasks categories
Classification Regression Clustering Anomaly detection Association Recommendation Dimensionality reduction Computer Vision Text Analytics

11 Phân loại [Học tập có giám sát] Phân loại liên quan đến các mô hình xây dựng tách dữ liệu thành các lớp khác nhau. Các mô hình này được xây dựng bằng cách nhập một tập hợp dữ liệu đào tạo mà các lớp được dán nhãn trước để thuật toán học hỏi. Mô hình này sau đó được sử dụng bằng cách nhập một bộ dữ liệu khác mà các lớp được giữ lại, cho phép mô hình dự đoán tư cách thành viên lớp của họ dựa trên những gì nó đã học được từ bộ đào tạo. Ví dụ phân loại [chỉ chia dữ liệu thành hai tùy chọn] Phân loại Chẩn đoán TaskTumor có thể được coi là một vấn đề phân loại. Xác định rủi ro tín dụng bằng cách sử dụng thông tin cá nhân như thu nhập, phân loại nợ xuất sắc, nhận dạng kiểm tra và nhận dạng nhiều lớp các bộ phận cơ thể và vị trí Classification [supervised learning]
Classification is concerned with building models that separate data into distinct classes. These models are built by inputting a set of training data for which the classes are pre- labelled in order for the algorithm to learn from. The model is then used by inputting a different dataset for which the classes are withheld, allowing the model to predict their class membership based on what it has learned from the training set. Binary classification examples [divide data to two options only] spam filtering is a classification task Tumor diagnosis can be treated as a classification problem. determining credit risk using personal information such as income, outstanding debt Multi-class classification examples handwritten recognition each character is a multi-class classification problem image recognition is a multi-class classification task Xbox Kinect360, which infers body parts and position

12 Hồi quy [Học tập có giám sát] Mục tiêu là dự đoán nhãn số cho các thuật toán quan sát không nhãn: Hồi quy tuyến tính, quyết định giao dịch định giá Thương định và dự báo dự báo hoặc dự báo hàng tồn kho hoặc dự báo hàng tồn kho Regression [ supervised learning]
The goal is to predict a numerical label for an unlabeled observation Regression algorithms: Linear regression, Decision trees Examples home valuation Asset trading, and forecasting Sales or inventory forecasting

13 Phát hiện bất thường [Học tập có giám sát] Mục tiêu là tìm ra các ngoại lệ, tiếng ồn, độ lệch trong sản xuất ứng dụng phát hiện dữ liệu, nó được sử dụng để tự động tìm các sản phẩm bị lỗi. Phát hiện. Đưa ra các cuộc tấn công bảo mật. Lưu lượng truy cập mạng liên quan đến một cuộc tấn công bảo mật không giống như lưu lượng mạng thông thường. Tương tự, hoạt động hacker trên máy sẽ khác với hoạt động người dùng bình thường. Anomaly Detection [ supervised learning]
the goal is to find outliers, noise, deviations in a dataset Anomaly detection applications In manufacturing, it is used for automatically finding defective products. In data centers, it is used for detecting bad systems. Websites use it for fraud detection. Detecting security attacks. Network traffic associated with a security attack is unlike normal network traffic. Similarly, hacker activity on a machine will be different from a normal user activity.

14 Phân cụm [Học không giám sát] Mục đích là chia một bộ dữ liệu thành một số cụm hoặc phân đoạn cụ thể. k] phải được cung cấp rõ ràng. Xác định các trung tâm cụm k tốt nhất trong một trình phân tiết lặp được giả định là hình cầu.2] Optics /dbscanit là một thuật toán phân cụm dựa trên mật độ. đại diện cho các cụm bởi các phân khúc khách hàng tự nhiên của nó, có thể được nhắm mục tiêu với các chương trình tiếp thị khác nhau Clustering [unsupervised learning]
The aim is to split a dataset into a specified number of clusters or segments. Elements in the same cluster are more similar to each other than to those in other clusters. Clustering algorithms 1] k-means The number of clusters [k] must be given explicitly. Identify the best k cluster centers in an iterative manner Clusters are assumed to be spherical. 2] OPTICS /DBSCAN it is a density-based clustering algorithm. represents clusters by its nature Example creating customer segments, which can be targeted with different marketing programs

15 Hiệp hội [Học tập không giám sát] được giải thích dễ dàng nhất bằng cách giới thiệu phân tích giỏ thị trường, một nhiệm vụ điển hình mà nó được biết đến. và phân công các biện pháp hỗ trợ và tự tin để so sánh. Giá trị của điều này nằm ở việc tiếp thị chéo và phân tích hành vi của khách hàng. Association [unsupervised learning]
Association is most easily explained by introducing market basket analysis, a typical task for which it is well-known. attempts to identify associations between the various items that have been chosen by a particular shopper and placed in their market basket and assigns support and confidence measures for comparison. The value of this lies in cross-marketing and customer behavior analysis.

16 Giảm kích thước [Học tập không giám sát] Mục tiêu về giảm kích thước là giảm số lượng các tính năng trong bộ dữ liệu mà không ảnh hưởng đáng kể đến hiệu suất dự đoán của mô hình và điều này sẽ làm giảm độ phức tạp tính toán và chi phí học máy. Dimensionality Reduction [unsupervised learning]
The goal in dimensionality reduction is to reduce the number of features in a dataset without significantly impacting the predictive performance of a model and this will reduce the computational complexity and cost of machine learning.

17 Khuyến nghị [Củng cố] Mục tiêu của hệ thống đề xuất là đề xuất sản phẩm cho người dùng dựa trên hành vi trong quá khứ để xác định sở thích của người dùng. Liên kết giống như Chắc chắn kết quả cho đến khi người dùng chọn một trong những khuyến nghị của chúng tôi, nếu không, thì khuyến nghị của chúng tôi là không chính xác. Recommendation [Reinforcement]
The goal of a recommendation system is to recommend a product to a user based on past behavior to determine user preferences. Unlike Association, Recommendation focus on user behavior and suggest according to this user behavior. It is reinforcement because we not sure of result until user choose one of our recommendation, if not, then our recommendation was not correct.

18 Thuật toán học máy được giám sát được phân loại lớp- Hồi quy logistic [nhanh]- Cây quyết định [nhanh]- Jungle quyết định [chính xác]- SVM [chính xác] [> 100 tính năng]- Cây quyết định được tăng cường [Bộ nhớ nhanh]- Máy Bayes Point [ Nhanh] Phân loại đa lớp- Hồi quy logistic [nhanh]- Rừng ngẫu nhiên [chính xác]- Cây tăng cường độ dốc [chính xác]- hồi quy Bayes [Dữ liệu lớn] - Cây tăng cường độ dốc [chính xác]- hồi quy thứ tự- hồi quy tuyến tính Bayesian- Cây quyết định được tăng cường Supervised machine learning algorithms
Classification Two Class Classification - Logistic Regression [Fast] - Decision Tree [Fast] - Decision jungle[Accurate] - SVM [Accurate] [>100 features] - Boosted Decision Tree [Fast - Large memory] - Bayes point machine [Fast] Multi Class Classification - Logistic Regression [Fast] - Random Forest [Accurate] - Gradient Boosting Tree [Accurate] - Naive Bayes [Big Data] Regression - Linear Regression [Fast] - Decision Tree [Fast] - Random Forest [Accurate] - Gradient Boosting Tree [Accurate] - Ordinal regression - Bayesian linear regression - Boosted Decision Tree [Fast - Large memory] - SGD Regressor [ df = pd.dataframe [{'A': [0,0,1,1], 'B': [0,1,0,0,1]}] DF = DF = df [[df.t! = 0] .any []] #Keep row Nếu bất kỳ tính năng nào chứa giá trị> in df> df = df [[df.t! = 0] .all []] #Keep row nếu tất cả các tính năng chứa RAWFRAMENEP REA giá trị nếu có chứa RAVELEEP RAW nếu tất cả đều chứa giá trịBA1234BA1234BA14DF [[df.t! = 0] .all []] df [[df.t! = 0] .any []] Filter data to remove rows that has NA/0
> df = pd.DataFrame[{'a':[0,0,1,1], 'b':[0,1,0,1]}] df = df[[df.T != 0].any[]] #keep row if any feature contain values > print df > df = df[[df.T != 0].all[]] #keep row if all features contain values Original DataFrame Keep raw if ANY contains a value Keep raw if ALL contains values b a 1 2 3 4 b a 1 2 3 4 b a 1 4 df[[df.T != 0].all[]] df[[df.T != 0].any[]]

47 Thả các cột trong đó bất kỳ/tất cả các phần tử là nandata.dropna [How = 'Any'] Làm thế nào: {'bất kỳ', 'tất cả'} bất kỳ: nếu có bất kỳ giá trị Na nào có, hãy thả nhãn đó: Nếu tất cả các giá trị là Na, Thả nhãn đó Drop the columns where Any/All elements are NaN
data.dropna[how='any’] how : {‘any’, ‘all’} any : if any NA values are present, drop that label all : if all values are NA, drop that label

48 Drop trùng lặp Rowsconsider trùng lặp Nếu tất cả các hàng đều giống nhau, hãy trả về kết quả trong dataFramedatAfRame1 = df.drop_duplicates [tập hợp con = none Cùng một dataFlameF.Drop_duplicates [tập hợp con = ['cột1', 'cột3'], keep = 'last'] lưu datadf.to_csv duy nhất [file_name_output] Drop duplicate rows Consider duplicate if all the row are the same, return result in new dataframe dataframe1 = df.drop_duplicates[subset=None, inplace=False] Consider duplicate if Column1, Column3 are the same, drop duplicate except last row, return result in the same dataframe df.drop_duplicates[subset=[‘Column1', ‘Column3'], keep=‘last’] Save unique data df.to_csv[file_name_output]

49 Bộ dữ liệu phân chia, tạo đào tạo và kiểm tra dữ liệu để phân chia bộ dữ liệu bằng 70-30? [70% các quan sát rơi vào đào tạo và 30% các quan sát rơi vào bộ dữ liệu thử nghiệm.] = 1] Split Dataset, Create training, and test dataset
How to split dataset by 70-30? [70% of the observations fall into training and 30% of observations fall into the test dataset.] x_train,x_test, y_train, y_test = train_test_split[data[‘x’],data[‘y'], test_size=0.3, random_state=1]

50 Nhập matplotlib.pyplot dưới dạng pltplt.bar - tạo một varplt. import matplotlib.pyplot as plt
plt.bar – creates a bar chart plt.scatter – makes a scatter plot plt.boxplot – makes a box and whisker plot plt.hist – makes a histogram plt.plot – creates a line plot

51 Biểu đồ cho dữ liệu mảng ,] #r. : red plt.show [] Plot for Data array import numpy as np import matplotlib.pyplot as plt Data=np.array[[ [1,2], [3,2], [4,6], [7,2], [1,4], [9,1] ]] Column1=0 Column2=1 for i in range[ len[Data] ]: plt.plot[ Data[ i ] [Column1] , Data[ i ] [Column2] ,'r.’] #r. :red plt.show[]

52 Biểu đồ thanh cho dữ liệu mảng ], [9,1]]] Cột1 = 0 cột2 = 1 Barwidth = 1/1.5 cho I trong phạm vi [LEN [dữ liệu]]: plt.bar [Dữ liệu [i] [cột1], dữ liệu [i] [cột2] , Barwidth, color = "blue"] plt.show [] Bar plot for Data array import numpy as np import matplotlib.pyplot as plt Data=np.array[[ [1,2], [3,2], [4,6], [7,2], [1,4], [9,1] ]] Column1=0 Column2=1 BarWidth=1/1.5 for i in range[ len[Data] ]: plt.bar[ Data[ i ] [Column1] , Data[ i ] [Column2] , BarWidth , color="blue"] plt.show[]

53 Biểu đồ phân tán cho DataImport Numpy khi nhập NP matplotlib.pyplot dưới dạng dữ liệu PLT = np.array [[[1,2], [3,2], [4,6], [7,2], [1,4] ,] plt.show [] #ở đâu đó là kích thước của điểm đánh dấu Scatter plot for Data import numpy as np import matplotlib.pyplot as plt Data=np.array[[ [1,2], [3,2], [4,6], [7,2], [1,4], [9,1] ]] Column1=0 Column2=1 plt.scatter[ Data[:, Column1] , Data[:, Column2] , marker = "x“ , s=150 , linewidths = 5 , zorder = 1] plt.show[] #Where s is the size of the marker

54 Tính toán sơ đồ cặp giữa tất cả các tính năng Điều chỉnh NP khi nhập NP matplotlib.pyplot dưới dạng dữ liệu PLT = np.array [[1,2], [3,2], [4,6], [7,2], [1, 4], [9,1]]] nhập pandas df = pandas.dataframe [Dữ liệu] Calculating Pair Plot Between All Features
import numpy as np import matplotlib.pyplot as plt data=np.array[[ [1,2], [3,2], [4,6], [7,2], [1,4], [9,1] ]] import pandas df = pandas.DataFrame[Data] #Calculating Pair Plot Between All Features seaborn.pairplot[df] plt.show[]

55 Các lệnh cơ bản sắp xếp, bộ lọc, nhóm và vẽ đồ thị datadata = data.sort_values ​​[by = 'hernyear,] data = data [[data [' bẩm sinh ']> Basic commands Sort, Filter, group, and Plotting the Data
data = data.sort_values[by='birthyear’] data = data[[data['birthyear'] >= 1931] & [data['birthyear'] 2 lớp], một nơ -ron đầu ra trên mỗi lớp giá trị. Bao giờ đầu vào nó sẽ chuyển đổi thành số từ -1 đến 1Relu: 0 cho A0. Vì vậy, nó chỉ loại bỏ các giá trị âm và vượt qua dương như nó là. Available Activation Functions
Optional, it is like a filter, used to solve some common predictive modeling problem, to get significant boost in performance. Sigmoid: used for Binary Classification [2 class] one neuron the output layer. What ever the input it will map to zero or one. Softmax: used for Multiclass Classification [>2 class], one output neuron per class value. Linear: used for Regression, the number of neurons matching the number of outputs. Tanh: what ever the input it will convert to number between -1 and 1 Relu: either 0 for a0. so, it just remove the negative values and pass the positive as it is. LeakyReLU: minimize the value of negative values and pass as it is if positive elu selu softplus softsign hard_sigmoid PReLU ELU ThresholdedReLU

119 Bước 2. Mô hình mạng biên dịch.comPile [atptimult = 'sgd', leving = 'mse'] cụ thể thuật toán tối ưu hóa để sử dụng để đào tạo mạng và hàm mất được sử dụng để đánh giá mạng được giảm thiểu bằng thuật toán tối ưu hóa. công cụ để giảm thiểu tổn thất giữa dự đoán và giá trị thực. Các thuật toán tối ưu hóa thường được sử dụng: 'SGD' [giảm độ dốc ngẫu nhiên] đòi hỏi phải điều chỉnh tỷ lệ học tập và động lực.Adam yêu cầu điều chỉnh tỷ lệ học tập. '.Binary Phân loại [2 lớp]:' Binary_crossentropy'.Multiclass Phân loại [> 2 Lớp]: 'allyorical_crossentropy'.finally, bạn cũng có thể chỉ định các số liệu để thu thập trong khi lắp mô hình bên cạnh hàm mất. Nói chung, số liệu bổ sung hữu ích nhất để thu thập là độ chính xác. ]] Step 2. Compile Network model.compile[optimizer='sgd', loss='mse’]
Specifically the optimization algorithm to use to train the network and the loss function used to evaluate the network that is minimized by the optimization algorithm. Optimizers tool to minimize loss between prediction and real value. Commonly used optimization algorithms: ‘sgd‘ [Stochastic Gradient Descent] requires the tuning of a learning rate and momentum. ADAM requires the tuning of learning rate. RMSprop requires the tuning of learning rate. Loss functions: Regression: Mean Squared Error or ‘mse‘. Binary Classification [2 class]: ‘binary_crossentropy‘. Multiclass Classification [>2 class]: ‘categorical_crossentropy‘. Finally, you can also specify metrics to collect while fitting the model in addition to the loss function. Generally, the most useful additional metric to collect is accuracy. model.compile[optimizer='sgd', loss='mse’] model.compile[optimizer='sgd', loss='mse', metrics=['accuracy']]

120 tối ưu hóa Optimizers

121 Lịch sử = model.fit [X, Y, Batch_Size = 10, Epochs = 100] Bước 3. FIT NetworkHistory = model.fit [X, Y, Batch_Size = 10, Epochs = 100] Mạng được đào tạo bằng cách sử dụng kích thước thuật toán backpropagation & nbsps ; số lượng mẫu sẽ được truyền qua mạng là số lượng thời gian đào tạo [đối với tất cả & nbsp; ví dụ đào tạo] Ví dụ: Nếu bạn có 1000 ví dụ đào tạo và kích thước lô của bạn là 500, thì sẽ mất 2 Lặp lại để hoàn thành 1 Epoch. history = model.fit[X, y, batch_size=10, epochs=100]
Step 3. Fit Network history = model.fit[X, y, batch_size=10, epochs=100] The network is trained using the backpropagation algorithm Batch size is the number of samples that going to be propagated through the network. epochs is the number of training times [for ALL the training examples] Example: if you have 1000 training examples, and your batch size is 500, then it will take 2 iterations to complete 1 epoch.

122 Bước 4. Đánh giá Mạng mô hình đánh giá sự mất mát trên tất cả các mẫu thử nghiệm, cũng như bất kỳ số liệu nào khác được chỉ định khi mô hình được biên dịch. Như sau: Mất, độ chính xác = model.evaliated [x, y] in ["Mất: %.2f, độ chính xác: %.2f %" %[mất, độ chính xác*100]] Step 4. Evaluate Network The model evaluates the loss across all of the test patterns, as well as any other metrics specified when the model was compiled. For example, for a model compiled with the accuracy metric, we could evaluate it on a new dataset as follows: loss, accuracy = model.evaluate[X, Y] print["Loss: %.2f, Accuracy: %.2f% %" % [loss, accuracy*100]]

123 Bước 5. đưa ra dự đoán xác suất = model.predict [x] Dự đoán = [float [vòng [x]] cho x trong xác suất] Độ chính xác = numpy.Mean [dự đoán == y] #count số lượng true và chia cho Tổng số sizeprint ["Độ chính xác dự đoán: % .2f % %" % [độ chính xác*100]]] Step 5. Make Predictions probabilities = model.predict[X]
predictions = [float[round[x]] for x in probabilities] accuracy = numpy.mean[predictions == Y] #count the number of True and divide by the total size print["Prediction Accuracy: %.2f% %" % [accuracy*100]]

124 Phân loại nhị phân sử dụng mạng lưới thần kinh trong bộ dữ liệu Kerasdiabetes & NBSP; Phát hiện bệnh tiểu đường & NBSP; dựa trên các thuộc tính phân tíchDataset: 1. Số lần mang thai2. Plasma3. Huyết áp tâm trương [mm Hg] 4. Triceps Da có độ dày gấp [mm] 5. Insulin huyết thanh 2 giờ [mu u/ml] 6. Chỉ số khối cơ thể7. Chức năng phả hệ tiểu đường8. Tuổi [năm] 9. Biến lớp [0 hoặc 1] Binary classification using Neural Network in Keras
Diabetes Data Set  Detect Diabetes Disease based on analysis Dataset Attributes: 1. Number of times pregnant 2. Plasma 3. Diastolic blood pressure [mm Hg] 4. Triceps skin fold thickness [mm] 5. 2-Hour serum insulin [mu U/ml] 6. Body mass index 7. Diabetes pedigree function 8. Age [years] 9. Class variable [0 or 1]

125 Lưu mô hình dự đoán sau đó đào tạo mô hình của chúng tôi, tức là, model.fit [x_train, y_train], chúng ta có thể lưu traning này để sử dụng sau này. Nhiệm vụ này có thể được thực hiện bởi Pickle & nbsp; Gói [Thư viện tuần tự hóa đối tượng Python], sử dụng phương thức nạp và tải. Pickle có thể lưu bất kỳ đối tượng nào không chỉ là mô hình dự đoán.Import pickle WB ']] Save prediction model After train our model, ie, model.fit[X_train, Y_train], we can save this traning to use later. This task can done by Pickle package[Python Object Serialization Library], using dump and load methods. Pickle can save any object not just the prediction model. import pickle ……………. model.fit[X_train, Y_train] # save the model to disk pickle.dump[model, open["c:/data.dump", 'wb’]] #wb= write bytes # some time later... load the model from disk model = pickle.load[open["c:/data.dump", 'rb’]] #rb= read bytes

7 bước học máy là gì?

7 bước học máy..
Thu thập dữ liệu. → Số lượng & chất lượng dữ liệu của bạn chỉ ra mức độ chính xác của mô hình của chúng tôi. ....
Chuẩn bị dữ liệu. → đánh giá dữ liệu và chuẩn bị cho đào tạo. ....
Chọn một mô hình. ....
Đào tạo mô hình. ....
Đánh giá mô hình. ....
Điều chỉnh tham số. ....
Đưa ra dự đoán..

5 bước học máy là gì?

Các bước học máy..
Thu thập dữ liệu: Như bạn đã biết, các máy ban đầu học hỏi từ dữ liệu mà bạn cung cấp cho họ. ....
Chuẩn bị dữ liệu: Sau khi bạn có dữ liệu của mình, bạn phải chuẩn bị nó. ....
Chọn một mô hình: ....
Đào tạo mô hình: ....
Đánh giá mô hình: ....
Điều chỉnh tham số: ....
Dự đoán ..

Giới thiệu về học máy là gì?

Học máy [ML] là một nhánh của trí tuệ nhân tạo [AI] cho phép máy tính tự học từ dữ liệu đào tạo và cải thiện theo thời gian, mà không được lập trình rõ ràng.Các thuật toán học máy có thể phát hiện các mẫu trong dữ liệu và học hỏi từ chúng, để đưa ra dự đoán của riêng họ.a branch of artificial intelligence [AI] that enables computers to “self-learn” from training data and improve over time, without being explicitly programmed. Machine learning algorithms are able to detect patterns in data and learn from them, in order to make their own predictions.

3 bước chính trong học máy là gì?

Ba bước quan trọng trong học máy..
Bức tranh lớn.Đây là bước quan trọng nhất và quan trọng nhất trong học máy, nhưng rất nhiều người mới bắt đầu hoàn toàn bỏ qua bước này và do đó hạn chế sự hiểu biết về mục đích học máy cho dự án của họ.....
Thông tin chi tiết dữ liệu.....
Giám sát và bảo trì ..

Bài Viết Liên Quan

Chủ Đề