Hướng dẫn leave-one subject out cross validation python - bỏ một chủ đề ra khỏi trăn xác thực chéo

classsklearn.model_selection.leaveOut [Nguồn] ¶ sklearn.model_selection.LeaveOneOut[source]

Rời khỏi một validator chéo

Cung cấp các chỉ số đào tạo/thử nghiệm để phân chia dữ liệu trong các bộ tàu/thử nghiệm. Mỗi mẫu được sử dụng một lần làm bộ thử nghiệm (singleton) trong khi các mẫu còn lại tạo thành tập huấn luyện.

Lưu ý: LeaveOneOut() tương đương với KFold(n_splits=n)LeavePOut(p=1) trong đó n là số lượng mẫu.

Do số lượng lớn các bộ thử nghiệm (giống như số lượng mẫu) phương pháp xác thực chéo này có thể rất tốn kém. Đối với các bộ dữ liệu lớn, người ta nên ủng hộ KFold, ShuffleSplit hoặc StratifiedKFold.

Đọc thêm trong Hướng dẫn sử dụng.User Guide.

Xem thêm

LeaveOneGroupOut

Để phân tách dữ liệu theo phân tầng rõ ràng, cụ thể của miền của bộ dữ liệu.

GroupKFold

Biến thể Iterator K gấp K với các nhóm không chồng chéo.

Ví dụ

>>> import numpy as np
>>> from sklearn.model_selection import LeaveOneOut
>>> X = np.array([[1, 2], [3, 4]])
>>> y = np.array([1, 2])
>>> loo = LeaveOneOut()
>>> loo.get_n_splits(X)
2
>>> print(loo)
LeaveOneOut()
>>> for train_index, test_index in loo.split(X):
...     print("TRAIN:", train_index, "TEST:", test_index)
...     X_train, X_test = X[train_index], X[test_index]
...     y_train, y_test = y[train_index], y[test_index]
...     print(X_train, X_test, y_train, y_test)
TRAIN: [1] TEST: [0]
[[3 4]] [[1 2]] [2] [1]
TRAIN: [0] TEST: [1]
[[1 2]] [[3 4]] [1] [2]

Phương pháp

LeaveOneOut()0(X[, y, groups])

Trả về số lần lặp lại trong bộ xử lý chéo

LeaveOneOut()1(X[, y, groups])

Tạo các chỉ số để phân chia dữ liệu thành tập đào tạo và kiểm tra.

get_n_splits (x, y = none, nhóm = none) [nguồn] ¶(X, y=None, groups=None)[source]

Trả về số lần lặp lại trong bộ xử lý chéo

Tạo các chỉ số để phân chia dữ liệu thành tập đào tạo và kiểm tra.:Xarray-like of shape (n_samples, n_features)

get_n_splits (x, y = none, nhóm = none) [nguồn] ¶

Tham số: Xarray giống như hình dạng (n_samples, n_features)object

Dữ liệu đào tạo, trong đó LeaveOneOut()2 là số lượng mẫu và LeaveOneOut()3 là số lượng tính năng.

yobjectobject

Dữ liệu đào tạo, trong đó LeaveOneOut()2 là số lượng mẫu và LeaveOneOut()3 là số lượng tính năng.

Returns:n_splitsint:n_splitsint

yobject

Luôn luôn bị bỏ qua, tồn tại để tương thích.(X, y=None, groups=None)[source]

Tạo các chỉ số để phân chia dữ liệu thành tập đào tạo và kiểm tra.

Tạo các chỉ số để phân chia dữ liệu thành tập đào tạo và kiểm tra.:Xarray-like of shape (n_samples, n_features)

get_n_splits (x, y = none, nhóm = none) [nguồn] ¶

Tham số: Xarray giống như hình dạng (n_samples, n_features)array-like of shape (n_samples,)

Dữ liệu đào tạo, trong đó LeaveOneOut()2 là số lượng mẫu và LeaveOneOut()3 là số lượng tính năng.

yobjectarray-like of shape (n_samples,), default=None

Luôn luôn bị bỏ qua, tồn tại để tương thích.

Yields:trainndarray:trainndarray

GroupsObject

Trả về số lần lặp lại trong các validator chéo.ndarray

chia (x, y = none, nhóm = không) [nguồn] ¶

Làm thế nào để bạn rời đi

Việc thực hiện xác nhận một-Out-Out-cross có thể được thực hiện bằng Cross_val_score (). Bạn chỉ cần đặt tham số CV bằng số lượng quan sát trong tập dữ liệu của bạn. Chúng ta có thể tìm thấy số lượng quan sát bằng cách xem hình dạng của bộ dữ liệu X.using cross_val_score(). You only need to set the parameter cv equal to the number of observations in your dataset. We can find the number of observations by looking at the shape of the X dataset.

Là nghỉ phép

Sự định nghĩa. Xử lý chéo một lần là một trường hợp đặc biệt của xác thực chéo trong đó số lần nếp gấp bằng số lượng phiên bản trong tập dữ liệu. Do đó, thuật toán học tập được áp dụng một lần cho mỗi trường hợp, sử dụng tất cả các trường hợp khác làm tập huấn luyện và sử dụng phiên bản đã chọn làm bộ kiểm tra mục đơn ...a special case of cross-validation where the number of folds equals the number of instances in the data set. Thus, the learning algorithm is applied once for each instance, using all other instances as a training set and using the selected instance as a single-item test set ...

Làm thế nào để bạn tính toán nghỉ phép

Xác thực chéo một lần..
Chia một bộ dữ liệu thành một tập huấn luyện và một bộ thử nghiệm, sử dụng tất cả trừ một quan sát như một phần của tập huấn luyện: ....
Xây dựng mô hình chỉ bằng dữ liệu từ bộ đào tạo.....
Sử dụng mô hình để dự đoán giá trị phản hồi của một quan sát còn lại ra khỏi mô hình và tính toán MSE ..

Làm thế nào để bạn chia dữ liệu cho chéo

Chế độ xác nhận chéo chia chia tập dữ liệu thành hai phần: tập huấn luyện và tập kiểm tra.Thông thường, 80% bộ dữ liệu được chuyển đến bộ đào tạo và 20% cho bộ kiểm tra nhưng bạn có thể chọn bất kỳ sự phân tách nào phù hợp với bạn hơn.Huấn luyện mô hình trên bộ đào tạo.Xác thực trên bộ kiểm tra.Divide the dataset into two parts: the training set and the test set. Usually, 80% of the dataset goes to the training set and 20% to the test set but you may choose any splitting that suits you better. Train the model on the training set. Validate on the test set.