Что такое защитный набор? Иногда называемое «тестированием» подмножество дает окончательную оценку производительности модели машинного обучения после ее обучения и проверки. Наборы задержек никогда не должны использоваться для принятия решений о том, какие алгоритмы использовать, а также для улучшения или настройки алгоритмов.
Перекрёстная проверка лучше, чем задержка?
Кросс-валидация обычно является предпочтительным методом, потому что он дает вашей модели возможность тренироваться на нескольких сплитах обучающих тестов. Это дает вам лучшее представление о том, насколько хорошо ваша модель будет работать с невидимыми данными. Удержание, с другой стороны, зависит только от одного разделения поезд-тест.
Что такое подход удержания?
Метод удержания - это самый простой вид метода для оценки классификатора. В этом методе набор данных (набор элементов данных или примеров) разделяется на два набора, называемых обучающим набором и тестовым набором. Классификатор выполняет функцию присвоения элементов данных в данной коллекции целевой категории или классу.
Должен ли я всегда выполнять перекрестную проверку?
В общем случае перекрестная проверка всегда необходима, когда вам нужно определить оптимальные параметры модели, для логистической регрессии это будет параметр C.
В чем преимущество K-кратной перекрестной проверки?
если сравнивать test-MSE лучше в случае k-кратного CV, чем LOOCV. k-кратное CV или любое CV или методы повторной выборки неисправить ошибки теста. они оценивают ошибки теста. в случае k-fold, он лучше оценивает ошибку, чем LOOCV.