Зачем использовать категориальную перекрестную энтропию?

Оглавление:

Зачем использовать категориальную перекрестную энтропию?
Зачем использовать категориальную перекрестную энтропию?
Anonim

Категорная кроссэнтропия - это функция потерь, которая используется в задачах мультиклассовой классификации. Это задачи, в которых пример может принадлежать только к одной из многих возможных категорий, и модель должна решить, к какой из них. Формально он предназначен для количественной оценки разницы между двумя распределениями вероятностей.

Зачем использовать кросс-энтропию вместо MSE?

Во-первых, кросс-энтропия (или потеря softmax, но кросс-энтропия работает лучше) является лучшим показателем, чем MSE для классификации, потому что граница решения в задаче классификации велика(по сравнению с регрессией). … Для задач регрессии вы почти всегда будете использовать MSE.

В чем разница между разреженной перекрестной энтропией и категориальной перекрестной энтропией?

Единственная разница между разреженной категориальной перекрестной энтропией и категориальной перекрестной энтропией заключается в формате истинных меток. Когда у нас есть проблема классификации с одной меткой и несколькими классами, метки являются взаимоисключающими для каждых данных, что означает, что каждая запись данных может принадлежать только одному классу.

Как вы интерпретируете категориальную потерю перекрестной энтропии?

Перекрестная энтропия увеличивается по мере того, как прогнозируемая вероятность выборки отличается от фактического значения. Следовательно, прогнозирование вероятности 0,05, когда фактическая метка имеет значение 1, увеличивает перекрестную энтропийную потерю. обозначает прогнозируемую вероятность от 0 до 1 для этой выборки.

Почему перекрестная энтропия хороша?

В целом, как мы видим, кросс-энтропия - это просто способ измерения вероятности модели. Перекрестная энтропия полезна, поскольку она может описывать, насколько вероятной является модель, и функцию ошибки каждой точки данных. Его также можно использовать для описания прогнозируемого результата в сравнении с истинным результатом.

Рекомендуемые: