Бинарная классификация - Binary classification
Бинарная классификация - это задача классификации элементов набора на две группы на основе правила классификации . Типичные проблемы бинарной классификации включают:
- Медицинское обследование для определения наличия у пациента определенного заболевания;
- Контроль качества в промышленности, определение соответствия спецификации;
- При поиске информации - принятие решения о том, должна ли страница быть в наборе результатов поиска или нет.
Бинарная классификация - это дихотомия, применяемая к практической ситуации. Во многих практических задачах бинарной классификации эти две группы не являются симметричными, и вместо общей точности представляет интерес относительная доля различных типов ошибок . Например, при медицинском тестировании обнаружение болезни, когда ее нет ( ложноположительный результат ), рассматривается иначе, чем невыявление болезни при ее наличии ( ложноотрицательный ).
Статистическая бинарная классификация
Статистическая классификация - это проблема, изучаемая в машинном обучении . Это тип обучения с учителем, метод машинного обучения, в котором категории предопределены, и используется для классификации новых вероятностных наблюдений по указанным категориям. Когда есть только две категории, проблема известна как статистическая двоичная классификация.
Некоторые из методов, обычно используемых для двоичной классификации:
- Деревья решений
- Случайные леса
- Байесовские сети
- Опорные векторные машины
- Нейронные сети
- Логистическая регрессия
- Пробит модель
Каждый классификатор лучше всего подходит только для выбранной области на основе количества наблюдений, размерности вектора признаков , шума в данных и многих других факторов. Например, случайные леса работают лучше, чем классификаторы SVM для трехмерных облаков точек.
Оценка бинарных классификаторов
Есть много показателей, которые можно использовать для измерения производительности классификатора или предиктора; разные поля имеют разные предпочтения для конкретных показателей из-за разных целей. В медицине часто используются чувствительность и специфичность , тогда как при извлечении информации предпочтительны точность и отзыв . Важное различие заключается между метриками, которые не зависят от того, как часто каждая категория встречается в популяции ( распространенность ), и метриками, которые зависят от распространенности - оба типа полезны, но имеют очень разные свойства.
Учитывая классификацию конкретного набора данных, существует четыре основных комбинации категории фактических данных и присвоенной категории: истинно положительные TP (правильные положительные присвоения), истинно отрицательные TN (правильные отрицательные присвоения), ложные положительные результаты FP (неправильные положительные назначения) и ложноотрицательные FN (неверные отрицательные отнесения).
Назначенный
Действительный
|
Результат теста положительный | Результат теста отрицательный |
---|---|---|
Состояние положительное | Истинно положительный | Ложное отрицательное |
Состояние отрицательное | Ложное положительное | Истинно отрицательный |
Они могут быть организованы в таблицу непредвиденных обстоятельств 2 × 2 , в которой столбцы соответствуют фактическому значению - положительному условию или отрицательному условию - и строкам, соответствующим классификационному значению - результат теста положительный или результат теста отрицательный.
Восемь основных соотношений
Есть восемь основных соотношений, которые можно вычислить из этой таблицы, которые входят в четыре дополнительные пары (каждая пара в сумме равна 1). Они получаются путем деления каждого из четырех чисел на сумму его строки или столбца, что дает восемь чисел, на которые в общем случае можно ссылаться в форме «истинно положительное соотношение строк» или «ложно отрицательное соотношение столбцов».
Таким образом, есть две пары соотношений столбцов и две пары соотношений строк, и их можно суммировать с помощью четырех чисел, выбрав одно соотношение из каждой пары - остальные четыре числа являются дополнительными.
Соотношения столбцов:
-
истинно положительный показатель (TPR) = (TP / (TP + FN)), также известный как чувствительность или отзыв . Это доля населения с состоянием, при котором тест является правильным.
- с дополнением ложноотрицательный показатель (FNR) = (FN / (TP + FN))
-
истинно отрицательная скорость (TNR) = (TN / (TN + FP), также известная как специфичность (SPC),
- с дополнительным ложноположительным уровнем (FPR) = (FP / (TN + FP)), также называемым независимо от распространенности
Соотношения строк следующие:
-
положительная прогностическая ценность (PPV, также известная как точность ) (TP / (TP + FP)). Это доля населения с данным результатом теста, для которого тест является правильным.
- с дополнением к коэффициенту ложного обнаружения (FDR) (FP / (TP + FP))
-
отрицательная прогностическая ценность (NPV) (TN / (TN + FN))
- с дополнением к ложному пропуску (FOR) (FN / (TN + FN)), также называемому зависимостью от распространенности.
В диагностическом тестировании основными используемыми соотношениями являются истинные соотношения столбцов - истинно положительный показатель и истинно отрицательный показатель - где они известны как чувствительность и специфичность . В информационном поиске основными отношениями являются истинно положительные отношения (строка и столбец) - положительная прогностическая ценность и истинно положительный коэффициент - где они известны как точность и отзыв .
Можно взять отношения из дополнительной пары отношений, что даст четыре отношения правдоподобия ( отношение соотношений по двум столбцам, соотношение по двум строкам). В первую очередь это делается для соотношений столбцов (условий), что дает отношения правдоподобия при диагностическом тестировании . Взятие отношения одной из этих групп соотношений дает окончательное соотношение, диагностическое отношение шансов (DOR). Это также можно определить напрямую как (TP × TN) / (FP × FN) = (TP / FN) / (FP / TN); это имеет полезную интерпретацию - как отношение шансов - и не зависит от распространенности.
Существует ряд других показателей, наиболее просто точность или правильная фракция (FC), которая измеряет долю всех экземпляров, которые правильно классифицированы; дополнение - это неправильная дробь (FiC). F-балл сочетает точность и напомним , в одно число с помощью выбора взвешивания, наиболее просто равна весом, как сбалансированный F-счет ( F1 , оценка ). Некоторые показатели берутся из коэффициентов регрессии : отмеченности и информированности , а также их среднего геометрического , коэффициента корреляции Мэтьюза . Другие показатели включают J статистику Youden в , то коэффициент неопределенности , на фи коэффициент и каппу Коэна .
Преобразование непрерывных значений в двоичные
Тесты, результаты которых представляют собой непрерывные значения, такие как большинство значений крови , могут быть искусственно сделаны бинарными путем определения порогового значения , при этом результаты теста обозначаются как положительные или отрицательные в зависимости от того, является ли результирующее значение выше или ниже порогового значения.
Однако такое преобразование приводит к потере информации, поскольку результирующая двоичная классификация не показывает, насколько значение выше или ниже порогового значения. В результате при преобразовании непрерывного значения, близкого к пороговому значению, в двоичное, результирующее положительное или отрицательное прогнозируемое значение обычно выше, чем прогнозное значение, полученное непосредственно из непрерывного значения. В таких случаях обозначение теста как положительного или отрицательного дает видимость неоправданно высокой достоверности, в то время как значение фактически находится в интервале неопределенности. Например, если концентрация ХГЧ в моче является непрерывной величиной, тест на беременность в моче , измеряющий 52 мМЕ / мл ХГЧ, может быть "положительным" с 50 мМЕ / мл в качестве порогового значения, но на самом деле находится в интервале неопределенности, что может быть очевидным, только зная исходное непрерывное значение. С другой стороны, результат теста, очень далекого от порогового значения, обычно имеет результирующее положительное или отрицательное прогнозное значение, которое ниже, чем прогнозируемое значение, полученное на основе непрерывного значения. Например, значение ХГЧ в моче, равное 200000 мМЕ / мл, дает очень высокую вероятность беременности, но преобразование в двоичные значения приводит к тому, что он показывает столь же «положительный», как и значение 52 мМЕ / мл.
Смотрите также
- Примеры байесовского вывода
- Правило классификации
- Матрица путаницы
- Теория обнаружения
- Методы ядра
- Мультиклассовая классификация
- Классификация с несколькими этикетками
- Одноклассовая классификация
- Ошибка прокурора
- Рабочая характеристика приемника
- Пороговая обработка (обработка изображений)
- Коэффициент неопределенности , он же уровень владения
- Качественная недвижимость
Рекомендации
Библиография
- Нелло Кристианини и Джон Шоу-Тейлор . Введение в опорные векторные машины и другие методы обучения на основе ядра . Cambridge University Press, 2000. ISBN 0-521-78019-5 ( [1] Книга SVM)
- Джон Шоу-Тейлор и Нелло Кристианини. Методы ядра для анализа паттернов . Cambridge University Press, 2004. ISBN 0-521-81397-2 ( Веб-сайт книги )
- Бернхард Шёлкопф и А. Дж. Смола: обучение с помощью ядер . MIT Press, Кембридж, Массачусетс, 2002. ISBN 0-262-19475-9