Бинарная классификация - Binary classification

Бинарная классификация - это задача классификации элементов набора на две группы на основе правила классификации . Типичные проблемы бинарной классификации включают:

Бинарная классификация - это дихотомия, применяемая к практической ситуации. Во многих практических задачах бинарной классификации эти две группы не являются симметричными, и вместо общей точности представляет интерес относительная доля различных типов ошибок . Например, при медицинском тестировании обнаружение болезни, когда ее нет ( ложноположительный результат ), рассматривается иначе, чем невыявление болезни при ее наличии ( ложноотрицательный ).

Статистическая бинарная классификация

Статистическая классификация - это проблема, изучаемая в машинном обучении . Это тип обучения с учителем, метод машинного обучения, в котором категории предопределены, и используется для классификации новых вероятностных наблюдений по указанным категориям. Когда есть только две категории, проблема известна как статистическая двоичная классификация.

Некоторые из методов, обычно используемых для двоичной классификации:

Каждый классификатор лучше всего подходит только для выбранной области на основе количества наблюдений, размерности вектора признаков , шума в данных и многих других факторов. Например, случайные леса работают лучше, чем классификаторы SVM для трехмерных облаков точек.

Оценка бинарных классификаторов

В этом наборе тестируемых экземпляров экземпляры, оставшиеся от разделителя, имеют проверяемое условие; правая половина нет. Овал ограничивает те экземпляры, которые алгоритм тестирования классифицирует как имеющие условие. Зеленые области выделяют экземпляры, которые алгоритм тестирования правильно классифицировал. Этикетки относятся к:
TP = истинно положительный результат; TN = истинно отрицательный; FP = ложное срабатывание (ошибка I типа); FN = ложноотрицательный (ошибка типа II); TPR = набор экземпляров для определения истинно положительной скорости; FPR = набор экземпляров для определения количества ложных срабатываний; PPV = положительная прогностическая ценность; NPV = отрицательная прогностическая ценность.

Есть много показателей, которые можно использовать для измерения производительности классификатора или предиктора; разные поля имеют разные предпочтения для конкретных показателей из-за разных целей. В медицине часто используются чувствительность и специфичность , тогда как при извлечении информации предпочтительны точность и отзыв . Важное различие заключается между метриками, которые не зависят от того, как часто каждая категория встречается в популяции ( распространенность ), и метриками, которые зависят от распространенности - оба типа полезны, но имеют очень разные свойства.

Учитывая классификацию конкретного набора данных, существует четыре основных комбинации категории фактических данных и присвоенной категории: истинно положительные TP (правильные положительные присвоения), истинно отрицательные TN (правильные отрицательные присвоения), ложные положительные результаты FP (неправильные положительные назначения) и ложноотрицательные FN (неверные отрицательные отнесения).

Назначенный
Действительный
Результат теста положительный Результат теста отрицательный
Состояние положительное Истинно положительный Ложное отрицательное
Состояние отрицательное Ложное положительное Истинно отрицательный

Они могут быть организованы в таблицу непредвиденных обстоятельств 2 × 2 , в которой столбцы соответствуют фактическому значению - положительному условию или отрицательному условию - и строкам, соответствующим классификационному значению - результат теста положительный или результат теста отрицательный.

Восемь основных соотношений

Есть восемь основных соотношений, которые можно вычислить из этой таблицы, которые входят в четыре дополнительные пары (каждая пара в сумме равна 1). Они получаются путем деления каждого из четырех чисел на сумму его строки или столбца, что дает восемь чисел, на которые в общем случае можно ссылаться в форме «истинно положительное соотношение строк» ​​или «ложно отрицательное соотношение столбцов».

Таким образом, есть две пары соотношений столбцов и две пары соотношений строк, и их можно суммировать с помощью четырех чисел, выбрав одно соотношение из каждой пары - остальные четыре числа являются дополнительными.

Соотношения столбцов:

Соотношения строк следующие:

В диагностическом тестировании основными используемыми соотношениями являются истинные соотношения столбцов - истинно положительный показатель и истинно отрицательный показатель - где они известны как чувствительность и специфичность . В информационном поиске основными отношениями являются истинно положительные отношения (строка и столбец) - положительная прогностическая ценность и истинно положительный коэффициент - где они известны как точность и отзыв .

Можно взять отношения из дополнительной пары отношений, что даст четыре отношения правдоподобия ( отношение соотношений по двум столбцам, соотношение по двум строкам). В первую очередь это делается для соотношений столбцов (условий), что дает отношения правдоподобия при диагностическом тестировании . Взятие отношения одной из этих групп соотношений дает окончательное соотношение, диагностическое отношение шансов (DOR). Это также можно определить напрямую как (TP × TN) / (FP × FN) = (TP / FN) / (FP / TN); это имеет полезную интерпретацию - как отношение шансов - и не зависит от распространенности.

Существует ряд других показателей, наиболее просто точность или правильная фракция (FC), которая измеряет долю всех экземпляров, которые правильно классифицированы; дополнение - это неправильная дробь (FiC). F-балл сочетает точность и напомним , в одно число с помощью выбора взвешивания, наиболее просто равна весом, как сбалансированный F-счет ( F1 , оценка ). Некоторые показатели берутся из коэффициентов регрессии : отмеченности и информированности , а также их среднего геометрического , коэффициента корреляции Мэтьюза . Другие показатели включают J статистику Youden в , то коэффициент неопределенности , на фи коэффициент и каппу Коэна .

Преобразование непрерывных значений в двоичные

Тесты, результаты которых представляют собой непрерывные значения, такие как большинство значений крови , могут быть искусственно сделаны бинарными путем определения порогового значения , при этом результаты теста обозначаются как положительные или отрицательные в зависимости от того, является ли результирующее значение выше или ниже порогового значения.

Однако такое преобразование приводит к потере информации, поскольку результирующая двоичная классификация не показывает, насколько значение выше или ниже порогового значения. В результате при преобразовании непрерывного значения, близкого к пороговому значению, в двоичное, результирующее положительное или отрицательное прогнозируемое значение обычно выше, чем прогнозное значение, полученное непосредственно из непрерывного значения. В таких случаях обозначение теста как положительного или отрицательного дает видимость неоправданно высокой достоверности, в то время как значение фактически находится в интервале неопределенности. Например, если концентрация ХГЧ в моче является непрерывной величиной, тест на беременность в моче , измеряющий 52 мМЕ / мл ХГЧ, может быть "положительным" с 50 мМЕ / мл в качестве порогового значения, но на самом деле находится в интервале неопределенности, что может быть очевидным, только зная исходное непрерывное значение. С другой стороны, результат теста, очень далекого от порогового значения, обычно имеет результирующее положительное или отрицательное прогнозное значение, которое ниже, чем прогнозируемое значение, полученное на основе непрерывного значения. Например, значение ХГЧ в моче, равное 200000 мМЕ / мл, дает очень высокую вероятность беременности, но преобразование в двоичные значения приводит к тому, что он показывает столь же «положительный», как и значение 52 мМЕ / мл.

Смотрите также

Рекомендации

Библиография