Ограниченная кластеризация - Constrained clustering

В информатике , сдержана кластеризация является классом полуобучаемого обучения алгоритмов. Как правило, ограниченная кластеризация включает в себя либо набор ограничений обязательного связывания, либо ограничений, связанных с невозможностью связывания, или и то, и другое вместе с алгоритмом кластеризации данных . Как обязательное, так и запрещающее связывание ограничение определяют связь между двумя экземплярами данных. Ограничение обязательного связывания используется для указания того, что два экземпляра в отношении обязательного связывания должны быть связаны с одним и тем же кластером. Ограничение невозможности связывания используется для указания, что два экземпляра в отношении невозможности связывания не должны быть связаны с одним и тем же кластером. Эти наборы ограничений действуют как руководство, для которого алгоритм ограниченной кластеризации будет пытаться найти кластеры в наборе данных, которые удовлетворяют указанным ограничениям обязательной и невозможности связывания. Некоторые алгоритмы ограниченной кластеризации будут прерваны, если не существует такой кластеризации, которая удовлетворяет указанным ограничениям. Другие будут пытаться минимизировать количество нарушений ограничений, если невозможно найти кластеризацию, удовлетворяющую ограничениям. Ограничения также могут использоваться для выбора модели кластеризации из нескольких возможных решений.

Кластер, в котором элементы соответствуют всем ограничениям обязательного и невозможного связывания, называется чанклетом .

Примеры

Примеры алгоритмов ограниченной кластеризации включают:

  • КС К-средства
  • PCKmeans (Парные ограниченные K-средние)
  • CMWK-средние (взвешенные K-средние с ограничениями Минковского)

Рекомендации