Модель скрытого класса - Latent class model

В статистике модель скрытых классов ( LCM ) связывает набор наблюдаемых (обычно дискретных) многомерных переменных с набором скрытых переменных . Это разновидность модели со скрытыми переменными . Это называется моделью скрытого класса, потому что скрытая переменная дискретна. Класс характеризуется набором условных вероятностей, которые указывают вероятность того, что переменные принимают определенные значения.

Анализ скрытых классов ( LCA ) - это подмножество моделирования структурных уравнений , используемое для поиска групп или подтипов случаев в многомерных категориальных данных. Эти подтипы называются «скрытыми классами».

Столкнувшись со следующей ситуацией, исследователь может выбрать использование LCA для понимания данных: представьте, что симптомы ad были измерены у ряда пациентов с заболеваниями X, Y и Z, и что болезнь X связана с наличием симптомы a, b и c, болезнь Y с симптомами b, c, d и болезнь Z с симптомами a, c и d.

LCA попытается обнаружить присутствие латентных классов (сущностей болезни), создавая закономерности ассоциации в симптомах. Как и в факторном анализе, LCA также может использоваться для классификации случаев согласно их принадлежности к классу максимального правдоподобия .

Поскольку критерием для решения LCA является достижение латентных классов, в которых больше нет никакой ассоциации одного симптома с другим (потому что класс - это болезнь, которая вызывает их ассоциацию), и набор заболеваний, которыми болен пациент (или класс случай является членом) вызывает ассоциацию симптомов, симптомы будут «условно независимыми», т. е. обусловленными классовой принадлежностью, они больше не связаны.

Модель

Внутри каждого латентного класса наблюдаемые переменные статистически независимы . Это важный аспект. Обычно наблюдаемые переменные статистически зависимы. За счет введения скрытой переменной независимость восстанавливается в том смысле, что внутри классов переменные независимы ( локальная независимость ). Затем мы говорим, что связь между наблюдаемыми переменными объясняется классами скрытой переменной (McCutcheon, 1987).

В одной форме модель скрытого класса записывается как

где - количество скрытых классов, а - так называемые вербовки или безусловные вероятности, которые в сумме должны равняться единице. - предельные или условные вероятности.

Для двусторонней модели скрытых классов форма

Эта двусторонняя модель связана с вероятностным латентно-семантическим анализом и неотрицательной матричной факторизацией .

Связанные методы

Существует ряд методов с разными именами и использованием, которые имеют общие отношения. Кластерный анализ , как и LCA, используется для обнаружения таксоноподобных групп случаев в данных. Оценка многомерной смеси (MME) применима к непрерывным данным и предполагает, что такие данные возникают из смеси распределений: представьте себе набор высот, возникающих из смеси мужчин и женщин. Если оценка многомерной смеси ограничена таким образом, что меры должны быть некоррелированными в пределах каждого распределения, это называется анализом скрытого профиля . Этот ограниченный анализ, модифицированный для обработки дискретных данных, известен как LCA. Дискретные модели скрытых признаков дополнительно ограничивают формирование классов из сегментов одного измерения: по существу, распределение членов по классам в этом измерении: примером может быть присвоение дел социальным классам по измерению способностей или заслуг.

На практике переменными могут быть вопросы с множественным выбором политического вопросника. Данные в этом случае представляют собой N- образную таблицу непредвиденных обстоятельств с ответами на вопросы для ряда респондентов. В этом примере латентная переменная относится к политическим взглядам, а латентные классы - к политическим группам. Учитывая членство в группе, условные вероятности определяют шанс выбора определенных ответов.

заявка

LCA может использоваться во многих областях, таких как: совместная фильтрация , генетика поведения и оценка диагностических тестов .

Ссылки

внешние ссылки

  • Статистические инновации, домашняя страница , 2016. Веб-сайт с программным обеспечением скрытого класса (Latent GOLD 5.1), бесплатными демонстрациями, учебными пособиями, руководствами пользователя и публикациями для загрузки. Также включены: онлайн-курсы, ответы на часто задаваемые вопросы и другое сопутствующее программное обеспечение.
  • Методологический центр, Анализ скрытых классов , исследовательский центр в Пенсильвании , бесплатное программное обеспечение, FAQ
  • Джон Уэберсакс, Анализ скрытых классов , 2006. Веб-сайт с библиографией, программным обеспечением, ссылками и часто задаваемыми вопросами для анализа скрытых классов.