U-статистика - U-statistic

В статистической теории , U-статистика является классом статистики , что особенно важно в теории оценивания ; буква «U» означает беспристрастность. В элементарной статистике U-статистика естественным образом возникает при получении несмещенных оценок с минимальной дисперсией .

Теория U-статистика позволяет минимальной дисперсия несмещенная оценка , которые будут получена от каждой несмещенной оценки из с почтенным параметром ( в качестве альтернативы, статистического функционального ) для больших классов вероятностных распределений. Почтенный параметр является измеримой функцией от населения кумулятивного распределения вероятностей : Например, для каждого распределения вероятностей, медиана населения является параметром почтенным. Теория U-статистики применяется к общим классам вероятностных распределений.

Многие статистические данные, первоначально полученные для конкретных параметрических семейств, были признаны U-статистикой для общих распределений. В непараметрической статистике теория U-статистики используется для установления статистических процедур (таких как оценки и тесты) и оценок, относящихся к асимптотической нормальности и дисперсии (в конечных выборках) таких величин. Теория использовалась для изучения более общей статистики, а также случайных процессов , таких как случайные графы .

Предположим, что проблема связана с независимыми и одинаково распределенными случайными величинами и что требуется оценка определенного параметра. Предположим, что простая несмещенная оценка может быть построена на основе всего нескольких наблюдений: это определяет базовую оценку, основанную на заданном количестве наблюдений. Например, одно наблюдение само по себе является объективной оценкой среднего значения, а пара наблюдений может использоваться для получения несмещенной оценки дисперсии. U-статистика, основанная на этой оценке, определяется как среднее (по всем комбинаторным выборкам данного размера из полного набора наблюдений) базовой оценки, примененной к подвыборкам.

Сен (1992) представляет обзор статьи Василия Хёффдинга (1948), в которой вводится U-статистика и излагается относящаяся к ней теория, и тем самым Сен подчеркивает важность U-статистики в статистической теории. Сен говорит: «Влияние Хёффдинга (1948) огромно в настоящее время и, скорее всего, будет продолжаться в ближайшие годы». Обратите внимание, что теория U-статистики не ограничивается случаем независимых и одинаково распределенных случайных величин или скалярных случайных величин.

Определение

Термин U-статистика, введенный Хёффдингом (1948), определяется следующим образом.

Позвольте быть действительной или комплексной функцией переменных. Для каждого связанная U-статистика равна среднему по упорядоченным выборкам размера значений выборки . Другими словами,

,

где обозначает из -выбрать- различных упорядоченных выборок размера, взятых из . Каждая U-статистика обязательно является симметричной функцией .

U-статистика очень естественна в статистической работе, особенно в контексте Хёффдинга независимых и одинаково распределенных случайных величин , или, в более общем смысле, для заменяемых последовательностей , например, в простой случайной выборке из конечной совокупности, где определяющее свойство называется `` наследование на среднее'.

K -статистика Фишера и polykays Тьюки являются примерами однородной полиномиальной U-статистики (Fisher, 1929; Tukey, 1950). Для простой случайной выборки φ размера  n, взятой из совокупности размера  N , U-статистика обладает тем свойством, что среднее значение по выборке  ƒ n ( ) точно равно значению совокупности  ƒ N ( x ).

Примеры

Некоторые примеры: Если U-статистика является выборочным средним.

Если , U-статистика - это среднее попарное отклонение , определенное для .

Если , U-статистика - это выборочная дисперсия с делителем , определенная для .

Третья -статистика , для которой определена асимметрия выборки , является U-статистикой.

Следующий случай подчеркивает важный момент. Если - это медиана трех значений, это не медиана значений. Однако это несмещенная оценка с минимальной дисперсией ожидаемого значения медианы трех значений, а не медианы совокупности. Подобные оценки играют центральную роль, когда параметры семейства распределений вероятностей оцениваются с помощью моментов, взвешенных по вероятности, или L-моментов .

Смотрите также

Примечания

  1. ^ Cox & Hinkley (1974), стр. 200, стр. 258
  2. ^ Hoeffding (1948), между уравнениями (4.3), (4.4)
  3. ^ Сен (1992)
  4. ^ Страница 508 в Королюк, В.С.; Боровскич, Ю. В. (1994). Теория U- статистики . Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN   0-7923-2608-3 . Руководство по ремонту   1472486 .
  5. ^ Страницы 381–382 в Боровских, Ю. В. (1996). U -статистика в банаховых пространствах . Утрехт: ВСП. С. xii + 420. ISBN   90-6764-200-2 . Руководство по ремонту   1419498 .
  6. ^ Page XII в Квапень, Stanisƚaw; Войчинский, Войбор А. (1992). Случайные ряды и стохастические интегралы: одиночные и кратные . Вероятность и ее приложения. Бостон, Массачусетс: Birkhäuser Boston, Inc., стр. Xvi + 360. ISBN   0-8176-3572-6 . Руководство по ремонту   1167198 .
  7. ^ Сен (1992) стр. 307
  8. ^ Sen (1992), P306
  9. ^ Последняя глава Боровских обсуждает U-статистику для заменяемых случайных элементов, принимающих значения в векторном пространстве ( сепарабельное банахово пространство ).

Рекомендации