U-статистика - U-statistic

В статистической теории , U-статистика является классом статистики , что особенно важно в теории оценивания ; буква «U» означает беспристрастность. В элементарной статистике U-статистика естественным образом возникает при получении несмещенных оценок с минимальной дисперсией .

Теория U-статистика позволяет минимальной дисперсия несмещенная оценка , которые будут получена от каждой несмещенной оценки из с почтенным параметром ( в качестве альтернативы, статистического функционального ) для больших классов вероятностных распределений. Почтенный параметр является измеримой функцией от населения кумулятивного распределения вероятностей : Например, для каждого распределения вероятностей, медиана населения является параметром почтенным. Теория U-статистики применяется к общим классам вероятностных распределений.

Многие статистические данные, первоначально полученные для конкретных параметрических семейств, были признаны U-статистикой для общих распределений. В непараметрической статистике теория U-статистики используется для установления статистических процедур (таких как оценки и тесты) и оценок, относящихся к асимптотической нормальности и дисперсии (в конечных выборках) таких величин. Теория использовалась для изучения более общей статистики, а также случайных процессов , таких как случайные графы .

Предположим, что проблема связана с независимыми и одинаково распределенными случайными величинами и что требуется оценка определенного параметра. Предположим, что простая несмещенная оценка может быть построена на основе всего нескольких наблюдений: это определяет базовую оценку, основанную на заданном количестве наблюдений. Например, одно наблюдение само по себе является объективной оценкой среднего значения, а пара наблюдений может использоваться для получения несмещенной оценки дисперсии. U-статистика, основанная на этой оценке, определяется как среднее (по всем комбинаторным выборкам данного размера из полного набора наблюдений) базовой оценки, примененной к подвыборкам.

Сен (1992) представляет обзор статьи Василия Хёффдинга (1948), в которой вводится U-статистика и излагается относящаяся к ней теория, и тем самым Сен подчеркивает важность U-статистики в статистической теории. Сен говорит: «Влияние Хёффдинга (1948) огромно в настоящее время и, скорее всего, будет продолжаться в ближайшие годы». Обратите внимание, что теория U-статистики не ограничивается случаем независимых и одинаково распределенных случайных величин или скалярных случайных величин.

Определение

Термин U-статистика, введенный Хёффдингом (1948), определяется следующим образом.

Позвольте быть действительной или комплексной функцией переменных. Для каждого связанная U-статистика равна среднему по упорядоченным выборкам размера значений выборки . Другими словами, ${\ displaystyle f \ двоеточие R ^ {r} \ to R}$ ${\ displaystyle r}$ ${\ Displaystyle п \ geq r}$ ${\ displaystyle f_ {n} \ двоеточие R ^ {n} \ to R}$ ${\ Displaystyle (\ varphi (1), \ ldots, \ varphi (r))}$ ${\ displaystyle r}$ ${\ displaystyle f (х _ {\ varphi})}$

${\ displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n}) = {\ frac {1} {\ binom {n} {r}}} \ sum _ {t = 1} ^ {\ binom {n} {r}} f (x _ {\ varphi ^ {t} (1)}, \ ldots, x _ {\ varphi ^ {t} (r)})}$ ,

где обозначает из -выбрать- различных упорядоченных выборок размера, взятых из . Каждая U-статистика обязательно является симметричной функцией . ${\ displaystyle \ varphi ^ {t}: = (\ varphi ^ {t} (1), \ dots, \ varphi ^ {t} (r))}$ ${\ Displaystyle т ^ {\ rm {th}}}$ ${\ displaystyle n}$ ${\ displaystyle r}$ ${\ displaystyle r}$ ${\ Displaystyle \ {1, \ ldots, п \}}$ ${\ displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n})}$

U-статистика очень естественна в статистической работе, особенно в контексте Хёффдинга независимых и одинаково распределенных случайных величин , или, в более общем смысле, для заменяемых последовательностей , например, в простой случайной выборке из конечной совокупности, где определяющее свойство называется `` наследование на среднее'.

K -статистика Фишера и polykays Тьюки являются примерами однородной полиномиальной U-статистики (Fisher, 1929; Tukey, 1950). Для простой случайной выборки φ размера n, взятой из совокупности размера N , U-статистика обладает тем свойством, что среднее значение по выборке ƒ _n ( xφ ) точно равно значению совокупности ƒ _N ( x ).

Примеры

Некоторые примеры: Если U-статистика является выборочным средним. ${\ Displaystyle е (х) = х}$ ${\ displaystyle f_ {n} (x) = {\ bar {x}} _ {n} = (x_ {1} + \ cdots + x_ {n}) / n}$

Если , U-статистика - это среднее попарное отклонение , определенное для . ${\ displaystyle f (x_ {1}, x_ {2}) = | x_ {1} -x_ {2} |}$ ${\ displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n}) = 2 / (n (n-1)) \ sum _ {i> j} | x_ {i} -x_ {j} |}$ ${\ Displaystyle п \ geq 2}$

Если , U-статистика - это выборочная дисперсия с делителем , определенная для . ${\ displaystyle f (x_ {1}, x_ {2}) = (x_ {1} -x_ {2}) ^ {2} / 2}$ ${\ displaystyle f_ {n} (x) = \ sum (x_ {i} - {\ bar {x}} _ {n}) ^ {2} / (n-1)}$ ${\ displaystyle n-1}$ ${\ Displaystyle п \ geq 2}$

Третья -статистика , для которой определена асимметрия выборки , является U-статистикой. ${\ displaystyle k}$ ${\ displaystyle k_ {3, n} (x) = \ sum (x_ {i} - {\ bar {x}} _ {n}) ^ {3} n / ((n-1) (n-2) )}$ ${\ Displaystyle п \ geq 3}$

Следующий случай подчеркивает важный момент. Если - это медиана трех значений, это не медиана значений. Однако это несмещенная оценка с минимальной дисперсией ожидаемого значения медианы трех значений, а не медианы совокупности. Подобные оценки играют центральную роль, когда параметры семейства распределений вероятностей оцениваются с помощью моментов, взвешенных по вероятности, или L-моментов . ${\ displaystyle f (x_ {1}, x_ {2}, x_ {3})}$ ${\ displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n})}$ ${\ displaystyle n}$

Смотрите также

V-статистика

Примечания

^ Cox & Hinkley (1974), стр. 200, стр. 258
^ Hoeffding (1948), между уравнениями (4.3), (4.4)
^ Сен (1992)
^ Страница 508 в Королюк, В.С.; Боровскич, Ю. В. (1994). Теория U- статистики . Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN 0-7923-2608-3 . Руководство по ремонту 1472486 .
^ Страницы 381–382 в Боровских, Ю. В. (1996). U -статистика в банаховых пространствах . Утрехт: ВСП. С. xii + 420. ISBN 90-6764-200-2 . Руководство по ремонту 1419498 .
^ Page XII в Квапень, Stanisƚaw; Войчинский, Войбор А. (1992). Случайные ряды и стохастические интегралы: одиночные и кратные . Вероятность и ее приложения. Бостон, Массачусетс: Birkhäuser Boston, Inc., стр. Xvi + 360. ISBN 0-8176-3572-6 . Руководство по ремонту 1167198 .
^ Сен (1992) стр. 307
^ Sen (1992), P306
^ Последняя глава Боровских обсуждает U-статистику для заменяемых случайных элементов, принимающих значения в векторном пространстве ( сепарабельное банахово пространство ).

Languages

In other projects

U-статистика - U-statistic

Содержание

Определение

Примеры

Смотрите также

Примечания

Рекомендации