Байесовское среднее - Bayesian average

Байесовское среднем это метод оценки средней популяции , используя внешнюю информацию, особенно ранее существовавшее убеждение, что учтен в расчеты. Это центральная особенность байесовской интерпретации . Это полезно, когда доступный набор данных невелик.

Вычисление байесовского средний используют до среднего т и константа  C . C  выбирается на основе типичного размера набора данных, необходимого для надежной оценки выборочного среднего. Значение больше, когда ожидаемая разница между наборами данных (в пределах большей совокупности) мала. Он меньше, если ожидается, что наборы данных будут существенно отличаться друг от друга.

Это эквивалентно добавлению C точек данных со значением m в набор данных. Это средневзвешенное значение априорного среднего m и выборочного среднего.

Когда это двоичные значения 0 или 1, m можно интерпретировать как предварительную оценку биномиальной вероятности с байесовским средним значением, дающим апостериорную оценку наблюдаемых данных. В этом случае C может быть выбран на основе желаемого доверительного интервала биномиальной пропорции для значения выборки. Например, для редких результатов, когда m мало, выбор гарантирует, что 99% доверительный интервал будет иметь ширину около 2 м .


Смотрите также

использованная литература

  • Ян, Сяо; Чжан, Чжаосинь (2013). «Сочетание престижа и рейтинга релевантности для персонализированных рекомендаций». Материалы 22-й международной конференции ACM по управлению информацией и знаниями (CIKM) : 1877–1880 гг. DOI : 10.1145 / 2505515.2507885 .