Лабораторная работа № 3. Оценки
Cpавнение оценок
Определения
Пусть x1, …, xn — выборка , т.е. n независимых испытаний случайной величины X , имеющeй функцию распределения F(x / a), зависящую от параметра a, значение которого неизвестно. требуется оценить значение параметра a.
Оценкой a = j(x1, …, xn) называется функция наблюдений, используемая для приближенного определения неизвестного параметра. Значение a оценки является случайной величиной, поскольку (x1, …, xn) — случайная величина (многомерная).
Свойства оценок
1. Оценка a= j(x1, …, xn) называется состоятельной, если при n ® ¥ a ® a по вероятности при любом значении a.
2. Оценка a = j(x1, …, xn) называется несмещенной, если при любом a Ma = Mj(x1, …, xn) = a.
состоятельность — обязательное свойство используемых оценок. свойство несмещенности является желательным; многие применяемые оценки свойством несмещенности не обладают.
3. Оценка j* называется оптимальной, если для неё средний квадрат ошибки
M(a- a)2= M[j*(x1, …, xn) — a]2= min M[j(x1, …, xn) — a]2
минимален среди всех оценок {j}; здесь критерием качества оценки принят квадарт ошибки (a — a)2. В более общей ситуации, если критерием качества служит некоторая величина L(a, a), называемая функцией потерь (или функцией штрафа), то оптимальная оценка та, для которой минимальна величина ML(a, a); последняя есть функциея неизвестного a и называется функцией условного риска. Ясно, что оптимальной оценки может не существовать (так как характеристикой является функция, а не число).
Постановка конкретной задачи.
Пример. Пусть на заводе имеется большая партия из N (тысячи) транзисторов, используемых для сборки некоторого прибора. Выходные параметры прибора (например, надежность, уровень шума, вероятность выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный ток у разных экземпляров различен, и потому можно считать его случайной величиной, причем, как известно технологам, распределённой равномерно в диапазоне от 0 до Imax, где Imax —порог отбраковки, установленный на заводе — изготовителе транзисторов. Следовательно, выходные параметры прибора определяются величиной Imax. Предположим, что по каким-либо причинам значение Imaxпроизводителю приборов неизвестно. Ясно, что в этом случае из партии нужно случайным выбором извлечь n (сравнительно немного: десятки) транзисторов, измерить их ток, и по измерениям оценить Imax (неизвестный параметр а).
Аналогичным образом можно оценивать и качество антивирусного программного обеспечения (число пропущенных вирусов) или различных систем защиты (обнаружения вторжения или т.п.).
Статистическую задачу можно сформировать следующим образом:
Статистическая задача:по наблюдениям x1, …, xn над случайной величиной C, распределённой равномерно на отрезке [0, a], оценить неизвестный параметр a.
сравним три способа оценивания (три оценки):
1. оценку, полученную методом моментов,
a1 = , (1)
2. оценку, полученную методоммаксимального правдоподобия (после исправления смещённости),
a2 = max xi (2)
3. оценку, полученную методом порядковых статистик,
a3 = 2 0.5 = x(k) + x(k+1), (3)
где 0.5 = — выборочная квантиль порядка 0.5, т.е. выборочная медиана; x(k) — член вариационного ряда с номером k; здесь полагаем n = 2k. Точность этих оценок можно сравнить теоретически и экспериментально (статистически).
Замечание. Точность, однако, не является единственным критерием качества оценок. Весьма важно, например, свойство устойчивости оценки к изменению закона распределения или к засорению; в этом смысле, как оказывается, a3 — наиболее хороша, а a2 — наименее; действительно, пусть, например, в нашу выборку случайно попало наблюдение, резко превосходящее все остальные (в случае с партией триодов, попался триод, не прошедший отбраковку); значение оценки a2 резко изменится, значение a3 почти не изменится.