Новости
12.04.2024
Поздравляем с Днём космонавтики!
08.03.2024
Поздравляем с Международным Женским Днем!
23.02.2024
Поздравляем с Днем Защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

НЕПАРАМЕТРИЧЕСКИЙ МЕТОД ОБРАБОТКИ СТАТИСТИЧЕСКИХ ДАННЫХ ОБ ОТКАЗАХ РЭА

Авторы:
Город:
Таганрог
ВУЗ:
Дата:
22 февраля 2016г.

В работе рассмотрен статистический метод, ориентированный на обработку выборок данных критически ограниченного объема, при условии отказа от предположения о нормальности распределения исходной генеральной совокупности.

Большинство используемых в инженерной практике статистических методов было разработано в период с 1930 по 1980 годы. Вычисления в этот период были крайне дороги и трудоемки, что вынуждало статистиков принимать ряд допущений и гипотез относительно свойств анализируемых данных. В частности, многие методы основаны на предположении о нормальности распределения статистических данных [1,3], что, очевидно, не всегда соответствует действительности. Кроме того, невозможность интенсивного применения численного анализа ограничивала множество доступных для исследования статистических мер теми, чьи свойства имели аналитическое выражение. На современном этапе развитие вычислительной техники дало жизнь целому ряду методов, свободных от указанных ограничений за счет колоссального количества производимых на ЭВМ вычислений. Действительно, вычислительная мощность, доступная сегодня каждому студенту, была запредельной еще 30 лет назад, когда эти методы только входили в обиход. К таким методам относят бутстрэп (bootstrap), «складной нож» (jackknife), метод перекрестной проверки (cross-validation) и ряд других. Эти алгоритмы основаны на формировании так называемых «псевдовыборок» на основе исследуемой реализации случайного процесса. Их называют непараметрическими, поскольку они не эксплуатируют предположений относительно вида закона распределения и параметров исследуемой случайной величины [3].

В общем случае, непараметрический подход к построению эмпирической функции распределения требует повторности наблюдений и большого количества статистических данных, что обычно невыполнимо при решении задач прогнозирования надежности радиоэлектронных систем. В случае, когда статистические оценки производились по одной реализации, естественным образом встает вопрос о состоятельности таких оценок и доверительном интервале. Для решения этой задачи применяют бутстрэп-анализ. Идея этого метода состоит в имитации процесса получения большого количества выборок через многократное копирование исходной и тщательного «перемешивания» получившейся таким образом случайной величины. Такая процедура позволяет произвести оценку статистической достоверности определения какого-либо параметра случайной величины по одной реализации.

Рассмотрим этот метод на примере анализа данных о времени наработки между отказами, полученные в ходе эксплуатации РЛС типа «Гроза». Попробуем оценить статистический момент первого и второго порядка для распределения наработки между отказами по данным одного блока.

Блок №  0062 имеет   следующую наработку между   отказами (ч.): 𝐴 = 48; 229; 452; 609; 786; 580; 881; 1212 .

Временно будем полагать, что нам доступна только эта выборка. Для получения выборок бутстрэпа скопируем эти данные 1000 раз, перемешаем, затем извлечем 99 выборок того же объема, что и исходная. На Рисунке 1а представлены гистограммы, демонстрирующие распределения значений математического ожидания и дисперсии, оцененные по выборкам бутстрэпа. Задавшись уровнем значимости, по этим гистограммам можно сделать интервальную оценку искомых параметров. Но насколько эти оценки могут быть распространены на остальные типовые блоки РЛС «Гроза»? Или, другими словами, отражают ли эти оценки, полученные по одной выборке, свойства всей совокупности? Чтобы это выяснить, были обработаны данные о наработке между отказами для 99 аналогичных блоков. По каждому блоку были оценены искомые параметры. Гистограммы распределения их значений приведены на Рисунке 1б.



Можно заметить, что гистограммы на Рисунке 2 а и 2 б дают близкие интервальные оценки соответствующих параметров. Хотя все рассматриваемые блоки являются типовыми, различие условий эксплуатации, очевидно, оказывает влияние на разброс параметров их совокупности. Тем не менее, мы наблюдаем, что распределения оценок статистических моментов, полученные для наработки между отказами блока № 0062 методом бутстрэп-анализа, в значительной степени повторяют аналогичные, но полученные по всей совокупности имеющихся данных. Этот факт говорит в пользу того, что исследованная выборка, несмотря на критически малый объем, в значительной степени отражает свойства всей совокупности.


Для иллюстрации процедуры получения приведенных выше гистограмм на Рисунке 2 в пространстве оценок математического ожидания и дисперсии отмечены данные по наработке на отказ различных блоков (круглые маркеры) и выборки бутстрэпа (маркер «*»). Закрашенным круглым маркером обозначена выборка данных по блоку № 0062.

На Рисунке 2 видно, что исследованная выборка вовсе не является наиболее близкой к максимальному скоплению, тем не менее, полученные из нее выборки бутстрэпа дают оценки искомых моментов, близкие к тем, которые получаются для реальных блоков. Кроме возможности получения адекватных интервальных оценок параметров, это наталкивает на идею о возможности классификации эмпирических данных с использованием бутстрэпа. Речь идет о решении задачи исключения из рассмотрения нетипичных наблюдений. Так, если в пространстве искомых параметров данные, рассчитанные по выборкам бутстрэпа, распределились близким к генеральной совокупности образом, исследуемую исходную выборку можно считать принадлежащей к данной совокупности.

Результаты, полученные для оценок математического ожидания и дисперсии, на первый взгляд могут показаться парадоксальными: получается, что из одной выборки можно получить вполне удовлетворительные гистограммы оценки параметров. Не стоит, естественно, считать описанный метод абсолютно универсальным. Очевидно, результат оценки сильно зависит от репрезентативности исходной малой выборки. Так, если все варианты оказались примерно равными математическому ожиданию, оценка дисперсии будет заниженной. Но все же, как показано в [2, 3], описанный метод в большинстве случаев способен обеспечить неплохую достоверность оценок.

Таким образом, рассмотренный метод статистического анализа, основанный на интенсивном использовании компьютерных вычислений, имеет преимущества перед классическими, заключающиеся в отсутствии необходимости принятия гипотезы о виде закона распределения исследуемой случайной величины; в возможности использования численного анализа для оценки статистических параметров и в ориентированности на работу с небольшими выборками данных.

 

Список литературы

1. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с.

2.     Шитиков В.К., Розенберк Г.С. Рандомизация и бутстрэп: статистический анализ в биологии и экологии с использованием R. - Тольятти: "Кассадра", 2013. - 305 с.

3.     Эфрон Б., Диаконис П. Статистические методы с интенсивным использованием ЭВМ/ В мире науки, №7, 1983 г. с. 60-74.

4.     Гузик В. Ф., Кидалов В.И., Самойленко А.П. Статистическая диагностика неравновесных объектов. – СПб: Судостроение, 2009. – 304 с.

5. Самойленко А.П., Горбунова Е.Б. Чапцев А.Г., Буряк А.В., Оводенко А.В., Горбунов А.А. Системный анализ проблем диагностики радиоэлектронного оборудования летательных аппаратов в нештатных режимах. Сборник докладов IX международной научной конференции по гидроавиации «Гидроавиасалон- 2012», ч. 2, Изд. отдел ЦАГИ, 2012.