СТАТЬИ И ПУБЛИКАЦИИ

Вход или Регистрация

ПОМОЩЬ В ПАТЕНТОВАНИИ НАУЧНО-ТЕХНИЧЕСКИЙ ФОРУМ Научно-техническая библиотекаНаучно-техническая библиотека SciTecLibrary
 
Cтатьи и Публикации ДРОБНЫЕ СТЕПЕНИ СВОБОДЫ В СТАТИСТИКЕ

ДРОБНЫЕ СТЕПЕНИ СВОБОДЫ В СТАТИСТИКЕ

© Машкин Михаил Николаевич, преподаватель МАИ,

Кафедра автоматизированных систем обработки информации и управлении

Контакт с автором: 9137.g23@g23.relcom.ru

125080, Москва, ул. Панфилова 10-82, (095)158-34-50

Рассматривается понятие наблюдения и представления результатов отсчёта в виде интервала. Переход к интервальным измерениям обеспечивается использованием в качестве параметра выборки общего приведенного количества измерений (количества степеней свободы), которое позволяет использовать нецелые (дробные) степени свободы при расчёте оценок статических параметров и значений критериев.

Замена единичных измерений интервальными при их одинаковых количествах во всех случаях снижает точность оценки статистических параметров.


В настоящее время имеются известные применения дробных степеней в статистике [1]. Однако, использование различных методов обработки данных, в частности при малых выборках [2] и при обработке методами аналогичными методу группового учета аргументов [3], позволяет предположить расширение их использования в расчётах. Рассмотрим возможные подходы по использованию дробных (нецелых) степеней свободы при расчёте значений статистических параметров на основе результатов измерения.

Понятие наблюдения

В соответствие с [4] опытной основой научного исследования является наблюдение. Результаты наблюдения чаще всего записывают в виде значений измеряемых величин, их отсчётов. При статических методах измерения результатом является одно число. При динамических методах возможна запись измеряемой величины во времени в виде реализации случайного (неслучайного) процесса. В последнем случае часто результатом измерения являются оценки параметров процесса. В обоих случаях необходимым условием является статистическая устойчивость, которая заключается в приближении, при достаточно большом количестве наблюдений, частости (отношение количества наблюдения отдельного значения к общему числу наблюдений) к вероятности данного значения. Во всех случаях, если измерение величины повторяется много раз, то результатом является статистический ряд распределения, соответствующий какому-либо закону распределения, который может быть связан с погрешностью измерительной системы или прибора.

Каждое единичное измерение (отсчёт), а также их совокупность дают эмпирическое распределение, которое описывается в виде гистограммы, статистического ряда, эмпирической функции распределения и т.д. В этом случае, наряду с вышеперечисленным, необходимо указывать количество измерений, т.е. эмпирическое описание требует указания количества опытов (объём выборки), на основании которых оно получено. Будем называть количество измерений, на основании которых получено эмпирическое описание закона распределения, количеством степеней свободы.

Однако существуют измеряемые величины, которые по своей природе, изначально, имеют вид, соответствующий определённому закону распределения [5]. В этом случае измеряемая величина задаётся не значением, постоянным или меняющимся во времени, а областью, в каждой точке которой она может находиться с определенной вероятностью. Это позволяет каждому измерению ставить в соответствие область определения измеренной величины и закон её распределения.

Область определения величины можно задать одним или более чем одним интервалом, см.рис.1. Одно измерение даёт область и значение оценок параметров закона распределения.

Интервальные измерения

Рассмотрим основные предпосылки использования интервалов в качестве результатов измерения. Возможность выражения числовых значений величин в виде интервалов используется в теории интервалов [6]. Основная идея интервального анализа заключается в том, что с интервалами можно работать, как и с обычными числами. К ним вполне применимы такие обычные операции, как сложение, вычитание, умножение и деление, а также операции теории множеств: пересечение и объединение. Операции с интервалами описываются соотношением:

A @ B = {x @ y| xÎ A, yÎ B}, (1)

где @ — одна из операций {+, -, *, /, È , Ç }.

A, B — интервалы.

Рис. 1. Виды областей определения измеряемой величины:

а — одно наблюдение — одно числовое значение; б — одно наблюдение — множество интервалов числовых значений, в том числе неограниченных слева или справа; в — одно наблюдение — множество интервалов строго ограниченных слева и справа; г — одно наблюдение — один интервал числовых значений с одной границей слева и одной границей справа.

Одно число (вещественное) можно рассматривать как имеющее область определения интервал и закон распределения в виде вероятности достоверного события:

P(a Î  [a, a]) = 1, a = [a, a], (2)

т.е. для описания измеренного достаточно одного числового значения.

В качестве примера измерения, имеющего область определения в виде одного интервала, рассмотрим процесс измерения диаметра кольца подшипника. Измерение значения радиуса отверстия или внешнего диаметра достаточно точными приборами относительно расчётного центра кольца подшипника даёт зависимость значения радиуса от точки на окружности поверхности отверстия или внешнего диаметра в виде реализации случайного процесса, которая описывается случайной функцией вида:

, (3)

где a — угол поворота кольца подшипника.

Точные лабораторные приборы, кругломеры, позволяют записать полностью вид реализации случайного процесса. Очевидно, когда такая запись существует, она может быть обработана известными методами теории случайных процессов. В производственных условиях применение точных приборов нецелесообразно. Применяемые контрольные приборы позволяют измерять достаточно точно диаметр кольца подшипника. При вращении кольца подшипника возможно также определение максимального и минимального значения диаметра подшипника. Если мы ограничимся только двумя этими значениями, то фактически мы приходим к случаю двух как бы независимых наблюдений. Информация о том, что между этими двумя значениями существуют и другие числовые значения диаметра, теряется. Для более полного отражения существа наблюдения предлагается считать рассмотренный процесс измерение как единичное наблюдение в виде одного интервала, рис.1,г. значение измеренного диаметра будет иметь описание в виде статистического ряда на заданном интервале:

(4)

где d — значение диаметра кольца подшипник.

При интервальном измерении как бы имеется две степени свободы: измерение одной и другой границы интервала. Однако эти два измерения рассматривают в совокупности через интервал. Например, одно измерение граница, а другое собственно значение интервала, т.е. здесь существует связь: для первого измерения доступна вся числовая ось, а второе измерение описывает область конечной длины привязанной к первому. Доступность всей числовой оси здесь надо понимать, как возможность представления первого измерения, только за счёт выбора начального значения точки отсчёта, любым числом, в том числе почти бесконечностью. Для интервала какую бы мы не выбрали точку отсчёта, его значение остаётся постоянным. Отсюда можно предположить, что указанная связь как бы снижает количество степеней свободы выбора числовых значений для интервального измерения. Можно предположить, что оно меньше двух, но больше единицы.

Интервальное измерение в общем случае имеет значения границ интервалов и параметров или их оценок закона распределения. Это можно описать в виде отображение интервала в значения параметров:

(5)

где G — отображение множества числовых значений интервального измерения в значения параметров или их оценок закона распределения вероятностей;

ai, bi — границы i-го интервала;

P — известный закон распределения значений случайной величины из интервала;

b j — значение или оценка параметра закона распределения.

Необходимо отметить, что границы интервала могут быть отображены в параметрах закона распределения в явном виде (например, границы интервала в случае закона равной плотности вероятности) или косвенно в виде области определения этого закона.

Одним из вариантов описания закона распределения P является плотность вероятности. По заданной плотности вероятности или гистограмме можно вычислить или оценить параметры закона распределения. Ранее объявленная общность для интервала и одного числа (2) позволяет применить эти вычисления и для одного числа полученного в процессе измерения. Проиллюстрируем это на примере вычисления дисперсии единичного наблюдения.

Вычисление оценки дисперсии одного наблюдения по известным соотношениям [1] может быть выполнено по формуле:

, если mx известно, (6)

Здесь mxx — математическое ожидание;

x — числовое значение измерения.

Для одного числа из интервала с совпадающими границами справедлива формула (6), т.к. математическое ожидание не требует оценки, а равно самому числу. Значение оценки дисперсии в этом случае равно нулю. Это, очевидно, указывает на неслучайность в отношении интервального представления одного числа, т.е. конкретное значение измеренной величины не имеет случайной компоненты ¾ неслучайная величина.

Вычисление оценки дисперсии для интервального измерения в предельном случае можно считать, как для двух независимых наблюдений, по формулам:

, если mx неизвестно, и (7)

, если mx известно, (8)

Можно предположить, что величина значения оценки дисперсии для интервала для каждого случая, ввиду меньшего значения степеней свободы, должна превосходить значения, которые дают формулы (7, 8). Кроме того, внутри интервала значения измеряемой величины определяются её законом распределения. Если выбрать в качестве основного закон равной плотности вероятности (РПВ), то остальные распределения будем приводить к нему счёт изменения величины интервала на основе равенства значения энтропии.

Определим приведённое количество измерений (степеней свободы) для интервального измерения в виде:

ri = 1 + D i , (9)

³ |D i |³  0;

где

Значение D i можно определить по формуле:

(10)

где для закона РПВ и

для любого другого закона распределения величины x на интервале [ai, bi];

в случае, если измеряемая величина дискретна;

, если измеряемая величина непрерывна;

HРПВ = log n[a,b], в случае, если дискретная измеряемая величина распределена равновозможно внутри интервала, где n[a,b] ¾ количество равновозможных состояний на интервале;

HРПВ = logc(bi – ai), при c < bi – ai, если внутри интервала измеряемая величина распределена по закону РПВ;

M[X[a,b]] ¾ математическое ожидание измеряемой величины на интервале [bi, ai].

Общее приведённое количество измерений, величина для расчёта статистических параметров по выборке, будет равно:

. (11)

Это предполагает, что при построении статистического ряда распределения или гистограммы каждое интервальное измерение должно иметь свою долю пропорциональную величине ri. В случае, если оно равно 0, то это измерение не учитывается. Если же оно отлично от нуля, то величина вклада, как количества измерений (опытов), равна её значению.

Формулы для расчёта основных оценок статистических параметров для одного, i-го интервального измерения, в случае закона РПВ измеряемой величины внутри интервала, будут иметь вид:

; (12)

. (13)

Пример. Определим по формуле (13) при прямоугольном вкладе (РПВ), оценку дисперсии на интервале i-того наблюдения для различных соотношений величины интервала и значения его математического ожидания, см. табл.1.

Таблица 1

Оценка дисперсии через приведенное количество измерений

Левая граница интервала ai

Правая граница интервала bi

Оценка математического ожидания,

Приведенное количество измерений ri

Оценка дисперсии, формула (13),

-4

4

0

2

32

-3

5

1

1,888889

36

-2

6

2

1,8

40

-1

7

3

1,727273

44

0

8

4

1,666667

48

1

9

5

1,615385

52

2

10

6

1,571429

56

3

11

7

1,533333

60

4

12

8

1,5

64

5

13

9

1,470588

68

6

14

10

1,444444

72

7

15

11

1,421053

76

8

16

12

1,4

80

30

38

34

1,190476

168

Анализ таблицы показывает, что при симметричном интервале (случай, когда оценка математического ожидания равна 0) оценка дисперсии совпадает с величиной рассчитанной по формуле (7) для двух единичных измерений. С увеличением значения математического ожидания растёт величина дисперсии за счёт уменьшения приведенного количества измерений, которое можно принять за количество степеней свободы полученного измерения.

С учётом изложенного единичное измерение можно рассматривать как интервальное при величине интервала равном погрешности округления показаний измерительного прибора. При этом достаточно малая относительная погрешность даёт приведенное количество измерений равное 1.

Метод вкладов

Для обработки результатов малой выборки при оценке законов распределения используют метод вкладов [2,6]. Данный подход позволяет получить парадоксальный результат: за счёт подбора эмпирическим путём ширины интервала прямоугольного или иного вклада точность оценки возрастает. Парадокс заключается в том, что за счёт загрубления результатов измерения (числа заменяются интервалами фиксированной ширины) якобы повышается точность определения статистических параметров.

При использовании формализма работы [2], предлагаемая оценочная формула для метода вкладов для плотности вероятности будет иметь вид:

, (14)

где n — количество наблюдений;

pi(x,ai,bi) — обобщенная запись эмпирической составляющей плотности распределения, связанной с интервалом i-го наблюдения (обладает всеми свойствами плотности распределения), описывает закон распределения измерений на интервале. Эмпиризм, в отличие от работы [2], ограничивается выбором закона распределения на интервале. Причём возможны два варианта:

  1. закон распределения одинаков для всех интервалов;

  2. для каждого интервала подбирают свой закон распределения.

Для случая закона РПВ на интервале будем иметь:

. (15)

В работе [7] приведена формула, использующая метод вкладов, для эмпирической компоненты оценки плотности в виде:

, (16)

где r ¾ параметр равный половине интервала вклада, ,

т.е. интервал во всех измерениях принят одинаковый;

¾ (17)

амплитуда, обеспечивает равенство каждого вклада 1;

m i = 1/N ¾ вес, коэффициент для нормирования оценки плотности.

Рассмотрим варианты применения формул (14) и (16) для примера 2.1 из работы [7].

Пример 2.1[7]. В результате измерения параметра X трёх изделий после наладки оборудования получены следующие результаты: 6,0; 6,4; 6,6. Оценим эмпирическую плотность, характеризующую качество наладки оборудования.

Для вычисления по (16) необходимо принять некоторые допущения. Предположим, что m I = 1/N = 1/3, r  = 0,3 и

(18)

Тогда по формуле (16)

.

Суммируя ядра (вклады)y i(r , x) для всех i = 1, 2, 1 с амплитудами 1,67 и весами 1/3, получим (см.рис.2)

(19)

В случае использования формулы (14) данные примера можно интерпретировать следующим образом. В качестве входных данных используются три интервала: [5,7; 6,3], [6,1; 6,7], [6,3; 6,9]. Длина каждого интервала равна 0,6. Закон распределения внутри интервала РПВ. Плотность распределения равна:

pi(x,ai,bi) = 1/0,6, ai,£  x £ bi. (20)

Расчётные значения по формуле (9) приведенных количеств измерений для каждого интервала сведены в табл.2.

Общее приведённое количество измерений, вычисленное по формуле (11) будет равно:

3,26, в случае, если все параметры интервала получены опытным путём (опытные данные);

2,74, одна из границ интервала задана исследователем (априорные данные).

Таблица 2

Приведенное количество измерений по интервалам пример 2.1

N/N

п/п

Левая граница интервала ai

Правая граница интервала bi

Оценка математического ожидания,

Приведенное количество измерений ri

Обе границы из опыта, rie

Одна граница задана исследователем, rip

1

5,7

6,3

6

1,090909

0,909091

2

6,1

6,7

6,4

1,085714

0,914286

3

6,3

6,9

6,6

1,083333

0,916667

 

 

 

3,26

2,74

Отсюда, оценочные значения для плотности вероятности (14) и с учётом вкладов (18) будут иметь вид:

, для опытных данных, (21)

, для априорных данных, (22)

, для вкладов малой выборки, (23)

где

       ¾

       ¾

        ¾ вклады от интервалов, i ¾ номер интервала;

, при  ¾ вклад i-го интервала при # (re ¾ опытных, rp ¾ априорных, mv ¾ рассчитанных по методу [7]) данных;

¾ высота i-го вклада;

nmv = 3 ¾ количество интервалов;

rimv = 1 ¾  величина вклада метода [7].

Графики оценки плотности вероятности для зависимостей (21-23) приведены на рис.2.

Рассмотрим также пример 2.2 [7], в котором, наряду с интервалами примера 2.1, включен интервал отличный от других по длине.

Пример 2.2[7]. Допустим, что в условиях примера 2.1 имеются априорные сведения в виде интервала [5,0; 7,2]. Вычислим оценки плотности вероятности. Длина интервала для отсчётов 6,0; 6,4 и 6,6 рассчитана [7] равной 0,88, т.е. r = 0,44.

Приведенные количества измерений (9) для каждого интервала сведены в табл.3.

Оценочные значения плотности вероятности в этом случае будут иметь вид:

, для опытных данных, (24)

, для априорных данных, (25)

, для вкладов малой выборки, (26)

Таблица 3

Приведенное количество измерений по интервалам примера 2.2

 

N/N

п/п

Левая граница интервала ai

Правая граница интервала bi

Оценка математического ожидания,

Приведенное количество измерений ri

Обе границы из опыта, rie

Одна граница задана исследователем, rip

1

5,56

6,44

6

1,128

0,872

2

5,96

6,84

6,4

1,121

0,879

3

6,16

7,04

6,6

1,118

0,882

4

5,0

7,2

6,1

1,265

0,735

 

 

 

4,631

3,369

 

Рис.2. Эмпирические оценки плотности вероятности примера 2.1

Высоты вкладов для интервалов приведены в табл.4.

Таблица 4

Высоты вкладов для примера 2.2

Номер интервала

Высота вклада:

 

опытных данных

априорных данных

малой выборки

1

0,277

0,294

0,284

2

0,275

0,297

0,284

3

0,274

0,298

0,284

4

0,124

0,099

0,114

Оценки плотности вероятности для зависимостей (24-26) приведены на рис.3.

Рис.3. Эмпирические оценки плотности вероятности примера 2.2

Приведенные оценки плотностей вероятностей, рис.2 и 3, могут быть использованы в практических приложениях только при указании для каждой из них количества наблюдений (опытов), которые можно считать количеством степеней свободы, см.формулу (11) для приведенного количества измерений. В работе [7] количество опытов равно количеству интервалов. Результаты оценок математического ожидания и дисперсии для данных примеров 2.1 и 2.2 с учётом различных подходов (определение количества опытов, как количества интервалов, или использования вместо него приведённого количества измерений) приведены в табл.5.

Анализ результатов табл.5 позволяет сделать основной вывод ¾ замена единичных измерений интервальными при их одинаковых количествах во всех случаях снижает точность оценки статистических параметров. Это следует из того, что наименьшую дисперсию имеют точечные измерения, а не интервальные. Применение интервальных измерений позволяет расширить возможности статистической обработки измерительной информации. Существенным является использование в качестве параметра выборки общего приведенного количества измерений (количества степеней свободы), которое позволяет использовать нецелые (дробные) степени свободы при расчёте оценок статических параметров и значений критериев.

Таблица 5

Оценки параметров эмпирических плотностей вероятностей

 

Виды данных

Характеристики измерений

Оценки

Примеры

 

 

 

2.1

2.2

Дискретные

Границы интервалов

n

-

5

 

 

MO

-

6,24

 

 

D

-

0,668

 

Средние значения интервалов

n

3

4

 

 

MO

6,333

6,275

 

 

D

0,093

0,076

Интервальные

Опытные

nr

3,26

4,631

 

 

MO

6,333

6,269

 

 

D

0,133

0,272

 

Априорные

nr

2,74

3,369

 

 

MO

6,334

6,283

 

 

D

0,145

0,279

 

Малой выборки

n

3

4

 

 

MO

6,333

6,275

 

 

D

0,138

0,275

Примечание: В табл.5 использованы следующие обозначения: МО ¾ математическое ожидание, D ¾ дисперсия, n ¾ количество опытов или интервалов (для единичного измерения, когда границы интервала совпадают, количество интервалов равно 1), nr ¾ общее приведённое количество измерений.

Список литературы:

  1. Бомас В.В., Булыгин В.С., Машкин М.Н. Теория вероятностей и математическая статистика: Лекции. М.: НПК “Поток”, 2000. —190 с.

  2. Хахулин Г.Ф. Основы конструирования имитационных моделей: Учебное пособие. М.: НПК “Поток”, 2001. —214 с.

  3. Ивахненко А.Г. Системы эвристической самоорганизации в технической кибернетике. К.: “Технiка”, 1971. —373 с.

  4. Митропольский А.К. Техника статистических вычислений. М.: Из-во “Наука”, 1971. —576 с.

  5. Герни Р.В. Введение в квантовую механику / Пер.В.В.Солодовникова, под ред.Л.Э.Гуревича. Л.-М.: ОНТИ Главная редакция общетехнической литературы, 1935. ¾  188 с.

  6. Корзенев Г.Н. Графическая реализация в архитектуре основных законов управления// Эффективность научных исследований РосЗИТЛП. Сб.науч.тр. Вып.1. М.: РосЗИТЛП, 1997. с 41-45.

  7. Гаскаров Д.В., Шаповалов В.И. Малая выборка. М.: Статистика, 1978. с.31-35.

Дата публикации: 5 сентября 2005
Источник: SciTecLibrary.ru

Вы можете оставить свой комментарий по этой статье или прочитать мнения других в следующих разделах ФОРУМА:
Свернуть Защита интеллектуальной собственности и авторских прав
Диспуты по темам изобретательства. Вопросы по изобретениям, проблемы на пути изобретателей и методы их решения.
Патентование. Все о патентовании изобретений, полезных моделей, промышленных образцов и товарных знаков.
Нерешенные задачи. Здесь идет обсуждение нерешенных задач: безопорный двигатель, вечный двигатель, преодоление гравитации и пр.
Свернуть Точные науки и дисциплины
Дебаты по Теории Относительности Эйнштейна. Все кому не лень хотят опровергнуть Теорию Относительности Эйнштейна. Вам предоставляется слово для аргументации.
Физика, астрономия, математические решения. Физико-математические вопросы, наблюдения, исследования, теории и их решение.
Физика альтернативная. Новые взгляды на физические законы, теории, эксперименты, не вписывающиеся в общепринятые законы физики.
Teхника, узлы, механизмы, электроника и аппаратура. Все про технику, приборы, детали, узлы и механизмы. Электроника, компьютеры, программное обеспечение. Новые технические решения в самых разных областях.
Биология, Генетика, Все о жизни. Генетика и другие вопросы биологии. Их развитие. Медицина. Биотехнологии, агротехника и сельское хозяйство. Эволюционные теории и альтернативные им.
Химия. Вопросы по химическим технологиям, разработкам и применению химических материалов. Химические элементы и их свойства.
Геология, все о Земле и ее обитателях. Геология, метеорология, антропология, сейсмология, атмосферные явления и непознанные эффекты природы.
Свернуть Мозговой штурм
Генератор решений. Здесь Вы можете заработать реальные деньги, помогая решать фирмам, предприятиям и частным лицам те или иные технические задачи, которые перед ними стоят. Те, кто ставят задачи перед участниками должны обозначить гонорар за ее решение и перевести указанную сумму на общий счет генератора.
Головоломки. Если у Вас есть желание поломать голову над интересными логическими задачами - Вам сюда.
Гипотезы. В этой теме идет обсуждение гипотез и предположений, основанных чисто на теории и логике.
Найди ляп! Этот раздел для тех, кто хочет мысленно расслабиться. Он посвящен задачам по поискам ляпов, которые встречаются в литературе, интернете, кино и на телевидении.
Свернуть Взгляд в будущее и настоящее
Глобальные темы. Вопросы касающиеся всех. Глобальные угрозы и злободневные темы современности.
Наука и ее развитие. Все о развитии науки, направлениях и перспективах движения научной мысли и знаний.
Новая Цивилизация. Принципы социального устройства новой цивилизации. Увеличение роли созидательного интеллекта... Отдалённые перспективы развития человечества...
Вопросы без ответов. Этот раздел посвящен вопросам и проблемам, которые до сих пор не решены. Предлагайте свои решения.
Военная стратегия и тактика современных боевых действий. Об особенностях современного военного искусства. Проблемные вопросы теории и практики подготовки вооруженных сил к войне, её планирование и ведение в различных конфликтах на планете.
Свернуть Гуманитарные науки и дисциплины
Философские дискуссии. Диспуты по вопросам жизни, сознания, бытия и иных философских понятий.
Экономика. Вопросы по экономике и о путях развития России и других стран.
Социология, Политология, Психология. В этом разделе обсуждаются вопросы, как отдельных частных исследований данных наук, так и проблема соотношения этих наук с остальными.
Образование. Все об образовании: как учить, кому учить, чему учить и кого учить.
Религия и атеизм. Вопросы религий и атеистические взгляды, религиозные споры.

Хотите разместить свою статью или публикацию, чтобы ее читали все?
Как это сделать - узнайте здесь.

Назад

 
О проекте Контакты Архив старого сайта

Copyright © SciTecLibrary © 2000-2017

Агентство научно-технической информации Научно-техническая библиотека SciTecLibrary. Свид. ФС77-20137 от 23.11.2004.