Проверка гипотезы о нормальном распределении

Проверка гипотезы о нормальном распределении

Решение находим с помощью калькулятора. Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.Xmin - минимальное значение группировочного признака. Определим границы группы. Номер группыНижняя границаВерхняя граница14345.83245.8348.66348.6651.49451.4954.32554.3257.15657.1560 Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию. 4343 - 45.83148.545.83 - 48.6614948.66 - 51.4914948.66 - 51.49249.548.66 - 51.4935048.66 - 51.4945048.66 - 51.49550.548.66 - 51.49651.551.49 - 54.32151.551.49 - 54.3225251.49 - 54.3235251.49 - 54.3245251.49 - 54.3255251.49 - 54.3265251.49 - 54.3275251.49 - 54.3285251.49 - 54.32952.551.49 - 54.321052.551.49 - 54.32115351.49 - 54.32125351.49 - 54.32135351.49 - 54.321453.551.49 - 54.32155451.49 - 54.32165451.49 - 54.32175451.49 - 54.321854.554.32 - 57.15154.554.32 - 57.15255.554.32 - 57.1535754.32 - 57.15457.557.15 - 59.98157.557.15 - 59.9825857.15 - 59.9835857.15 - 59.98458.557.15 - 59.9856057.15 - 59.986 Результаты группировки оформим в виде таблицы: Группы№ совокупностиЧастота fi43 - 45.831145.83 - 48.662148.66 - 51.493,4,5,6,7,8651.49 - 54.329,10,11,12,13,14,15, 16,17,18,19,20,21, 22,23,24,25,261854.32 - 57.1527,28,29,30457.15 - 59.9831,32,33,34,35,366 Таблица для расчета показателей.

ГруппыxiКол-во, fixi * fiНакопленная частота, S|x - xср|*f(x - xср) 2 *fЧастота, fi/n43 - 45.8344.42144.4218.8878.910.027845.83 - 48.6647.25147.2526.0536.640.027848.66 - 51.4950.086300.45819.3462.330.1751.49 - 54.3252.9118952.29267.072.780.554.32 - 57.1555.744222.94309.7523.750.1157.15 - 59.9858.576351.393631.6166.440.17 361918.73 82.7370.861

Для оценки ряда распределения найдем следующие показатели: Показатели центра распределения. Средняя взвешенная

МодаМода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.Выбираем в качестве начала интервала 51.49, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда – 52.8МедианаМедиана делит выборку на две части: половина вариант меньше медианы, половина — больше. В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 51.49 - 54.32, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50% единиц совокупности будут меньше по величине 53.06Показатели вариации.Абсолютные показатели вариации.Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.R = Xmax - XminR = 60 - 43 = 17Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого не более, чем на 2.3Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии.

Среднее квадратическое отклонение.

Каждое значение ряда отличается от среднего значения 53.3 не более, чем на 3.21Оценка среднеквадратического отклонения.

Относительные показатели вариации.К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Проверка гипотез о виде распределения.1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.

где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа

где s = 3.21, xср = 53.3Теоретическая (ожидаемая) частота равна ni = npi, где n = 36

Интервалы группировкиНаблюдаемая частота nix1 = (xi- x )/sx2 = (xi+1- x )/sФ(x1)Ф(x2)Вероятность попадания в i-й интервал, pi = Ф(x2) - Ф(x1)Ожидаемая частота, 36piСлагаемые статистики Пирсона, Ki43 - 45.831-3.16-2.29-0.5-0.490.010.361.1445.83 - 48.661-2.29-1.42-0.49-0.420.06572.370.7948.66 - 51.496-1.42-0.56-0.42-0.210.217.610.3451.49 - 54.3218-0.560.31-0.210.130.3412.162.854.32 - 57.1540.311.180.130.380.269.27357.15 - 59.9861.182.060.380.480.09733.51.78 36 9.84

Пример №2 . Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200.

Решение находим с помощью калькулятора. Таблица для расчета показателей.

xiКол-во, fixi·fiНакопленная частота, S(x- x )·f(x- x ) 2 ·f(x- x ) 3 ·fЧастота, fi/n5157515114.45873.25-6662.920.07572618241146.38824.12-4639.790.139252256690.75329.42-1195.80.1311303309648.979.71-129.920.1513263381229.623.561.320.13152131514349.77117.95279.550.111724408167104.88458.332002.880.121920380187127.4811.545169.50.12113273200108.81910.747622.890.065 2002526 800.964408.622447.71

Показатели центра распределения.Средняя взвешенная

Показатели вариации.Абсолютные показатели вариации.Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.R = Xmax - XminR = 21 - 5 = 16Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии.

Каждое значение ряда отличается от среднего значения 12.63 не более, чем на 4.7Оценка среднеквадратического отклонения.

Проверка гипотез о виде распределения.1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.

где n*i - теоретические частоты:

Вычислим теоретические частоты, учитывая, что:n = 200, h=2 (ширина интервала), σ = 4.7, xср = 12.63 ixiuiφin*i15-1.63 0,10579.0127-1.2 0,194216.5539-0.77 0,294325.07411-0.35 0,375231.975130.0788 0,397733.886150.5 0,350329.847170.93 0,256521.858191.36 0,158213.489211.78 0,08046.85 Сравним эмпирические и теоретические частоты. Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия: Χ 2 = inin*ini-n*i(ni-n*i) 2 (ni-n*i) 2 /n*i1159.01-5.9935.943.9922616.55-9.4589.395.432525.070.07340.005390.00021543031.971.973.860.1252633.887.8862.141.8362129.848.8478.222.6272421.85-2.154.610.2182013.48-6.5242.533.169136.85-6.1537.825.52∑200200 22.86 Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).Её границу Kkp = χ 2 (k-r-1;α) находим по таблицам распределения «хи-квадрат» и заданным значениям σ, k = 9, r=2 (параметры xcp и σ оценены по выборке).Kkp(0.05;6) = 12.59159; Kнабл = 22.86 Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону. Другими словами, эмпирические и теоретические частоты различаются значимо.

Пример 2. Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200. Решение. Таблица для расчета показателей.

xiКол-во, fixi·fiНакопленная частота, S(x- x )·f(x- x ) 2 ·f(x- x ) 3 ·fЧастота, fi/n0.361.865.775.55-5.340.030.594.5156.865.23-3.980.0450.72618.24114.618.21-4.620.130.92522.5669.053.28-1.190.131.13033964.860.79-0.130.151.32633.81220.990.03750.001430.131.52131.514351.190.280.111.72440.816710.514.62.020.121.9203818712.768.145.190.12.1816.81956.75.624.710.042.3511.52005.195.395.590.025 200252.4 82.348.032.541

Показатели центра распределения.Средняя взвешенная

Показатели вариации.Абсолютные показатели вариации.Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.R = Xmax - XminR = 2.3 - 0.3 = 2Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии.

Среднее квадратическое отклонение.

Каждое значение ряда отличается от среднего значения 1.26 не более, чем на 0.49Оценка среднеквадратического отклонения.

Проверка гипотез о виде распределения.1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.

📎📎📎📎📎📎📎📎📎📎