Главная - Сантехника
Изучение формы распределения признака. Основные характеристики закономерностей распределения. Среднее значение и вариация альтернативного признака Максимальное значение дисперсии альтернативного признака

p + q = 1

Среднее значение альтернативного признака


Дисперсия альтернативного признака:

Максимальное значение дисперсии альтернативного признака 0,25

Правило сложения дисперсий

Выделяют дисперсии:

2) групповую

3) межгрупповую

4) среднюю из групповых

Величина общей дисперсии характеризует вариацию признака под воздействием всех факторов, вызывающих эту вариацию:


где - среднее значение изучаемого признака для i – й группы

– общая средняя для всей совокупности

Номер группы

– количество единиц в i – й группе

Средняя из групповых (или остаточная) дисперсия характеризует случайную вариацию, т. е. ту часть вариации, которая вызвана действием других неучтённых факторов, и не зависящую от фактора, положенного в основании группировки:


где q- доля единиц, не обладающих признаком p- доля единиц, обладающих признаком

где - групповая дисперсия


Общая дисперсия равна сумме межгрупповой и средней из групповых дисперсий:

Эмпирический коэффициент детерминации:

Эмпирический коэффициент детерминации показывает долю межгрупповой дисперсии в общей дисперсии (насколько общая вариация изучаемого признака обусловлена вариацией группировочного (факторного) признака), т.е. показывает, насколько вариация признака в совокупности обусловлена фактором группировки.

Эмпирическое корреляционное отношение:

Эмпирическое корреляционное отношение характеризует степень влияния группировочного признака на результативный показатель и оценивает тесноту связи между изучаемым и группировочным признаками. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Чем ближе η к 1, тем степень влияния больше, чем ближе к 0, тем слабее.

Стоимость 1 кв.м общей площади (у.е.) на рынке жилья по десяти 17-м домам улучшенной планировки составляла:

Таблица 14

При этом известно, что первые пять домов были построены вблизи делового центра, а остальные - на значительном расстоянии от него.

Для расчета общей дисперсии вычислим среднюю стоимость 1 кв.м. общей площади:

Общую дисперсию определим по формуле :

Вычислим среднюю стоимость 1 кв.м. и дисперсию по этому показателю для каждой группы домов, отличающихся месторасположением относительно центра города:

а) для домов, построенных вблизи центра:

б) для домов, построенных далеко от центра:

Вариация стоимости 1 кв.м. общей площади, вызванная изменением местоположения домов, определяется величиной межгрупповой дисперсии :

Вариация стоимости 1 кв.м. общей площади, обусловленная изменением остальных не учитываемых нами показателей, измеряется величиной внутригрупповой дисперсии

Понятие вариации

Средняя дает обобщающую характеристику всей совокупности изучаемого явления.

Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.

Средняя величина является абстрактной, обобщающей характеристикой признака изучаемой совокупности, но она не показывает строение совокупности.

Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от неё.

Если отдельные значения признака близки к средней арифметической, то в этом случае средняя хорошо представляет всю совокупность. И наоборот.

Колеблемость отдельных значений характеризуют показатели вариации.

Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.

Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака в абсолютных и относительных величинах. Абсолютная – R, L, σ, σ 2 .

Показатели вариации

1 совокупность 2 совокупность
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Поэтому в этом случае возникает необходимость определить вариацию признака, т.е. соотношение отдельных значений ряда относительно друг друга.

Показатели вариации

1. Размах вариации, представляет собой разность между максимальным и минимальным значением признака.

R = X max - X min

R 1 = 300-80=220 R 2 =180-145=35

Практика: для однородной совокупности, для контроля качества продукции.

2. Показатели, учитывающие отклонения всех вариантов от средней арифметической.

а) Среднее линейное отклонение

б) Среднее квадратическое отклонение

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.

для не сгруппированных:

;

для сгруппированных:

Практика: с его помощью анализируется:

1. Состав работающих

2. Ритмичность производства

3. Равномерность поставок материалов

Недостаток: этот показатель усложняет расчеты вероятного типа, затрудняет применение методов математической статистики

Среднее квадратическое отклонение (стандартное) – это

для не сгруппированных данных

для сгруппированных данных

Для умеренно асимметричных распределений

Среднее квадратическое отклонение, как и среднее линейное отклонение – это абсолютный показатель, выражается в тех же единицах, что и среднее арифметическое.

Показатели среднего квадратического или среднего линейного отклонений для двух совокупностей оказываются несопоставимыми, если сами признака у этих совокупностей неодинаковы. Несопоставляются эти показатели и для разных признаков одной совокупности. Т.е. когда средние в обеих совокупностях выражены в одних и тех же единицах измерения и одинаковы, сопоставление возможно и отразит различия в вариации признака.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.

3. Дисперсия используется для измерения колеблемости признака. Этот показатель более объективно отражает меру вариации

для не сгруппированных

для сгруппированных

Отличительной особенностью данного показатели является то, что при возведении в квадрат удельный вес малых отклонений падает, а больших увеличивается в общей сумме отклонений.

Это тоже абсолютный показатель

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:

1. Дисперсия постоянной величины равна 0

2. Если все варианты значений признака (x) ↓ на одно и то же число, то дисперсия не уменьшается

3. Если все варианты ↓ в одно и то же число раз (K раз), то дисперсия ↓ в К 2 раз

x f x "

x в 100 раз

Дисперсия σ равна 0,909*10000=9090

Выше был рассмотрен расчет показателей вариации для количественных признаков, но может ставиться задача оценки вариации качественных признаков . Например, при изучении качества изготовленной продукции можно разделить на годную и бракованную.

В таком случае речь идет об альтернативных признаках.

Дисперсия альтернативного признака

Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. х 1 =1, х 2 =0. Долю единиц, обладающих признаком (в общей совокупности) обозначаем через р, а долю единиц, не обладающих – через q. Т.е. p+q=1, q=1-p.

Рассчитаем среднее значение альтернативного признака

; ;

Т.е. среднее значение альтернативного признака равно доли единиц, обладающих данными признаками, на долю единиц, не обладающих данными признаками.

Среднее квадратическое отклонение равно Б p =

Проверяется качество: 1000 готовых изделий, 20 бракованных.

Находим долю брака: (20/1000)*100%=0,02%

Дисперсия обладает рядом свойств , которые позволяют упростить расчет.

1. Если из всех значений вариант отнять какое-то постоянное число А, то среднее квадратическое отклонение от этого не изменится.

σ p 2 =

Подставив в формулу дисперсии q = 1 - р , получим

σ p 2 =

Таким образом, σ p 2 = pq - дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, на долю единиц, не обладающих данным признаком.

Среднее квадратическое отклонение (σ ) равно корню квадратному из дисперсии. Простое среднее квадратическое отклонение:

σ =

взвешенное

σ =

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Среднее квадратическое отклонение альтернативного признака

σ p =

В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления такого рода сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с различной средней арифметической используют относительные показатели вариации

Относительные показатели вариации определяются как отношение абсолютных показателей вариации к средней арифметической.

Это коэффициент осцилляции, определяемый как отношение размаха вариации к средней арифметической величине в процентах
.

Линейный коэффициент вариации определяется аналогично, но по среднему линейному отклонению
.

Наиболее распространенными из них являются коэффициент вариации.

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Относительные показатели вариации характеризуют степень колеблемости признака внутри средней величины. По величине, например, коэффициента вариации можно определить степень однородности изучаемой совокупности. Совокупность считается достаточно однородной, если коэффициент вариации не превышает 33%. Для оценки качества, устойчивости средней величины установлены пределы. Самыми лучшими значениями коэффициента вариации являются
; допустимыми считаются значения до 50%.

6.3. Свойства дисперсии и упрощенные методы ее расчета.

Техника вычисления дисперсии по формулам достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой. Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике):

Первое свойство - если все значения признака уменьшить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;

σ 2 (х-А) х 2

Второе свойство- если все значения признака уменьшить в одно и то же число i раз, то дисперсия соответственно уменьшится в i 2 раз.

σ 2 (х/ i ) = σ x 2 : i 2

Третье свойство (свойство минимальности) - средний квадрат отклонений

от любой величины А (отличной от средней арифметической) больше

дисперсии признака на квадрат разности между средней арифметической и величиной А

σ A 2 = σ x 2 +(x - A ) 2

Используя свойства дисперсии, получим следующую упрощенную формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:

σ 2 =∙ (

- момент второго порядка

- квадрат момента первого порядка

На основании последнего свойства дисперсии упрщенная формула дисперсии для любого ряда (дискретного, интервального с равным и неравным интервалами) формула дисперсии примет вид:

6.4. Виды дисперсий.

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Общая дисперсия σ 2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней и может быть вычислена какпростая дисперсия или взвешенная дисперсия .

Межгрупповая дисперсия δ 2 характеризует систематическую вариацию результативного порядка, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних
, от общей средней

и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:

Межгрупповая дисперсия отражает вариацию признака, положенного в основу группировки.

Внутригрупповая (частная) дисперсия (в каждой группе ) σ i 2 , отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы , (групповой средней) и может быть исчислена какпростая дисперсия или как взвешенная дисперсия по формулам, соответственно:

На основании внутригрупповых дисперсий по каждой группе, т.е. на основании σ i 2 можно определить среднюю из внутригрупповых дисперсий :

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью - неизвестную, а также судить о силе влияния группировочного признака.

Долю вариации группировочного признака в совокупности характеризует эмпирический коэффициент детерминации
.

Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.

Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.

Абсолютные показатели вариации включают:

Размах вариации (R)

Размах вариации — это разность между максимальным и минимальным значениями признака

Он показывает пределы, в которых изменяется величина признака в изучаемой .

Пример . Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.
Решение: размах вариации = 9 — 2 = 7 лет.

Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

Среднее линейное и квадратическое отклонение

Среднее линейное отклонение — это из абсолютных отклонений отдельных значений признака от средней.

Среднее линейное отклонение простое:

Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

В нашем примере: лет;

Ответ: 2,4 года.

Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

Среднее квадратическое отклонение

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). () равно квадратному корню из среднего квадрата отклонений отдельных значений признака от :

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Дисперсия

Дисперсия - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.

Дисперсия простая:

В нашем примере:

Дисперсия взвешенная:

Более удобно вычислять дисперсию по формуле:

которая получается из основной путем несложных преобразований. В этом случае средний квадрат отклонений равен средней из квадратов значений признака минус квадрат средней.

Для несгрупиированных данных:

Для сгруппированных данных:

Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие — нулем (0). Долю единиц, обладающих изучаемым признаком, обозначают буквой , а долю единиц, не обладающих этим признаком — через . Учитывая, что p + q = 1 (отсюда q = 1 — p), а среднее значение альтернативного признака равно

,

средний квадрат отклонений

Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством (), на долю единиц, данным свойством не обладающих ().

Максимальное значение средний квадрат отклонения (дисперсия) принимает в случае равенства долей, т.е. когда т.е. . Нижняя граница этого показателя равна нулю, что соответствует ситуации, при которой в совокупности отсутствует вариация. Среднее квадратическое отклонение альтернативного признака:

Так, если в изготовленной партии 3% изделий оказались нестандартными, то дисперсия доли нестандартных изделий , а среднее квадратическое отклонение или 17,1%.

Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической.

Относительные показатели вариации

Относительные показатели вариации включают:

Сравнение вариации нескольких совокупностей по одному и тому же признаку, а тем более по различным признакам с помощью абсолютных показателей не представляется возможным. В этих случаях для сравнительной оценки степени различия строят относительные показатели вариации. Они вычисляются как отношения абсолютных показателей вариации к средней:

Рассчитываются и другие относительные характеристики. Например, для оценки вариации в случае асимметрического распределения вычисляют отношение среднего линейного отклонения к медиан

так как благодаря свойству медианы сумма абсолютных отклонений признака от ее величины всегда меньше, чем от любой другой.

В качестве относительной меры рассеивания, оценивающей вариацию центральной части совокупности, вычисляют относительное квартильное отклонение , где — средний квартиль полусуммы разности третьего (или верхнего) квартиля () и первого (или нижнего) квартиля ().

На практике чаще всего вычисляют коэффициент вариации. Нижней границей этого показателя является нуль, верхнего предела он не имеет, однако известно, что с увеличением вариации признака увеличивается и его значение. Коэффициент вариации является в известном смысле критерием однородности совокупности (в случае нормального распределения).

Рассчитаем коэффициент вариации на основе среднего квадратического отклонения для следующего примера. Расход сырья на единицу продукции составил (кг): по одной технологии при , а по другой — при. Непосредственное сравнение величины средних квадратических отклонений могло бы привести к неверному представлению о том, что вариация расхода сырья по первой технологии интенсивнее, чем по второй (. Относительная мера вариации ( позволяет сделать противоположный вывод

Пример расчета показателей вариации

На этапе отбора кандидатов для участия в осуществлении сложного проекта фирма объявлила конкурс профессионалов. Распределение претендентов по опыту работы показало средующие результаты:

Вычислим средний производственный опыт работы, лет

Рассчитаем дисперсию по продолжительности опыта работы

Такой же результат получается, если использовать для расчета другую формулу расчета дисперсии

Вычислим среднее квадратическое отклонение, лет:

Определим коэффициент вариации, %:

Правило сложения дисперсий

Для оценки влияния факторов, определяющих вариацию, используют прием группировки: совокупность разбивают на группы, выбрав в качестве группировочного признака один из определяющих факторов. Тогда наряду с общей дисперсией, рассчитанной по всей совокупности, вычисляют внутигрупповую дисперсию (или среднюю из групповых) и межгрупповую дисперсию (или дисперсию групповых средних).

Общая дисперсия характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий.

Межгрупповая дисперсия измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:

Внутригрупповая дисперсия оценивает вариацию признака, сложившуюся по влиянием других, неучитываемых в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий.

Все три дисперсии () связаны между собой следующим равенством, которое известно как правило сложения дисперсий:

на этом соотношении строятся показатели, оценивающие влияние признака группировки на образование общей вариации. К ним относятся эмпирический коэффициент детерминации () и эмпирическое корреляционное отношение ()

() характеризует долю межгрупоовой дисперсии в общей дисперсии:

и показывает насколько вариация признака в совокупности обусловлена фактором группировки.

Эмпирическое корреляционное отношение (!!\eta = \sqrt{ \frac{\delta^2}{\sigma^2} }

оценивает тесноту связи между изучаемым и группировочным признаками. Предельными значениями являются нуль и единица. Чем ближе к единице, тем теснее связь.

Пример. Стоимость 1 кв.м общей площади (усл.ед) на рынке жилья по десяти 17-м домам улучшенной планировки составляла:

При этом известно, что первые пять домов были построены вблизи делового центра, а остальные — на значительном расстоянии от него.

Для рассчета общей дисперсии вычислим среднюю стоимость 1 кв.м. общей площади: Общую дисперсию определим по формуле:

Вычислим среднюю стоимость 1 кв.м. и дисперсию по этому показателю для каждой группы домов, отличающихся месторасположением относительно центра города:

а) для домов, построенных вблизи центра:

б) для домов, построенных далеко от центра:

Вариация стоимости 1 кв.м. общей площади, вызванная изменением местоположения домов, определяется величиной межгрупповой дисперсии :

Вариация стоимости 1 кв.м. общей площади, обусловленная изменением остальных неучитываемых нами показателей, измеряется величиной внутригрупповой дисперсии

Найденные дисперссии в сумме дают величину общей дисперсии

Эмпирический коэффициент детерминации :

показывает, что дисперсия стоимости 1.кв.м. общей площади на рынке жилья на 81,8% объясняется различиями в расположении новостроек по отношению к деловому центру и на 18,2% — другими факторами.

Эмприческое корреляционное отношение свидетельствует о существенном влиянии на стоимость жилья месторасположения домов.

Правило сложения дисперсий для доли признака записывается так:

а три вида дисперсий доли для сгруппированных данных определяется по следующим формулам:

общая дисперсия:

Формулы межгрупповой и внутригрупповой дисперсий:

Характеристики формы распределения

Для получения представления о форме распределения используются показатели среднего уровня ( , ), показатели вариации, ассиметрии и эксцесса.

В симметричных распределениях средняя арифметическая, мода и медиана совпадают (. Если это равенство нарушается — распределение ассиметрично.

Простейшим показателем ассиметрии является разность , которая в случае правосторонней ассиметрии положительна, а при левосторонней — отрицательна.

Ассиметричное распределение

Для сравнения ассиметрии нескольких рядов вычисляется относительный показатель

В качестве обобщающих характеристик вариации используются центральные моменты распределения -го порядка , соответствующие степени, в которую возводятся отклонения отдельных значений признака от средней арифметической:

Для несгруппированных данных:

Для сгруппированных данных:

Момент первого порядка согласно свойству средней арифметической равен нулю .

Момент второго порядка является дисперсией .

Моменты третьего и четвертого порядков используются для построения показателей, оценивающих особенности формы эмпирических распределений.

С помощью момента третьего порядка измеряют степень скошенности или ассиметричности распределения.

— коэффициент ассиметрии

В симметричных распределениях , как все центральные моменты нечетного порядка.Неравенство нулю центрального момента третьего порядка указывает на асимметричность распределения. При этом, если , то асимметрия правосторонняя и относительно максимальной ординаты вытянута правая ветвь; если , то асимметрия левосторонняя (на графике это соответствует вытянутости левой ветви).

Для характеристики островершинности или плосковершинности распределения вычисляют отношение момента четвертого порядка () к среднеквадратическому отклонению в четвертой степени (). Для нормального распределения , поэтому эксцесс находят по формуле:

Для нормального распределения обращается в нуль. Для островершинных распределений , для плосковершинных .

Эксцесс распределения

Кроме показателей, рассмотренных выше, обобщающей характеристикой вариации в однородной совокупности служит определенный порядок в изменении частот распределения в соответствии с изменениями величины изучаемого признака, называемый закономерностью распределения .

Характер (тип) закономерности распределения может быть выявлен путем построения вариационного ряда на основании большого объема наблюдений, а также такого выбора числа групп и величины интегралов, при котором наиболее отчетливо могла бы проявиться закономерность.

Анализ вариационных рядов предполагает выявление характера распределения (как результата действия механизма вариации), установление функции распределения, проверку соответствия эмпирического распределения теоретическому.

Эмпирическое распределение , полученное на основе данных наблюдения, графически изображается эмпирической кривой распределения с помощью полигона.

На практике встречаются различные типы распределений, среди которых можно выделить симметричные и асимметричные, одновершинные и многовершинные.

Установить тип распределения, означает выразить механизм формирования закономерности в аналитической форме. Многим явлениям и их признакам свойственны характерные формы распределения, которые аппроксимируются соответствующими кривыми. При всем многообразии форм распределения наибольшее распространение в качестве теоретических получили нормальное распределение, распределение Пауссона, биноминальное распределение и др.

Особое место в изучении вариации принадлежит нормальному закону, благодаря его математическим свойствам. Для нормального закона выполняется правило трех сигм, по которому вариация индивидуальных значений признака находится в пределах от величины средней. При этом в границах находится около 70% всех единиц, а в пределах — 95%.

Оценка соответствия эмпирического и теоретического распределений производится с помощью критериев согласия, среди которых широко известны критерии Пирсона, Романовского, Ястремского, Колмогорова.

Дисперсия альтернативного признака

Частный случай атрибутивного (неколичественного) признака - признак альтернативный. Когда единицы совокупности либо имеют данный изучаемый признак, либо не имеют его. Примером таких признаков является: наличие бракованной продукции, ученая степень у преподавателей вуза, работа по полученной специальности, превышение среднедушевых денежных доходов их общероссийского уровня, наличие детей в семье и т.д.

В случае наличия альтернативного признака единице совокупности присваивается значение «1». В случае отсутствия - «0».

Весами в расчетах служат:

Доля единиц обладающих данным признаком;

Доля единиц, не обладающих данным признаком

Тогда средняя величина альтернативного признака равна:

дисперсия примет вид:

Дисперсия альтернативного признака изменяется в пределах от 0 до 0,25. Максимального значения 0,25 достигает при 0,5

Пример 4.11. При выборочном опросе 300 жителей Курска 60 из них высказались положительно по поводу хранения личных денежных сбережений в коммерческих банках города

Определить средний уровень, дисперсию и среднее квадратическое отклонение признака

Практическое применение вариации альтернативного признака в основном состоит в построении доверительных интервалов при проведении выборочного наблюдения.

Изучение формы распределения признака. Основные характеристики закономерностей распределения

Непременным условием успешности построений, исчислений и выводов на основе вариационных рядов является однородность обобщаемых в них совокупностей, устанавливаемая на базе глубокого теоретического анализа.

Четко выраженный порядок изменения частот в соответствии с изменением величины признака называют закономерностью распределения.

Знание типа закономерности распределения, (а следовательно, и формы кривой) необходимо прежде всего:

1. Для выяснения типичности условий получения первичного статистического материала. Так, появление многовершинной или существенно асимметричной кривой говорит о разнотипном составе совокупности и о необходимости перегруппировки данных с целью выявления более однородных групп.

2. Для обеспечения правильности выполнения практических расчетов и прогнозов. Так, применение формулы Г. Стерджесса для расчета оптимального числа групп интервального ряда, правила «трех сигм», коэффициента вариации Vу в качестве индикатора однородности совокупности, метода наименьших квадратов при моделировании корреляционной связи явлений, методов дисперсионного анализа и других правомочно лишь в условиях нормального и близких к нему распределений.

Закономерности вариационных рядов, выражающие в типе распределения их частот, наглядно выступают на графиках - гистограмме и полигоне распределения частот. Их рассмотрение показывает, что в гистограмме наблюдается большая скачкообразность распределения, а в полигоне обнаруживается постепенность перехода от одной группы к другой. Ломаная линия полигона частично сглаживает скачкообразность гистограммы, является более обобщенным приемом анализа распределения.

При увеличении строк интервального вариационного ряда и соответственном уменьшении величины его интервалов число сторон полигона распределения будет расти и ломаной линии будет присуща тенденция превратиться в пределе в некую кривую. Такая кривая называется кривой распределения . В ней происходит наибольшее освобождение данных от влияния случайных факторов. Она выявляет и показывает в максимально обобщенном виде характер вариации, закономерность распределения частот внутри однокачественной совокупности явлений.

Кривые распределения могут быть разных типов. В практике социально-экономических исследований широко применяется кривая нормального распределения. Она представляет собой одновершинную симметричную колоколообразную фигуру, правая и левая ветви которой равномерно и симметрично убывают, асимптотически приближаясь к оси абсцисс.

Отличительной особенностью этой кривой является совпадение в ней средней арифметической, моды и медианы. Если всю площадь между кривой и осью абсцисс принять за 100%, то в пределах заключено 68,3% частот, в пределах - 95,4%, в пределах 99,7% («правило трех сигм»).

Хотя нормальное, или симметричное, распределение соответствует природе ряда явлений, однако для общественных явлений оно нехарактерно, так как в нем отражаются различия, вызванные внешними воздействиями, присущие не развивающейся, а лишь колеблющейся совокупности единиц. Для социальных явлений характерно развитие, динамизм. Поэтому ряды и кривые распределения частот общественных явлений, как правило, асимметричны, в них частоты возрастают до максимума и убывают от него неравномерно. Именно наличие асимметрии, или скошенности, в рядах однородных совокупностей служит косвенным указанием на то, что исследуемый процесс проходит активную стадию развития.

Асимметричные ряды и соответствующие кривые имеют различные формы распределений, исследованные математической статистикой. Такими формами являются распределение Пуассона, распределение Максвелла, распределение Пирсона и др. Здесь асимметричность рассматривается в целом как единый тип распределения. При этом различают правостороннюю и левостороннюю асимметрии (скошенность).

Если длинная ветвь кривой расположена правее вершины, то асимметрия называется правосторонней, если эта ветвь расположена левее вершины - левосторонней. При правосторонней асимметрии при левосторонней. Поэтому разность между ними, отнесенную к, называют коэффициентом К. Пирсона и используют в качестве коэффициента асимметрии:

При правосторонней асимметрии этот коэффициент положителен, при левосторонней - отрицателен. Если = 0, вариационный ряд симметричен. Чем больше абсолютная величина коэффициента, тем больше степень скошенности.

Наиболее точным показателем асимметрии распределения является коэффициент асимметрии, вычисляемый по формуле

где n - число единиц совокупности. Как и в случае коэффициента Пирсона, при > 0 имеет место правосторонняя асимметрия, при < 0 левосторонняя. В симметричных распределениях = 0.

Чем больше величина ||, тем более асимметрично распределение. Установлена следующая оценочная шкала асимметричности:

|| - асимметрия незначительная;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - асимметрия существенная.

Поскольку коэффициенты и являются относительными безразмерными величинами, они часто применяются для сравнительного анализа асимметричности различных рядов распределения.

Характер асимметрии иногда указывает на направление развития. При исследовании вариации признаков, в отношении которых имеется заинтересованность в их увеличении (выполнение норм, выпуск продукции и т.д.), правосторонняя асимметрия свидетельствует о прогрессивности развития, о том, что оно идет в сторону увеличения показателя, а левосторонняя асимметрия указывает на наличие большого числа отстающих участков.

При исследовании вариации признаков, в отношении которых имеется заинтересованность в их уменьшении (себестоимость, трудоемкость, расход сырья на единицу продукции и т.п.), правосторонняя асимметрия свидетельствует о недостатках в развитии изучаемого процесса, левосторонняя - о прогрессивности его развития, о том, что последнее идет в сторону уменьшения показателя. В распределении работников по стажу (см. пример 4.9 = 5,75) наблюдается правосторонняя асимметрия, так как коэффициент асимметрии положителен: (5,955-5,75):2,47=0,095. Такая асимметрия для данного ряда прогрессивна, она свидетельствует о развитии ряда в сторону увеличения исследуемого показателя.

Форму распределения можно ориентировочно определить непосредственно рассмотрением эмпирических данных ряда, особенно если они изображены гистограммой и полигоном. Чтобы убедиться в правильности ориентировочного определения формы распределения, эмпирические данные ряда исследуются на их близость к теоретическому распределению, устанавливаемому с помощью построения соответствующей кривой распределения. Однако во многих случаях ни теория, ни непосредственное рассмотрение эмпирических данных не дают ответов на вопрос о форме распределения. Тогда обычно ведется исследование на близость эмпирических данных к нормальному распределению, так как распределения с небольшой или умеренной асимметричностью в большинстве случаев по своему типу относятся к нормальным.

Для объективного суждения о степени соответствия эмпирического распределения нормальному в статистике используется ряд критериев, называемых критериями согласия или соответствия.

К ним относятся критерии Пирсона, Романовского, Ястремского, Колмогорова, основанные на использовании различных теоретических представлений.

Например, наиболее используемый критерий согласия Пирсона («хи-квадрат») определяется по формуле:

где - эмпирические частоты (частости)

Теоретические частоты (частости)

Для оценки близости эмпирического распределения к теоретическому определяется вероятность достижения этим критерием данной величины. Если эта вероятность превышает 0,05, то отклонения фактических частот от теоретических считаются случайными, несущественными. Если же, то отклонения считаются существенными, а эмпирическое распределение - принципиально отличным от теоретического.

Для характеристики степени отклонения симметричного распределения от нормального рассчитывается показатель эксцесса. Он приближенно может быть определен с помощью коэффициента Линдберга.

где - доля (в%) количества вариант, лежащих в интервале равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней) в общем количестве вариант данного ряда;

38,29 - доля (в %) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней) в общем количестве вариант ряда нормального распределения

Эксцесс может быть положительным, отрицательным и равным нулю.

У высоковершинных кривых показатель эксцесса имеет положительный знак, у низковершинных кривых - отрицательный знак. Для кривой нормального распределения его величина равна нулю.

Для более точной характеристики степени отклонения симметричного распределения от нормального рассчитывается показатель островершинности (показатель эксцесса) (Ek) по формуле:

Он, как и коэффициент Линдберга, может быть положительным, отрицательным и равным нулю. Показатель эксцесса, как и показатель асимметрии, - число отвлеченное. Предельным значением отрицательного эксцесса является значение Ek= -2; величина же положительного эксцесса является величиной бесконечной.

Определение показателей асимметрии и эксцесса имеет не только описательное значение, часто их величины дают определенные указания для дальнейшего исследования изучаемых явлений. Так, например, появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности.

Современные компьютерные технологии открывают широкие возможности для выполнения громоздких вычислительных операций по анализу вариационных рядов. Если материал теоретически осмыслен и выдвинута разумная гипотеза о форме распределения (последнее, кстати, ЭВМ тоже в состоянии проверить), вычислительные устройства могут быстро исчислить различные обобщающие показатели и критерии, построить графики и т.д. Это тем более возможно, так как показатели вариации сравнительно несложны и хорошо формализованы.

 


Читайте:



Завершился вывод войск ссср из афганистана

Завершился вывод войск ссср из афганистана

В 1987 году в Афганистане начала осуществляться политика национального примирения, принятая и одобренная на Пленуме ЦК НДПА в декабре 1986 года....

Новое направление: инноватика Сложно ли учиться на инноватике

Новое направление: инноватика Сложно ли учиться на инноватике

Предоставляют массу возможностей для выбора профессионального направления. Многие из предметов и направлений обозначены достаточно непонятными...

К чему снится племянница

К чему снится племянница

Учеными было установлено, что чаще всего, людям снится о любимых родственниках сон. Племянник, привидевшийся во время ночного отдыха, может...

Репейник: толкование сновидения

Репейник: толкование сновидения

Сонник репейник толкует как символ стремления к особой защищенности от возможных неприятностей. Сон, в котором вы видели одиноко стоящий куст,...

feed-image RSS