prosdo.ru
добавить свой файл
1 2 ... 5 6
Общие сведения.


Дисперсионный анализ (далее – ДА) был разработан английским биологом и математиком Рональдом Фишером (1890-1962 г). ДА– это статистический метод изучения влияния отдельных контролируемых факторов на изменчивость изучаемого признака. Необходимость в применении ДА возникает тогда, когда производится серия измерений какой-либо одной переменной в разных условиях, причем число условий должно быть больше двух (в противном случае данную задачу можно решить иными методами). Например, это могут быть несколько экспериментальных групп, различающихся по каким-либо признакам – возрасту, уровню образования, социальному положению, инновациям, производительности, участвующих в качестве испытуемых в одних и тех же условиях эксперимента. Вместе с тем, это может быть одна и та же экспериментальная группа (связанная выборка), принимающая участие в эксперименте в разных экспериментальных условиях, например, простых, усложненных и очень сложных. Наконец, это могут быть несколько экспериментальных групп, принимающих участие в эксперименте с разными экспериментальными условиями несвязанные, но при этом экспериментатор должен придерживаться гипотезы о том, что интериндивидуальные различия не оказывают влияния на вариативность результатов, которые в свою очередь могут зависеть только от условий эксперимента.

Виды переменных в ДА

Переменные в ДА принято делить на два вида – независимые и зависимые. Независимой переменной (фактором) называется контролируемая экспериментатором переменная. В качестве независимых переменных могут выступать психологические, экономические и другие переменные, такие как уровень развития интеллекта, свойства темперамента или характера, показатели эффективности, качество оборудования, пол испытуемых, возраст, национальность, производительность, принадлежность к какой-либо социальной группе и т.д., т.е. по каким именно различиям между испытуемыми будут сформированы экспериментальные группы. Независимой переменной могут быть действия других людей, которым подвергаются испытуемые или условия проведения эксперимента.


Независимую переменную принято делить на уровни, которые могут различаться как количественно, так и качественно. Уровнями независимой переменной могут быть, например, уровень мотивации испытуемых (высокий, средний, низкий), уровень заработной платы и ее влияние на результативность деятельности и т.д., которые различаются лишь количественно. Уровни независимой переменной представляют собой не только градации какого-либо фактора, но и характеристики, различающиеся, прежде всего, качественно. Например, цвет глаз, виды заболеваний, виды рекламы и т.д. В таком случае их правильнее всего будет называть условиями действия фактора или условиями эксперимента.

Зависимой переменной называется переменная, которая при ее измерении во время эксперимента подвергается влиянию независимой, например, возраст испытуемых может влиять на производительность труда (зависимая переменная), уровень интеллекта на скорость решения творческих задач, социальное положение на ценностные ориентации и т.д.

Виды ДА

ДА принято делить на несколько видов согласно количеству независимых переменных: однофакторный ДА (одна независимая переменная), двухфакторный ДА (две независимых переменных), трехфакторный ДА (три независимых переменных) и мультифакторный Д.А.(более трех независимых переменных). Обычно исследоваия ограничиваются применением только двух первых видов ДА, поскольку уже в трехфакторном ДА вычисления являются довольно громоздкими и часто требуют большого эмпирического материала, но во всех видах ДА независимая переменная только одна.

Ограничения применения Д.А.

ДА можно применять только в том случае, когда переменная измерена в шкале интервалов или отношений, т.е. когда можно вычислить основные параметры распределения (средние и дисперсии). Кроме того, должно быть либо известно, либо доказано, что зависимая переменная распределена по нормальному закону (в противном случае полученные выводы могут оказаться ложными).


Проверка нормальности распределения результативного признака.

Нормальность распределения результативного признака можно проверить тремя способами:


  1. Путем расчета показателей асимметрии и экцесса и сопоставления их с критическими значениями.

  2. С помощью коэффициента вариации.

  3. С помощью критерия .

Перейдем к более детальному изучению каждого из предложенных способов на конкретных примерах.

Пример 1(взят Е. Сидоренко

В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет) измерялась способность к удержанию физического волевого усилия на динамометре. В первый день эксперимента у них, наряду с другими показателями измерялась мышечная сила каждой из рук. На второй день эксперимента им предлагалось выдерживать на динамометре мышечное усилие, равное ½ максимальной мышечной силы данной руки. На третий день эксперимента испытуемым предлагалось проделать то же самое в парном соревновании на глазах у всей группы. Пары соревнующихся были подобраны таким образом, чтобы силы обеих рук у них примерно совпадала. Результаты представлены в таблице 2. Можно ли считать, что фактор соревнования в группе каким-то образом влияет на продолжительность удержания усилия. Подтверждается ли предположение о том, что правая рука более социальна.
Таблица 1. Длительность удержания усилия (сек/10) на динамометре правой и левой руками в разных условиях измерения (n=4).

Код имени испытуемого

Наедине с эксперимент. (А)

В группе (А)


Правая рука

Левая рука

Правая рука

Левая рука

1. Л-в

11

10

15

10

2. С-с

13

11

14

10

3. С-в

12

8

8

5

4. К-в

9

10

7

8


Таблица 2. Вычисление показателей асимметрии и экцесса, коэффициента вариации по показателю длительности попыток решения анаграмм .

N



()

()


()

()

1

2

3

4

11

13

12

9

0,94

2,94

1,94

-1,06

0,884

8,644

3,764

1,124

0,831

25,412

7,301

-1,191

0,781

74,712

14,165

1,262

5

6

7

8

10

11

8

10

-1,06

0,94

-2,06

-0,06

0,004

0,884

4,244

0,004

-0,000

0,831

-8,742

-0,000

0,000

0,781

18,009

0,0000

9

10

11

12

15

14

8

7

4,94

3,94

-2,06

-3,06

24,404

15,524

4,244

9,304

120,554

61,163

-8,742

-28,653

595,336

240,982

18,009

87,677


13

14

15

16

10

10

5

8

-0,06

-0,06

-5,06

-2,06

0,004

0,004

25,604

4,244

-0,000

-0,000

-129,554

-8,742

0,000

0,000

655,544

18,009

Сумма

161




102,944

30,468

1725,467

Для расчетов в таблице 4 сначала необходимо определить среднюю арифметическую по формуле: , где - каждое наблюдаемое значение признака; n – количество наблюдений. В данном случае . Среднее квадратическое отклонение вычисляется по формуле: . В данном случае .

Показатели асимметрии и экцесса с ошибками репрезентативности определяются по следующим формулам:

, ; , .


В данном случае , ;

, .

Заметим, что показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирического распределениях от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз, т.е. ,.

В данном случае . Мы видим, что оба показателя не превышают в три раза свою ошибку репрезентативности, следовательно, распределение данного признака не отличается от нормального. Теперь произведем проверку по формулам Е.И. Пустыльника. Рассчитаем критические значения для показателей А и Е.

,, где n – количество наблюдений

В данном случае: ;



Аэмп=0,106, Аэмп<Акр ; Еэмп=-0,711, Еэмп<Екр. Итак, оба варианта проверки по Н.А. Плохинскому и по Е.И. Пустыльнику подтверждают, что результативный признак нормально распределен.

Второй способ проверки – вычисление коэффициента , следовательно, по нашим данным распределение результативного признака – нормальное.


Третий способ проверки. Покажем на данном примере применение критерия для определения «нормальности» распределения. Разобьем данные на интервалы. Число интервалов вычислим с помощью формулы Стердесса . В нашем случае

Округляем до целого(заметим, всегда в сторону увеличения), . Находим длину интервала . Строим таблицу распределения частот по интервалам.
Таблица 3. Таблица распределения частот по интервалам.



4,95-7,1

7,1-9,25

9,25-11,4

11,4-13,55

13,55-15,7



2

4

6

2

2











Вычислим теоретическую вероятность попадания случайной величины Х, распределенной по нормальному закону, в рассматриваемые интервалы
.

Составляем таблицу распределения эмпирических и теоретических частот по интервалам для применения критерия .

Таблица 4. Таблица распределения эмпирических и теоретических частот по интервалам.



4,95-7,1

7,1-9,25

9,25-11,4

11,4-13,55

13,55-15,7


0,125

0,25

0,375

0,125

0,125



0,098

0,255

0,375

0,215

0,07

Воспользовавшись формулой, , получаем Итак, =0,16. Определяем, где ע (число степеней свободы)==16-5-2=9, =16,919. В силу того, что 0,16<16,919 то по критерию распределение подчиняется нормальному закону.

Структура данных в однофакторном ДА

Обычно структура данных в однофакторном ДА(далее ОДА) может быть представлена в виде таблицы с Y- количеством столбцов (рис 1) и n - количеством наблюдений в каждом столбце (причем их количество может быть разным), где столбцами являются условия эксперимента или уровни независимой переменной (в данном случае их четыре), а зависимая переменная представляет собой результаты измерения признака, где каждое отдельное значение обозначается как .


Таблица 5. Структура данных в ОДА.

Независимая переменная (фактор)

1 уровень

2 уровень

3 уровень

4 уровень







……









……









……







……




Задачи ДА.

Главной задачей в ОДА является определение отношения вариативности (дисперсия), обусловленной действием независимой переменной (фактора) к случайной вариативности, обусловленной влиянием всех неизвестных факторов (так называемый F – отношение или F – критерий). Если это отношение превышает критическое значение, то тогда признается достоверным влияние независимой переменной на зависимую.

В двухфакторном ДА (далее ДДА) экспериментатор решает уже 3 задачи:




следующая страница >>