Skip to content

Jednoczynnikowa analiza wariancji

Pojęcie ogólne i kryjące pod sobą cały zestaw analiz, procedur i zróżnicowanych modeli badawczych. Analiza wariancji jest jednak często wykorzystywaną metodą porównania trzech i więcej grup/pomiarów. Dlaczego lepsza jest niż seria testów T Studenta? Porównanie trzech grup można przecież wykonać porównując każdą z każdą w parach? Można, ale co w sytuacji kiedy grup będzie więcej? Dla 4 grup to już konieczność wykonania 6 porównań, a dla 7 grup analiz potrzebujemy aż 21. Każdy pomiar to wzrost przedziału prawdopodobieństwa odrzucania hipotezy zerowej, co w efekcie zwiększa znacząco błąd I rodzaju.

Dlatego już na początku XX wieku sir Ronald Fischer opracował metodę analizy wariancji, która eliminuje powyższe problemy. Analiza wariancji w znaczącym uproszeniu to stosunek zróżnicowania międzygrupowego i wewnątrzgrupowego. Opisanie modeli wieloczynnikowej czy nawet dwuczynnikowej analizy wariancji przekracza objętość tego opracowania.

W tym miejscu przyjrzymy się dokładniej jednoczynnikowym analizom wariancji w schematach międzygrupowym i wewnątrzgrupowym

Schemat międzygrupowy

Zmienna niezależna jakościowa posiadające 3 lub więcej wartości

Jednoczynnikowa analiza wariancji w schemacie międzygrupowym

Schemat wewnątrzgrupowy

Zmienną niezależna są tutaj warunki kolejnych 3 lub więcej pomiarów

Jednoczynnikowa analiza wariancji z powtarzanym pomiarem

 

Jednoczynnikowa analiza wariancji w schemacie międzygrupowym

Najprostszym przykładem tego rodzaju analizy jest ocena 3 grup w poziomie zmiennej zależnej.

Założenia

Jak każde narzędzie parametryczne posiada określone założenia, jakie trzeba spełnić by w pełni zaufać wynikom analizy i unikać błędów w interpretacji.

Test

Założenie

Sposób testowania założenia

Jednoczynnikowa analiza wariancji w schemacie międzygrupowym

1. Pomiar ilościowy zmiennej zależnej

2. Zmienna niezależna minimum 2 wartości (2 grupy niezależne)

3. Normalność rozkładu w grupach

Test Shapiro-Wilk lub Kołmogorow-Smirnow

4. Jednorodność wariancji

Test Levene’a

5. Równoliczność osób w grupach

Test niezależności chi-kwadrat

Spełnienie wymagań analizy wariancji pozwala na jej wykonanie. Dokładnie wskazane testowania założeń może czytelnik znaleźć tutaj.

Co jeśli nie uda się spełnić założeń analizy wariancji. W takiej sytuacji sięgnąć warto po nieparemetryczny odpowiednik analizy wariancji czyli test H Kruskala-Wallisa. Jeżeli złamane zostało założenie jednorodności wariancji możemy wynik ANOVY odczytać dla testu Welch lub Brown-Forsythe. Wyniki te opatrzone są korektą dla takich danych.

Interpretacja

Analiza wariancji jest kilku etapowa by w pełni odpowiedzieć na pytania badawcze. Pierwszy z nich to testowanie założeń opisany wyżej. Kolejnym krokiem jest ocena wyniku testu analizy wariancji. W przykładowym raporcie zapiszemy, że: „Analiza z wykorzystaniem jednoczynnikowej analizy wariancji w schemacie międzygrupowym wykazała, że istnieją różnice w poziomie samooceny między nauczycielami kontraktowymi, mianowanymi i dyplomowanymi, F(2, 148) = 14,567; p < 0,05, η2 = 0,14”.

Z wyniku analizy wariancji wiemy tylko, że między 3 grupami są różnice. To ważna wiadomość, ale bez dalszych porównać, to wiadomość niepełna. W trzecim etapie musimy wykonać analizę post hoc lub zdefiniować kontrasty (omówione niżej).

 

Analiza post hoc

Kontrasty

Wynik testu F

Wynik ANOVY musi być istotny.

Wynik ANOVY nie musi być istotny

Stosowanie

Dla hipotez niekierunkowych. Są różnice ale nie wiemy, która grupa ma wyższy wynik.

Dla hipotez kierunkowych. Potrafimy wskazać, która grupa w porównaniu z którą osiągnie wyższy wynik.

Ograniczenia

Wiele testów do wyboru drogi wnioskowania.

Możemy wykonać k-1 analiz kontrastu, gdzie k = liczba grup.

Decyzja o wyborze dalszej drogi wiąże się z pewnymi ograniczeniami dla wyników. Liczba kontrastów jest ograniczona, ale można ją stosować przy nieistotnym wyniku F. Analiza post hoc jest bardziej kompleksowa, ale mnogość testów jakie można wybrać czasami generuje błędy. By tego uniknąć poniżej zaprezentowano najpopularniejsze testy post hoc. Test bardziej liberalny może uznać małe różnice za ważne – generując w tym miejscu szansę na błąd I rodzaju. Testy konserwatywne będą potrzebowały znacznej różnicy w pomiarze by uznać dane wyniki za istotne – jest to problem związany z błędem II rodzaju. Dlatego by mieć pewność, warto sięgać po więcej niż jeden test. Wykorzystać liberalny i konserwatywny. Jeżeli ich wyniki będą podobne możemy mieć pewność co do różnic, oraz braku popełnionego błędu.

Test

Podejście

Informacja

Najmniejszej Istotnej Różnicy (NIR)

Liberalny

Najbardziej liberalny test. Bez poprawki na liczbę porównań. Lepiej stosować kiedy małą liczbę grup. Podobny jest do przeprowadzenia kilku testów t.

S-N-K

Liberalny

Zawiera poprawkę na porównania wielokrotne.

Bonferroni

Liberalny

Bardziej konserwatywny niże powyższe. Zawiera poprawkę na liczbę porównań. Najlepszy do małej liczby porównań. Najczęściej wykorzystywany.

Tukey

Konserwatywny

Stosowany przy dużej liczby porównań. Jego odmiana stosowana jest także przy nierównolicznych grupach.

Scheffe

Konserwatywny

Bardzo konserwatywny test. Generuje ryzyko błędu II rodzaju.

Gabriel

Konserwatywny

Pomocny kiedy rozkład zmiennych jest zaburzony oraz kiedy mamy nierównoliczne grupy

Games-Harell

Konserwatywny

Stosowany w przypadku nie spełnienia założenia jednorodności wariancji. Dla małych i  nierównolicznych grup.

T2 Tamhane’a

Konserwatywny

Stosowany w przypadku nie spełnienia założenia jednorodności wariancji. Bardzo konserwatywny.

Najczęściej wybieranym jest test Bonferroniego. Zaleca się jednak dla uzyskania maksymalnej pewności zestawić wyniki testu liberalnego i konserwatywnego. Dobrym wyjściem jest pokazanie wyników testu Bonferroniego i Scheffe’a.

 

Jednoczynnikowa analiza wariancji z powtarzanym pomiarem

Podobieństwo do testu T Studenta dla danych zależnych jest tutaj oczywiście. Ale tak samo jak dla modeli międzygrupowych nie można w takie prosty sposób wykonać kilka testów T.

W sytuacji, kiedy mamy 3 lub więcej pomiarów wykorzystać warto analizę wariancji z powtarzanym pomiarem.

Założenia

Przed interpretacją wyniku samej analizy trzeba zastanowić się czy dane spełniają wymagane założenia.

Test

Założenie

Sposób testowania założenia

Jednoczynnikowa analiza wariancji w schemacie wewnątrzgrupowym

1. Pomiar ilościowy zmiennej zależnej

2. Sferyczność danych

Test W Mauchly’ego

3. Taka sama skala pomiaru dla obu zmiennych

Ważniejsze niż rozkład zmiennych, niż rozkład każdego pomiaru, jest tutaj sferyczność danych. Sferyczność oznacza, że zróżnicowanie różnic między pomiarami jest podobne. By ocenić sferyczność danych wykonuje się test W Mauchly’ego

W Mauchly’ego

Wniosek

Interpretacja

p < 0,05

Wynik istotny

Istotne zróżnicowanie różnic między pomiarami. Założenie złamane. Brak sferyczności.

p > 0,05

Wynik nieistotny

Różnica zróżnicowania między pomiarami nie jest istotna. Założenie spełnione. Dane są sferyczne.

            Spełnienie założeń pozwala na zaufanie do wyniku ANOVY. Co jeśli nie możemy wykorzystać modelu analizy wariancji. Dla wyników jakie mają trudności uzyskaniu sferyczności, a dla konserwatywnego podejścia także dla normalności rozkładów, warto wykorzystać nieparametryczny odpowiednik – jednoczynnikową analizę wariacji Friedmana. Jeżeli złamane zostało założenie sferyczności danych jednoczynnikowa analiza wariancji z powtarzanym pomiarem pozwala na wykorzystanie pewnych poprawek. Poprawka ta nazywa się epsilonem i ingeruje w wynik stopni swobody. Mamy do wyboru 3 możliwe poprawki:

Konserwatywny

——————————->

Dolna granica epsilon

Greenhouse’a-Geissera

Huynha-Feldta

    

Najmniej polecany „dolna granica epsilon” – mocno konserwatywny test, nakłada dużą poprawkę. Jeżeli testy G-G oraz H-F są istotne warto zaraportować wynik testu G-G (jest bardziej konserwatywny). Jednak jeżeli istotny jest tylko test H-F, w wynikach opisać można tylko jego wartości. Warto także wspomnieć dla pełnego obrazu modelu, że pozostałe testy/poprawki okazały się nieistotne. Czasami jednak złamane założenia będą zmuszały do wykorzystania nieparametrycznego odpowiednika – jednoczynnikowej analizy wariancji Friedmana.

Interpretacja

Wyniki modelu z powtarzanym pomiarem trzeba oceniać etapowo: 1) założenia, 2) wynik modelu oraz 3) analiza post hoc lub kontrasty. Istotny wynik mówi jedynie o różnicach między pomiarami. Ale którymi? Do tego należy wykorzystać analizę post hoc lub kontrasty. Testy post hoc opisane wyżej także tutaj mają swoje zastosowanie (i ograniczenia) podobnie jak kontrasty.

 

Model wielozmiennowy

Co jeśli mamy powtarzane pomiary ale w różnych grupach? Jak połączyć model zewnątrzgrupowym z modelem wewnątrzgrupowym? Czy warto liczyć je osobo? MANOVA jest odpowiedzią na te pytania. Wieloczynnikowa analiza wariacji w schemacie mieszanym jest bardzo dobrym narzędziem w ocenie wyników, której podstawowy opis można znaleźć tutaj. Przy wyborze odpowiedniego testu pomocna może być ścieżka wyboru testu.

Masz pytania? Zadzwoń lub napisz!

Może zainteresuje Cię także:

Arkadiusz Prajzner

Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.