Jednoczynnikowa analiza wariancji
Pojęcie ogólne i kryjące pod sobą cały zestaw analiz, procedur i zróżnicowanych modeli badawczych. Analiza wariancji jest jednak często wykorzystywaną metodą porównania trzech i więcej grup/pomiarów. Dlaczego lepsza jest niż seria testów T Studenta? Porównanie trzech grup można przecież wykonać porównując każdą z każdą w parach? Można, ale co w sytuacji kiedy grup będzie więcej? Dla 4 grup to już konieczność wykonania 6 porównań, a dla 7 grup analiz potrzebujemy aż 21. Każdy pomiar to wzrost przedziału prawdopodobieństwa odrzucania hipotezy zerowej, co w efekcie zwiększa znacząco błąd I rodzaju.
Dlatego już na początku XX wieku sir Ronald Fischer opracował metodę analizy wariancji, która eliminuje powyższe problemy. Analiza wariancji w znaczącym uproszeniu to stosunek zróżnicowania międzygrupowego i wewnątrzgrupowego. Opisanie modeli wieloczynnikowej czy nawet dwuczynnikowej analizy wariancji przekracza objętość tego opracowania.
W tym miejscu przyjrzymy się dokładniej jednoczynnikowym analizom wariancji w schematach międzygrupowym i wewnątrzgrupowym
Schemat międzygrupowy | Zmienna niezależna jakościowa posiadające 3 lub więcej wartości | Jednoczynnikowa analiza wariancji w schemacie międzygrupowym |
Schemat wewnątrzgrupowy | Zmienną niezależna są tutaj warunki kolejnych 3 lub więcej pomiarów |
Jednoczynnikowa analiza wariancji w schemacie międzygrupowym
Najprostszym przykładem tego rodzaju analizy jest ocena 3 grup w poziomie zmiennej zależnej.
Założenia
Jak każde narzędzie parametryczne posiada określone założenia, jakie trzeba spełnić by w pełni zaufać wynikom analizy i unikać błędów w interpretacji.
Test | Założenie | Sposób testowania założenia |
Jednoczynnikowa analiza wariancji w schemacie międzygrupowym | 1. Pomiar ilościowy zmiennej zależnej | — |
2. Zmienna niezależna minimum 2 wartości (2 grupy niezależne) | — | |
3. Normalność rozkładu w grupach | ||
4. Jednorodność wariancji | ||
5. Równoliczność osób w grupach |
Spełnienie wymagań analizy wariancji pozwala na jej wykonanie. Dokładnie wskazane testowania założeń może czytelnik znaleźć tutaj.
Co jeśli nie uda się spełnić założeń analizy wariancji. W takiej sytuacji sięgnąć warto po nieparemetryczny odpowiednik analizy wariancji czyli test H Kruskala-Wallisa. Jeżeli złamane zostało założenie jednorodności wariancji możemy wynik ANOVY odczytać dla testu Welch lub Brown-Forsythe. Wyniki te opatrzone są korektą dla takich danych.
Interpretacja
Analiza wariancji jest kilku etapowa by w pełni odpowiedzieć na pytania badawcze. Pierwszy z nich to testowanie założeń opisany wyżej. Kolejnym krokiem jest ocena wyniku testu analizy wariancji. W przykładowym raporcie zapiszemy, że: „Analiza z wykorzystaniem jednoczynnikowej analizy wariancji w schemacie międzygrupowym wykazała, że istnieją różnice w poziomie samooceny między nauczycielami kontraktowymi, mianowanymi i dyplomowanymi, F(2, 148) = 14,567; p < 0,05, η2 = 0,14”.
Z wyniku analizy wariancji wiemy tylko, że między 3 grupami są różnice. To ważna wiadomość, ale bez dalszych porównać, to wiadomość niepełna. W trzecim etapie musimy wykonać analizę post hoc lub zdefiniować kontrasty (omówione niżej).
| Analiza post hoc | Kontrasty |
Wynik testu F | Wynik ANOVY musi być istotny. | Wynik ANOVY nie musi być istotny |
Stosowanie | Dla hipotez niekierunkowych. Są różnice ale nie wiemy, która grupa ma wyższy wynik. | Dla hipotez kierunkowych. Potrafimy wskazać, która grupa w porównaniu z którą osiągnie wyższy wynik. |
Ograniczenia | Wiele testów do wyboru drogi wnioskowania. | Możemy wykonać k-1 analiz kontrastu, gdzie k = liczba grup. |
Decyzja o wyborze dalszej drogi wiąże się z pewnymi ograniczeniami dla wyników. Liczba kontrastów jest ograniczona, ale można ją stosować przy nieistotnym wyniku F. Analiza post hoc jest bardziej kompleksowa, ale mnogość testów jakie można wybrać czasami generuje błędy. By tego uniknąć poniżej zaprezentowano najpopularniejsze testy post hoc. Test bardziej liberalny może uznać małe różnice za ważne – generując w tym miejscu szansę na błąd I rodzaju. Testy konserwatywne będą potrzebowały znacznej różnicy w pomiarze by uznać dane wyniki za istotne – jest to problem związany z błędem II rodzaju. Dlatego by mieć pewność, warto sięgać po więcej niż jeden test. Wykorzystać liberalny i konserwatywny. Jeżeli ich wyniki będą podobne możemy mieć pewność co do różnic, oraz braku popełnionego błędu.
Test | Podejście | Informacja |
Najmniejszej Istotnej Różnicy (NIR) | Liberalny | Najbardziej liberalny test. Bez poprawki na liczbę porównań. Lepiej stosować kiedy małą liczbę grup. Podobny jest do przeprowadzenia kilku testów t. |
S-N-K | Liberalny | Zawiera poprawkę na porównania wielokrotne. |
Bonferroni | Liberalny | Bardziej konserwatywny niże powyższe. Zawiera poprawkę na liczbę porównań. Najlepszy do małej liczby porównań. Najczęściej wykorzystywany. |
Tukey | Konserwatywny | Stosowany przy dużej liczby porównań. Jego odmiana stosowana jest także przy nierównolicznych grupach. |
Scheffe | Konserwatywny | Bardzo konserwatywny test. Generuje ryzyko błędu II rodzaju. |
Gabriel | Konserwatywny | Pomocny kiedy rozkład zmiennych jest zaburzony oraz kiedy mamy nierównoliczne grupy |
Games-Harell | Konserwatywny | Stosowany w przypadku nie spełnienia założenia jednorodności wariancji. Dla małych i nierównolicznych grup. |
T2 Tamhane’a | Konserwatywny | Stosowany w przypadku nie spełnienia założenia jednorodności wariancji. Bardzo konserwatywny. |
Najczęściej wybieranym jest test Bonferroniego. Zaleca się jednak dla uzyskania maksymalnej pewności zestawić wyniki testu liberalnego i konserwatywnego. Dobrym wyjściem jest pokazanie wyników testu Bonferroniego i Scheffe’a.
Jednoczynnikowa analiza wariancji z powtarzanym pomiarem
Podobieństwo do testu T Studenta dla danych zależnych jest tutaj oczywiście. Ale tak samo jak dla modeli międzygrupowych nie można w takie prosty sposób wykonać kilka testów T.
W sytuacji, kiedy mamy 3 lub więcej pomiarów wykorzystać warto analizę wariancji z powtarzanym pomiarem.
Założenia
Przed interpretacją wyniku samej analizy trzeba zastanowić się czy dane spełniają wymagane założenia.
Test | Założenie | Sposób testowania założenia |
Jednoczynnikowa analiza wariancji w schemacie wewnątrzgrupowym | 1. Pomiar ilościowy zmiennej zależnej | — |
2. Sferyczność danych | ||
3. Taka sama skala pomiaru dla obu zmiennych | — |
Ważniejsze niż rozkład zmiennych, niż rozkład każdego pomiaru, jest tutaj sferyczność danych. Sferyczność oznacza, że zróżnicowanie różnic między pomiarami jest podobne. By ocenić sferyczność danych wykonuje się test W Mauchly’ego
W Mauchly’ego | Wniosek | Interpretacja |
p < 0,05 | Wynik istotny | Istotne zróżnicowanie różnic między pomiarami. Założenie złamane. Brak sferyczności. |
p > 0,05 | Wynik nieistotny | Różnica zróżnicowania między pomiarami nie jest istotna. Założenie spełnione. Dane są sferyczne. |
Spełnienie założeń pozwala na zaufanie do wyniku ANOVY. Co jeśli nie możemy wykorzystać modelu analizy wariancji. Dla wyników jakie mają trudności uzyskaniu sferyczności, a dla konserwatywnego podejścia także dla normalności rozkładów, warto wykorzystać nieparametryczny odpowiednik – jednoczynnikową analizę wariacji Friedmana. Jeżeli złamane zostało założenie sferyczności danych jednoczynnikowa analiza wariancji z powtarzanym pomiarem pozwala na wykorzystanie pewnych poprawek. Poprawka ta nazywa się epsilonem i ingeruje w wynik stopni swobody. Mamy do wyboru 3 możliwe poprawki:
Konserwatywny | ——————————-> | ||
Dolna granica epsilon | Greenhouse’a-Geissera | Huynha-Feldta | |
Najmniej polecany „dolna granica epsilon” – mocno konserwatywny test, nakłada dużą poprawkę. Jeżeli testy G-G oraz H-F są istotne warto zaraportować wynik testu G-G (jest bardziej konserwatywny). Jednak jeżeli istotny jest tylko test H-F, w wynikach opisać można tylko jego wartości. Warto także wspomnieć dla pełnego obrazu modelu, że pozostałe testy/poprawki okazały się nieistotne. Czasami jednak złamane założenia będą zmuszały do wykorzystania nieparametrycznego odpowiednika – jednoczynnikowej analizy wariancji Friedmana.
Interpretacja
Wyniki modelu z powtarzanym pomiarem trzeba oceniać etapowo: 1) założenia, 2) wynik modelu oraz 3) analiza post hoc lub kontrasty. Istotny wynik mówi jedynie o różnicach między pomiarami. Ale którymi? Do tego należy wykorzystać analizę post hoc lub kontrasty. Testy post hoc opisane wyżej także tutaj mają swoje zastosowanie (i ograniczenia) podobnie jak kontrasty.
Model wielozmiennowy
Co jeśli mamy powtarzane pomiary ale w różnych grupach? Jak połączyć model zewnątrzgrupowym z modelem wewnątrzgrupowym? Czy warto liczyć je osobo? MANOVA jest odpowiedzią na te pytania. Wieloczynnikowa analiza wariacji w schemacie mieszanym jest bardzo dobrym narzędziem w ocenie wyników, której podstawowy opis można znaleźć tutaj. Przy wyborze odpowiedniego testu pomocna może być ścieżka wyboru testu.
Masz pytania? Zadzwoń lub napisz!
Może zainteresuje Cię także:
Arkadiusz Prajzner
Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.
METODOLOGIA
STATYSTYKA
SŁOWNIK
DODATKOWE