Skip to content

Testowanie założeń testów statystycznych

Wiele z testów obarczone jest założeniami jakie trzeba spełnić by w pełni zaufać wynikom. Jeżeli dane nie spełniają wymagań czasami nie warto upierać się przy parametrycznym poziomie testowania. Złe dopasowanie do danych daje nam nietrafne interpretacje i prowadzić może do błędnych wniosków. Niżej zebrano podstawowe założenia jakimi obarczone mogę być testy statystyczne, które należy sprawdzić analizą danych. Przyjrzymy się równoliczności grup, rozkładzie normalnemu, jednorodności wariancji oraz sferyczności danych.

 

Równoliczność osób badanych w grupach

Niezależnie od tego ile mamy grup badanych, liczba osób w tychże grupach powinna być podobna. Nie jest problemem ocena kiedy mamy 50 kobiet i 50 mężczyzn. Jednak znacznie częściej spotkać się możemy z sytuacją, kiedy mamy stosunek nieidealnie równy. Szczególnie widoczne będzie to w modelach bardziej rozbudowanych, wielozmiennowych gdzie każda „celka” (podgrupa) może charakteryzować się zupełnie inną liczebnością.

By mieć pewność, że liczba osób w każdej grupie jest podobna wykorzystamy test niezależności chi-kwadrat. Porównanie wartości oczekiwanej do otrzymanej w każdej grupie pozwoli na wnioski.

Otrzymany wynik dla istotność

Wniosek

Interpretacja

p < 0,05

Wynik istotny

Różnica między liczebnością otrzymaną a oczekiwaną jest istotna. Założenie złamane. Grupy nie są równoliczne.

p > 0,05

Wynik nieistotny

Różnica między liczebnością otrzymaną a oczekiwaną nie jest istotna. Założenie spełnione. Grupy są równoliczne.

Wynik nieistotny dla testu niezależności chi-kwadrat jest tym oczekiwanym i mówi o tym, że liczba osób w grupach jest podobna.

UWAGA. Zdarza się, że wartością oczekiwaną nie jest idealny stosunek 50/50. W badaniach społecznych czasami wykorzystuje się metody doboru badanych skupiające się na odwzorowaniu struktury populacji w próbie. Jeżeli w danej populacji jest 70% kobiet w naszym badaniu gdzie brało udział 100 osób powinniśmy zadbać by udział brało 70 kobiet. Tak by stosunek kobiet do mężczyzn był taki sam (lub zbliżony) w populacji jak i w próbie.

Co zrobić jeżeli założenie nie zostało spełnione:

1) Wyrównać liczbę poprzez losowe usunięcie liczby osób z grupy o większej liczebności lub dobadać osoby do grupy o mniejszej liczebności. Zmienia to jednak przebiega badania o zwiększa liczbę zmiennych niekontrolowanych w badaniu. Dobór celowy (czyli szukanie tylko takich osób, które pasują do jednej, mniej licznej grupy) może znacznie ograniczyć możliwości generalizacji wyników;

2) Zastosować rodzaj testowania nieparametrycznego;

Jeżeli liczba osób w grupie nie jest jedynym z założeń sprawdź ścieżkę wyboru testu statystycznego

 

Normalność rozkładu

Oceniając zmienne, reszty czy różnice między zmiennymi w kontekście normalności rozkładu mamy dwie możliwości oceny zmiennej ilościowej. W ocenie dopasowania rozkładu zmiennych ilościowych do krzywej Gausa wykorzystać możemy test Shapio-Wilk oraz Kołmogorow-Smirnow. Pierwszy z nich wykorzystamy kiedy mamy małą liczbę obserwacji mniej niż sto (n < 100). Kołmogorow-Smirnow będzie lepszy w ocenie prób powyżej 100 obserwacji (n > 100). Warto pamiętać, że kiedy oceniamy rozkład zmiennej w grupach to liczba osób w danej grupie sugeruje konieczność odpowiedniego testu, a nie liczba wszystkich osób w badaniu. Kiedy mamy 160 osób w całym badaniu, ale oceniamy rozkład zmiennej w grupach np. 80 kobiet i 80 mężczyzn to sięgniemy po test Shapiro-Wilk, ponieważ w każdej z grup jest mniej niż 100 obserwacji. Jak interpretować wyniki testów rozkładu?

Otrzymany wynik dla istotność

Wniosek

Interpretacja

p < 0,05

Wynik istotny

Brak normalności rozkładu. Założenie złamane.

p > 0,05

Wynik nieistotny

Jest rozkład normlany. Założenie spełnione.

W przypadku kiedy test normalności rozkładu jest istotny statystycznie nasza zmienna nie pokrywa się z rozkładem normalnym. Założenie jest złamane. Co robić?

1) Pogodzić się z tym, że zmienna nie przyjmuje rozkładu normalnego i wykorzystać testy nieparametryczny, które odporne są na takie problemy;

2) Ocenić przypadki nietypowe i odstające. Na wykresie skrzynkowym (ramka-wąsy) oceniamy czy są przypadki nietypowe. Ich wynik może zaburzać rozkład. Możemy je usunąć z badania i sprawdzić czy poprawiło to rozkład. Przypadki skrajne mogą sugerować np. nierzetelnie wypełniony test;

3) Podjąć się próby zmian wyników np. logarytmizacji zmiennej. Takie działania  mogą poprawić rozkład.

Jeżeli rozkład nie jest jedynym z założeń sprawdź ścieżkę wyboru testu statystycznego.

 

Jednorodność wariancji

Założenie to jest ważne, gdyż jego ocena przesunie kierunek poszukiwania zależności post hoc. Grupa testów parametrycznych zakłada istnienie równej zmienności w obrębie grup. Jednorodność wariancji mówi o podobnym zróżnicowaniu zmiennej zależnej. Do oceny tego wykorzystamy test jednorodności wariancji Levene’a.

Otrzymany wynik dla istotność

Wniosek

Interpretacja

p < 0,05

Wynik istotny

Różnie w zmienności wyników są znaczne. Brak jednorodności wariancji. Założenie złamane.

p > 0,05

Wynik nieistotny

Różnie w zmienności wyników są nieznaczne. Jest jednorodności wariancji.. Założenie spełnione.

Oczekujemy wyniku nieistotnego. Potwierdza on jednorodność wariancji. Wiele testów np. test T Studenta dla danych niezależnych jest odporny na złamanie tego założenia. Test ANOVA czy test T posiadają poprawki na złamanie tego założenia. W przypadku braku jednorodności wariancji:

1) Sięgamy po testy nieparametryczne jeżeli złamane zostały pozostałe założenia;

2) Wykorzystujemy wartość testu z poprawką na niejednorodne wariancje.

Jeżeli jednorodność wariancji nie jest jedynym z założeń sprawdź ścieżkę wyboru testu statystycznego.

 

Sferyczność danych

Kiedy jednorodność wariancji oraz rozkład normalny nie mogę w pełni oddać zróżnicowania między pomiarami wykorzystuje się założenie sferyczności danych. Dane sferyczny są, kiedy różnie pomiędzy wszystkimi pomiarami są jednakowo zróżnicowane. Do oceny sferyczności wykorzystuje się test W Mauchly’ego.

Otrzymany wynik dla istotność

Wniosek

Interpretacja

p < 0,05

Wynik istotny

Istotne zróżnicowanie różnic między pomiarami. Założenie złamane. Brak sferyczności.

p > 0,05

Wynik nieistotny

Różnica zróżnicowania między pomiarami nie jest istotna. Założenie spełnione. Dane są sferyczne.

Kiedy wynik jest istotne – założenie jest złamane. Możemy w tej sytuacji:

1) wykorzystać wartości testu F z poprawkami (dolnej granicy epsilon, G-G, H-F);

2) sięgnąć po nieparametryczny test.

Jeżeli sferyczność nie jest jedynym z założeń sprawdź ścieżkę wyboru testu statystycznego. 

Masz pytania? Zadzwoń lub napisz!

Może zainteresuje Cię także:

Arkadiusz Prajzner

Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.