Ścieżki wyboru testu statystycznego
Każda analiza to indywidualne podejście danych. Każda decyzja może być słuszna w przypadku jednej grupy danych lecz zupełnie zła w przypadku pozostałych zbiorów. Jest przecież różnica między lekko zaburzonym rozkładem danych, gdzie kurtoza i skośność mieszą się w granicach wartości <-1;1> a test Shapiro-Wilka jest na granicy istotności (p = 0,049) a wynikami skośności i kurtozy w przedziale <-10;-5> ∪ <5:10> i istotności testu S-W p < 0,001. Założenia trzeba oceniać zawsze w sposób obiektywny, ale nie zero-jedynkowy. Da się jednak zaproponować ścieżki wyboru drogi wnioskowania w oparciu o spełnione założenia. Niżej zaprezentowano podstawowe testy statystyczne i decyzje jakie trzeba podjąć by wykorzystać je w analizie.
Przyjrzymy się ścieżce wyboru testów dla grup niezależnych i zależnych. Ocenie poddamy ścieżkę wyboru podstawowych współczynników korelacji oraz bardziej rozbudowanych modeli badań.
Wybór testu grup niezależnych
Pierwsze pytanie to ocena liczby grup jakie chcemy porównać i równoliczności osób w tych grupach. Kolejne etapy to testowanie założeń normalności rozkładu zmiennych w grupach oraz jednorodności wariancji. Dwie grupy badanych i spełnione założenia prowadzą do analizy testem T Studenta dla danych niezależnych. Więcej niż dwie grupy i spełnione założenia to jednoczynnikowa analizę wariancji. Brak spełnionych założeń dla testów spowoduje konieczność sięgnięcia po testu U Mann-Whitney’a lub H Kruskala-Wallisa.
W sytuacji kiedy spełniona jest część założeń warto przeprowadzić analizę testem parametrycznym i nieparametrycznym. Jeżeli ich wyniki się zgadzają, pokrywają raportować możemy wyniku testu parametrycznego z czystym sumieniem braku błędu. Można też w przypisie wspomnieć o dodatkowej analizie i zamieścić ją np. w aneksie pracy. W sytuacji kiedy zgody nie ma między testami ocenić należy indywidualnie stopień złamania tych założeń. Ostatecznie w raporcie podać wynik testów nieparametrycznych. Szczegółowy opis testowania założeń można znaleźć tutaj.
Wybór testu grup zależnych
Dla zmiennych zależnych, czyli sytuacji kiedy mamy powtarzany pomiar/pomiary ocenić trzeba ich liczbę. Sferyczność danych jest ważniejsza w ocenie niż rozkład zmiennych. Ocena sferyczności to ocena zróżnicowania różnic między pomiarami więc można powiedzieć, że uproszczona jej forma występuję kiedy mamy 2 pomiaru i oceniamy rozkład między tym pomiarami. Spełnienie założeń dla zmiennych pozwala na wykorzystanie w analizie testów T Studenta dla danych zależnych lub jednoczynnikowej analizy wariancji z powtarzanym pomiarem. Brak sferyczności danych to konieczność wykorzystania poprawek w analizie wariancji, które opisane były tutaj. Złamanie znaczne założeń może okazać się powodem konieczności wykorzystania testu kolejności par Wilcoxona lub analizy wariancji Friedmana. Dokładnie informacje o testowaniu założeń można znaleźć pod tym linkiem.
Wybór współczynnika korelacji
Ocena metody analizy związku to głównie ocena sposobu pomiaru skali rozkładu zmiennych oraz liniowości tego związku. Najczęściej wykorzystywany jest współczynnik R Pearsona, ale wymaga spełnienia pewnych założeń. Brak odpowiedniej skali pomiaru lub rozkładu zmiennych zmusza do wykorzystanie współczynnika rho Spearmana i tau Kendalla oraz w konkretnych warunkach współczynnika Gamma. Korelacja zmiennych ilościowych z jakościowymi to korelacje dwuseryjne lub współczynnik eta. W ocenie zmiennych nominalnych pomóc mogą współczynnik phi, C i V. Więcej o testowaniu założeń można znaleźć tutaj.
Wybór rozbudowanego modelu
Często w modelach badawczych interesują nas interakcje więcej niż 2 zmiennych. W ich analizie wykorzystuje się modele wieloczynnikowe. Istnienie samego powtarzanego pomiaru prowadzi nas do analizy z powtarzanym pomiarem lub (kiedy założenia nie są spełniona) do analizy wariancji Friedmana. Dwie lub więcej zmiennych niezależnych grupujących to wieloczynnikowej analizy wariancji w schemacie międzygrupowym. Jeżeli w modelu mamy powtarzany pomiar oraz zmienną niezależną grupującą wykorzystamy w analizie wieloczynnikową analizę wariancji w schemacie mieszanym.
Masz pytania? Zadzwoń lub napisz!
Może zainteresuje Cię także:
Arkadiusz Prajzner
Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.
METODOLOGIA
STATYSTYKA
SŁOWNIK
DODATKOWE