Korelacje - współczynnik R Pearsona
Wiele modeli badawczych i stawianych w nich pytaniach badawczych zawiera słowa związek. Współzmienność, związek czy korelacja zmiennych to sytuacja kiedy zmianie wartości jednej zmiennej towarzyszy zmiana wartości drugiej zmiennej.
Współczynnik korelacji R Pearsona
Do oceny związku zmiennych najczęściej wykorzystywanym jest współczynnik korelacji R Pearsona.
Założenia
Jak większość parametrycznych metod analizy danych współczynnik R obarczony jest koniecznością spełnienia pewnych założeń.
Współczynnik | Założenie | Sposób testowania założenia |
R Pearsona | 1. Pomiar ilościowy zmiennych | — |
2. Normalność rozkładu zmiennych | Test Shapiro-Wilk lub Kołmogorow-Smirnow | |
3. Związek liniowy zmiennych | Wykres rozrzutu |
Zmienne współwystępujące (bo tak określa się je w modelu korelacyjnym) mierzone muszą być na skali ilościowej (najlepiej stosunkowej). Oraz charakteryzować się rozkładem normalnym ocenianym testem Shapiro-Wilk lub Kołmogorow-Smirnow. Ostania, ale równie ważna kwestia liniowości związku. Współczynnik R dać może źle oszacowany wynik kiedy ocenić będziemy chcieli związek nieliniowy. Analizie trzeba poddać wykres rozrzutu zmiennych by wykluczyć możliwość istnienia związków nieliniowych.
Trzeba też zaznaczyć, że w przypadku złamania założenia normalności rozkładu, który nie wykazuje skrajnie dużych wartości skośności i kurtozy możemy zastosować współczynnik R Pearsona, jeżeli mamy w badaniu więcej niż 50 osób (n > 50).
Interpretacja
Oceniając korelacje patrzymy na trzy rzeczy. Oceniamy jej istotność. Tutaj cieszy nas wynik istotny statystycznie (p < 0,05) bo to oznacza, że istnieje związek między zmiennymi. Później sprawdzamy statystykę r. Statystyka r może przyjmować wartości od -1 do 1. Ujemny wynik r mówi, że związek jest ujemny, czyli kiedy jedna zmienna rośnie, druga maleje. Inaczej wzrost jednej wartości wiąże się, że spadkiem drugiej. Przykładem związku ujemnego może być korelacja liczby wizyt i dentysty oraz bólu zęba. Kiedy rośnie liczba wizyt poziom bólu będzie malał. Kiedy r jest dodatnie korelacja jest dodatnia. Jak jedna zmienna rośnie, druga także wzrasta. Kiedy rośnie liczba godzin nauki poświęcona na statystykę rośnie ocena z przedmiotu. Ostatnią rzeczą jest ocena siły korelacji.
0,0 – 0,30 | Brak, bardzo słaba korelacja |
0,31 – 0,50 | Umiarkowana korelacja |
0,51 – 0,70 | Silna korelacja |
0,71 – 1,00 | Bardzo silna korelacja |
Niezależnie od kierunku związku możemy zinterpretować jego siłę zgodnie z powyższym podziałem i zapisać przykładowy raport wyników: „Do odpowiedzi na pytanie badawcze wykorzystano współczynnik korelacji R Pearsona. Analiza pokazała, że związek między intymnością a komunikacją jest istotny statystycznie (r = 0,76; p < 0,001). Związek jest bardzo silny i dodatni, co oznacza, że kiedy rośnie wynik intymności w badanej grupie, wzrastał będzie także wynik komunikacji.” Warto upewnić się, że zapis wyników spełnia wymagania standardów.
Złamane założenia
Często możemy spotkać się z sytuacją kiedy złamano założenia normalności rozkładu, a liczba badanych nie pozwala na wykorzystanie współczynnika R. Podobnie ważne kwestie w naukach społecznych dotyczą związków zmiennych innych niż ilościowe. Co jeśli chcemy wykazać korelacje między zmiennymi jakościowymi?
Musimy w takich sytuacjach sięgnąć po nieparametryczne współczynniki korelacji takie jak Rho Speramana czy V Cramera, o których więcej przeczytać można tutaj. Jeżeli nie jesteś pewny jaki współczynnik wybrać sprawdź podpowiedzi na ścieżce wyboru współczynnika korelacji.
Masz pytania? Zadzwoń lub napisz!
Może zainteresuje Cię także:
Arkadiusz Prajzner
Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.
METODOLOGIA
STATYSTYKA
SŁOWNIK
DODATKOWE