Skip to content

Korelacje - współczynnik R Pearsona

Wiele modeli badawczych i stawianych w nich pytaniach badawczych zawiera słowa związek. Współzmienność, związek czy korelacja zmiennych to sytuacja kiedy zmianie wartości jednej zmiennej towarzyszy zmiana wartości drugiej zmiennej.

Współczynnik korelacji R Pearsona

Do oceny związku zmiennych najczęściej wykorzystywanym jest współczynnik korelacji R Pearsona.

Założenia

Jak większość parametrycznych metod analizy danych współczynnik R obarczony jest koniecznością spełnienia pewnych założeń

Współczynnik

Założenie

Sposób testowania założenia

R Pearsona

1. Pomiar ilościowy zmiennych

2. Normalność rozkładu zmiennych

Test Shapiro-Wilk lub Kołmogorow-Smirnow

3. Związek liniowy zmiennych

Wykres rozrzutu

Zmienne współwystępujące (bo tak określa się je w modelu korelacyjnym) mierzone muszą być na skali ilościowej (najlepiej stosunkowej). Oraz charakteryzować się rozkładem normalnym ocenianym testem Shapiro-Wilk lub Kołmogorow-Smirnow. Ostania, ale równie ważna kwestia liniowości związku. Współczynnik R dać może źle oszacowany wynik kiedy ocenić będziemy chcieli związek nieliniowy. Analizie trzeba poddać wykres rozrzutu zmiennych by wykluczyć możliwość istnienia związków nieliniowych.

Trzeba też zaznaczyć, że w przypadku złamania założenia normalności rozkładu, który nie wykazuje skrajnie dużych wartości skośności i kurtozy możemy zastosować współczynnik R Pearsona, jeżeli mamy w badaniu więcej niż 50 osób (n > 50).

Interpretacja

Oceniając korelacje patrzymy na trzy rzeczy. Oceniamy jej istotność. Tutaj cieszy nas wynik istotny statystycznie (p < 0,05) bo to oznacza, że istnieje związek między zmiennymi. Później sprawdzamy statystykę r. Statystyka r może przyjmować wartości od -1 do 1. Ujemny wynik r mówi, że związek jest ujemny, czyli kiedy jedna zmienna rośnie, druga maleje. Inaczej wzrost jednej wartości wiąże się, że spadkiem drugiej. Przykładem związku ujemnego może być korelacja liczby wizyt i dentysty oraz bólu zęba. Kiedy rośnie liczba wizyt poziom bólu będzie malał. Kiedy r jest dodatnie korelacja jest dodatnia. Jak jedna zmienna rośnie, druga także wzrasta. Kiedy rośnie liczba godzin nauki poświęcona na statystykę rośnie ocena z przedmiotu. Ostatnią rzeczą jest ocena siły korelacji.

0,0 – 0,30

Brak, bardzo słaba korelacja

0,31 – 0,50

Umiarkowana korelacja

0,51 – 0,70

Silna korelacja

0,71 – 1,00

Bardzo silna korelacja

Niezależnie od kierunku związku możemy zinterpretować jego siłę zgodnie z powyższym podziałem i zapisać przykładowy raport wyników: „Do odpowiedzi na pytanie badawcze wykorzystano współczynnik korelacji R Pearsona. Analiza pokazała, że związek między intymnością a komunikacją jest istotny statystycznie (r = 0,76; p < 0,001). Związek jest bardzo silny i dodatni, co oznacza, że kiedy rośnie wynik intymności w badanej grupie, wzrastał będzie także wynik komunikacji.” Warto upewnić się, że zapis wyników spełnia wymagania standardów.

Złamane założenia

Często możemy spotkać się z sytuacją kiedy złamano założenia normalności rozkładu, a liczba badanych nie pozwala na wykorzystanie współczynnika R. Podobnie ważne kwestie w naukach społecznych dotyczą związków zmiennych innych niż ilościowe. Co jeśli chcemy wykazać korelacje między zmiennymi jakościowymi?

Musimy w takich sytuacjach sięgnąć po nieparametryczne współczynniki korelacji takie jak Rho Speramana czy V Cramera, o których więcej przeczytać można tutaj. Jeżeli nie jesteś pewny jaki współczynnik wybrać sprawdź podpowiedzi na ścieżce wyboru współczynnika korelacji.

Masz pytania? Zadzwoń lub napisz!

Może zainteresuje Cię także:

Arkadiusz Prajzner

Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.