Skip to content

Ważne pojęcia

Masz pytania? Zadzwoń lub napisz! 

CEL BADAŃ

Odpowiedź na pytanie po co robisz to badanie? Niezbędny element części metodologii badań własnych. Każde badanie musi mieć swój cel. Czasami celem badań może być jedynie zaliczenie przedmiotu, jednak prace naukowe powinny spełniać także inne cele. Badanie powinno mieć swój cel poznawczy, teoretyczny, czyli dążyć do zwiększenia wiedzy z danego zakresu nauki. O jakości pracy i badania świadczyć będzie także istnienie celu praktycznego, czyli możliwości przeniesienia wiedzy i wyników badania na działania. Wyniki badań mogą prowadzić powstania nowego planu oddziaływań pedagogicznych, do zmiany narzędzie terapeutycznych czy nawet to zmiany dawkowania leków pacjentów z pewnymi zaburzeniami. Z celu badań wynikać powinny pytania badawcze. Rozdział celu i przedmiotu badań winien być połączeniem prezentowanej teorii z metodą badań. 

DOMINANTA

Inaczej modalna. Wartość najczęściej występująca w zbiorze danych. Element statystyki opisowej i tendencji centralnej. W jednym zbiorze wyników możemy otrzymać więcej niż jedną wartość modalna/dominantę. Jest cenionym wskaźnikiem tendencji centralnej dla danych nominalnych, gdzie średnia i mediana nie mogą zostać wyliczone. Na jej wynik w znacznym stopniu może oddziaływać zakres przedziałów klasowych przy grupowaniu wyników oraz ich lokalizacja. Nie jest stabilnym wskaźnikiem dla różnych prób.

ISTOTNOŚĆ

Inaczej ważność. Wynik istotny oznacza, że uzyskanie takich wyników w otrzymanej próbie w sposób przypadkowy jest mało prawdopodobne w sytuacji kiedy hipoteza zerowa jest prawdziwa. Właśnie dlatego powinna zostać odrzucona. Istotność a wartość p to nie to samo. Dlaczego tak nie jest, można przeczytać tutaj.

KURTOZA

Element statystyki opisowej. Kurtoza pomaga w ocenie rozproszenia rozkładu naszych danych. Wynik dodatni oznacza duże skupienie wyników wokół średniej – małe różnicowanie wyników (rozkład leptokurtyczny). Wynik ujemny to informacja o słabej koncentracji wyników i znacznym zróżniocowaniu wyników (rozkład platykurtyczny) Ciężko w badaniach społecznych uzyskać wynik rozkładu równy zero (rozkładu idealnie mezokurtyczny). Wyniki bliskie wartości |1,00| i wyższe powinny alarmować, że dane może mieć trudność z uzyskaniem normalności rozkładu.

KWARTYLE

Kwantyle służą do oceny rozkładu danych. Wśród nich znajdziemy kwartyle, które dzielą zbiór obserwacji na 4 przedziały, z których każdy zawiera dokładnie 25% obserwacji. Między wynikiem minimum a kwartylem 1 znajdziemy 25% najmniejszych wyników ze zbioru. Między kwartylem 1 a kwartylem 2 (medianą) znajdziemy 25% obserwacji. Oznacza, to że odległość minimum i medianą to 50% obserwacji. Między kwartylem 2 a kawartylem 3 oraz między kwartylem 3 a wartością maksimum znajdziemy po 25% obserwacji. Kwartyle są ważna szczególnie w ocenie rozkładów o znacznej asymetrii. Większy rozsęp między 1 i 4 przedziałem pomoże w zrozumieniu skośności rozkładu.

MAKSIMUM

Największa wartość otrzymana w zbiorze. Służy do oceny rozstępu. Powinna stanowić element statystyki opisowej danych (szczególnie ważna dla danych ilościowych). Jest pomocna w ocenie asymetrii rozkładu oraz skupienia wyników. Oceniając skośność, średnią czy medianę zawsze warto brać pod uwagę ich „odległość” od wartości maksymalnych.

MEDIANA

Element statystyki opisowej i wskaźnik tendencji centralnej. Jest punktem rozkładu poniżej, którego leży 50% wszystkich obserwacji w zbiorze. Dzieli na połowy zbiór danych. Do jej wskazanie niezbędne jest szeregowanie, porządkowanie wyników. Nie jest tak jak średnia wrażliwa na wartości skrajne, lecz na liczbę wyników jakie leżą poniżej lub powyżej. Na jej wynik będzie oddziaływać liczba wyników a nie ich „oddalenie”. Mniej jak średnia będzie więc podatna na zakrzywianie wartości poprzez skrajne wartości w zbiorze. Będzie  zatem lepszym wskaźnikiem tendencji centralnej dla rozkładów silnie asymetrycznych niż średnia.

MEDIATOR

Zmienna pośrednicząca. Pozwala lepiej zrozumieć przyczyny pewnych zależności i zjawisk. Istnieje mediacji między zmiennymi mówi nam dlaczego dane zjawisko czy efekt jest widoczny w próbie. Inaczej i bardziej praktycznie – obserwowany związek między zmienną niezależną i zależną po wprowadzeniu do modelu mediatora traci na znaczeniu. Okazuje się jednak, że mediator i zmienna zależna są teraz silnie związane. Mediacja całkowita występuje kiedy po wprowadzeniu mediatora związek zmiennej niezależnej z zależną staje się całkowicie nieistotny. Mediacja częściowa to jedynie osłabienie takiego związku. Modele mediacji powinny być budowane w oparciu o modele teoretyczne.

MIARY ZMIENNOŚCI / ROZPROSZENIA

Zbiór wskaźników ukazujących rozrzut wyników. Pojedynczy wynik miary zmienności pokazuje pewne odległości, a nie jak miary tendencji centralnej punkt na osi. Miara rozproszenia będzie więc definiowana jako pojedyncza liczba opisująca rozrzut wyników w rozkładzie w badanej próbie. Do opisu zmienności i rozproszenia wykorzystuje się:

·         współczynnik zmienności;

·         rozstęp;

·         odchylenie ćwiartkowe;

·         odchylenie standardowe;

·         wariancję;

·         skośność;

·         kurtozę.

Ich wybór i wykorzystanie zależna od danych jakie zebraliśmy ale także od pytań jakie postawiono w pracy. Niżej pokazano podsumowanie najczęściej wybieranych wskaźników zmienności i ich porównanie.

Właściwości

Miary zmienności

Rozstęp

Odchylenie ćwiartkowe

Odchylenie standardowe

Częstość wykorzystania

niewielka

bardzo mała

bardzo duża

Podatność na operacje matematyczne

bardzo mała

bardzo mała

bardzo duża

Stabilność dla różnych prób

najgorsza

dość dobra

najlepsza

Użycie w rozkładach skośnych

mylące

dobre

interpretowane z ostrożnością

Pokrewna miara tendencji centralnej

żadna

mediana

średnia

Wrażliwość na wielkość próby

tak

nie

nie

Źródło: B.M. King. E.W. Minium. (2020). Statystyka dla psychologów i pedagogów. s. 130.

MIARY TENDENCJI CENTRALNEJ

Zbiór wskaźników przy pomocy których ocenić możemy centralne położenie rozkładu. Pojedynczy wskaźnik miary tendencji centralnej definiuje się jako pojedynczy wynik opisujący centralne położenie całkowitego rozkładu obserwacji. Najczęściej wykorzystywane miary tendencji centralnej:

·         modalna/dominanta;

·         mediana;

·         średnia.

Ich wybór i wykorzystanie generowane są przez rodzaj zbieranych danych i zadane pytania badawcze.

MINIMUM

Najmniejsza wartość otrzymana w zbiorze. Służy do oceny rozstępu. Powinna stanowić element statystyki opisowej danych (szczególnie ważna dla danych ilościowych). Jest pomocna w ocenie asymetrii rozkładu oraz skupienia wyników. Oceniając skośność, średnią czy medianę zawsze warto brać pod uwagę ich „odległość” od wartości minimalnych.

MODERATOR

Zmienna w badaniu, która oddziałuje na wynik zależności między innymi zmiennymi. Opisuje warunki do wystąpienia pewnej zależności czy efektu. Za czym idzie pokazuje tez ograniczenia. Pokazuje jakie muszą wystąpić warunki by doszło do zjawiska. Moderator to zmienna, na której poziomach zależności między zmiennymi są na innym poziomie. Zmienia sposób działania zmiennych.

Kiedy moderator związku odporności na stres a impulsywnością jest płeć. Okazuje się, że na jednym poziomie związek jest a na drugim go nie ma. Okazuje się, że jedynie w grupie mężczyzn taki związek jest ważny i silny, natomiast w grupie kobiet takiego związku nie ma (lub co ciekawsze jest ujemny). Modele te powinny być budowane dla dobrze opracowanych modeli teoretycznych.

ODCHYLENIE STANDARDOWE

Miara zmienności, rozproszenia wyników używana w opisie statystycznym ale także we wnioskowaniu. Pokazuje jak bardzo, w przeciętny sposób, wyniki odchylają się do wyniku średniego. Większy wynik to większe rozproszenie wyników od średniej. Odchylenie standardowe to pierwiastek kwadratowy z wariancji. Tak jak średnia, odchylenie standardowe jest wrażliwe na wartości skrajne i odstające, czyli na położenie wyników w rozkładzie. Jej wynik jest odporny na zmienność próby, co jest szczególnie ważne jeżeli chcemy wykorzystać wynik odchylenia do porównania zmienności w populacji.

PREDYKTOR

Określenie zmiennej niezależnej w modelu przewidywania, w modelu regresji. Predyktorem nazwiemy zmienną wyjaśniającą. Zmienne wyjaśniające pozwalają na przewidywanie zmiennej wyjaśnianej (zależnej). W modelu może istnieć kilka predyktorów. Inne nazewnictwo to zmienna wyjaśniająca, niezależna.

PRZEDMIOT BADAŃ

Odpowiedź na pytanie co badasz w badaniu? Podobnie jak cel badań to obowiązkowy punkt każdego badania i pracy naukowej. Przedmiot badań to opis tego co w badaniu podlega pomiarowi czy analizie. Przedmiotem badań może być osobowość badanych, ich poziom stresu. Może być to także związek inteligencji z zachowaniem nonkonformistycznym. Inaczej przedmiotem badania jest wszystko to co nas w badaniu interesuje. Może być nim wpływ podawania placebo na samopoczucie czy maść psów. Powinien być połączony z celem badań. Ta część pracy to spoiwo teorii z metodologią.

ROZKŁAD NORMALNY

Krzywa normalna, krzywa Gauss’a. Pewna matematyczna abstrakcja określona przed pewne równanie. Nie ma jednej krzywej normalnie, mamy całą rodzinę krzywych normlanych. Dane charakteryzujące się rozkładem normalnym dążą do osiągnięcia tego idealnego tworu jakim jest krzywa normalna. Rozkład normalny posiada pewne stałe cechy:

·         Symetryczność – obie strony rozkładu są takie same;

·         Jednomodalność – posiada jedną wartość modalną zlokalizowaną na środku rozkładu;

·         Ciągłość rozkładu;

·         Asymptotyczność – linia krzywej nie zetknie się w odciętą odcięta.

Pod krzywą normalną dla danego rozstępu wartości na odciętej są takie same, gdy określane są na podobnej podstawie. Wiele testów statystycznych wymaga spełnienia założenia by testowana zmienna posiadała rozkład normalny. 

ROZSTĘP

Jest oceną różnicy wyniku maksymalnego i minimalnego. Podstawowa miara zmienności. Poza opisem statystycznym używany dość rzadko. Nie jest wrażliwy na kształt całego rozkładu a jedynie na jego skrajne wartości (min i max). Jest ograniczany wielkością próby. Większe próby to zazwyczaj większy wynik. Rozstęp otrzymany to wynik dla uzyskanych danych surowych. Rozstęp teoretyczny to możliwy wynik do uzyskania dla konkretnej skali czy narzędzia. Bardzo cennym może być porównanie wyników otrzymanego rozstępu z tym teoretycznie zakładanym dla wykorzystywanego narzędzia. Większy rozstęp teoretyczny od otrzymanego może prowadzić do wniosków o wyborze do badania specyficznej grupy. Chcąc ocenić różnorodność poziomu ekstrawersji w populacji z wykorzystaniem NEO-FFI rozstęp teoretyczny wyniesie 15-60 a w badanu może wynieść jedynie 55-60. Oznacza, że z jakiegoś powodu do próby trafiły osoby o skrajnie maksymalnych wynikach. Warto poddać to dalszej analizie i wyprowadzić przemyślane wnioski

SIŁA EFEKTU

Niezależna od liczby obserwacji i stopni swobody, miara zależności między zmiennymi. Jest to oszacowanie i mówi o efekcie oddziaływania w populacji. Powinna być tak samo jak poziom istotności wykorzystana do potwierdzenie/odrzucenia hipotezy zerowej. Istotność będzie zależała od liczby obserwacji natomiast siła efektu jest wolna od takiego „wpływu”. Dodatkowo jest niezależna od skali pomiaru. Dlatego w metaanalizach, gdzie porównujemy różne badania, prowadzone na różnych grupach, do porównania wyników wykorzystuje się właśnie siły efektów. Dlatego warto umieszczać ja zawsze w analizach. Więcej o sile efektu można przeczytać tutaj. 

SKOŚNOŚĆ

Element statystyki opisowej. Skośność pomaga w ocenie symetrii rozkładu naszych danych. Wynik dodatni skośności sugeruje rozkład prawoskośny – przewagę liczby wyników niskich na wysokimi (D<Me<M). Wynik ujemny skośności oznacza rozkład lewoskośny – więcej wyników wyższych od średniej (D>Me>M). Ciężko w badaniach społecznych uzyskać wynik skośności równy zero (oznaczający brak asymetrii). Wyniki bliskie wartości |1,00| i wyższe powinny alarmować, że asymetria może być znacząca i utrudnić uzyskanie normalności rozkładu.

STOPNIE SWOBODY

Niegdyś bardzo ważny element oceny poziomu istotności testu. Jest nierozłącznym elementem informacji o wyniku. Razem z wartością testu i wartości istotności stanowi kompletny raport. Poziom p obliczany jest dla konkretnego wyniku testu i właśnie konkretnej w badaniu liczby stopni swobody. Liczba stopni swobody (df) pokazuje ile wyników (lub średnich wyników) możemy swobodnie zmienić w naszej grupie tak by wynik testu pozostawał bez zmian. Jest to także informacja i liczbie badanych osób i tworzonych grup. Wzór jest zależny dla stosowanego testu. Dla badania normalności rozkładu df jest zawsze równy liczby obserwacji (tak samo dla korelacji). Dla testów grup zależnych df to wynik odejmowania N-1. Dla niezależnych df = N-2. 

ŚREDNIA

Wartość podstawowa statystyki opisowej. Wartość tendencji centralnej danych. Średnia arytmetyczna zwana dalej średnią jest sumą wszystkich wartości podzielona przez ich ilość. Średnia jest wrażliwa na lokalizację czy odchylenie wyników. Dlatego wartości skrajne, odstające będą zakrzywiać jej wynik. Jest najbardziej odporną miarą tendencji centralnej na losową zmienność próby. 

WARIANCJA

Miara zróżnicowania. Wartość odchylenia standardowego podniesiona do kwadratu. Im większa wariancja tym większe zróżnicowanie danych w badanej próbie. Jest to średni wynik kwadratów odchyleń wyników od średniej. 

WSPÓŁCZYNNIK DETERMINACJI

Najczęściej jest to podniesiona do kwadratu wartość współczynnika korelacji. Oznacza % wyjaśnianej zmienności jednej zmiennej przez drugą. Związek między zmiennymi na poziomie r = 0,5 oznacza, że jedna zmienna potrafi wyjaśnić 25% zmienności drugiej zmiennej (r2 = 0,25)

WSPÓŁCZYNNIK ZMIENNOŚCI

Służy do oceny zróżnicowania danych w próbie. Jest to procentowe określenie jak bardzo zróżnicowane są wyniki. Wynik dzielenia odchylenia standardowego w grupie przez średnią mnożony x100% daje wynik współczynnika zmienności. Jego wynik można interpretować w następujących przedziałach:

< 25% – mała zmienność;

25 – 45% – przeciętna zmienność;

45 – 100 – silna zmienność;

> 100% – bardzo duża zmienność.

WYKRES ROZRZUTU

Wykres kropek położonych w punktach przecięcia osi reprezentujących pary wyników. Wykres służy do oceny liniowości rozkładu. Można na jego podstawie zobaczyć jak układają się wyniki. Elementem dodatkowym jest czasami linia regresji budowana za pomocą metody najmniejszych kwadratów różnic odległości tych kropek od jej linii.

Za pomocą wykresu można też wstępnie przewidywać o sile korelacji. Ułożone w jedną linię kropki sugerują silny związek. Znaczne rozproszenie i brak widocznej linii to sugestia, że związek tych zmiennych jest słaby lub go nie ma.

WYKRES SKRZYNKOWY

Inaczej wykres skrzynka-wąsy. W podstawowej wersji widać na nim podział zbiory danych na 4 części. Za pomocą rozstępu i kwartyli wykres ten przedstawia nam rozkład wyników. Bardzo często wykorzystywany do lokalizacji wyników skrajnych i nietypowych. Wartość nie typowa znajduje się między 1,5 – 3 odchyleniem ćwiartkowym, a wartość skrajna znajduje się powyżej 3 odchylenia ćwiartkowego. Często ich istnienie w próbie generuje brak rozkładu normalnego.

ZMIENNA NIEZALEŻNA

Przeznaczona głównie do badań eksperymentalnych. Zmienna, której poziomem i wartościami manipuluje badacz. Jej działanie czy wartość generują zmienności zmiennej zależnej. Od jej wartości zależy wynik zmiennej zależnej (przynajmniej w założeniu). Wykorzystywana jest także w innych modelach badań. W badaniach predykcyjnych określana predyktorem.

ZMIENNA ZALEŻNA

Przeznaczona głównie do badań eksperymentalnych. Zmienna główna podlegająca pomiarom. Jej zmienność i wynik stanowi główny element analiz i badania. Wykorzystywana także w innych modelach. W regresji czasami nazywana zmienną wyjaśnianą. Zmienna niezależna działa na wynik zależnej (przynajmniej w założeniu).

ZMIENNA W BADANIU

Warunek, cecha lub właściwość, która może przyjmować w badaniu przynajmniej dwie wartości. Jeden z najważniejszych elementów badania i pracy naukowej (empirycznej). Określenie zmiennych w badaniu to podstawowy element metodologii. Nie powinno się ograniczać do wskazania jedynie zmiennej niezależnej i zależnej. Badanie i proces zbierania danych narażony jest na wiele innych zmiennych: zakłócających czy ubocznych, które mogą generować nieoczekiwane zmienności wyników. Zmienne powinny być poddawane operacjonalizacji. Więcej o zmiennych i o procesie operacjonalizacji można przeczytać tutaj.

Masz pytania? Zadzwoń lub napisz!

Może zainteresuje Cię także:

Arkadiusz Prajzner

Zajmuję się opracowaniem statystycznym danych w naukach społecznych oraz poradnictwem związanym z podstawami metodologicznymi badań. Chętnie odpowiem na Twoje pytania.