3.8. Datu korelācija
Statistikas metodes ļauj analizēt arī kopsakaru starp divām dažādām datu kopām – viena objekta divu dažādu pazīmju vērtību kopām.
Piemēram:
- cilvēka garumu un masu;
- mācībām atvēlēto laiku un zināšanu novērtējumu;
- ienākumu līmeni, pirktspēju utt.
Korelācija ir statistikas jēdziens, kas ļauj novērtēt divu datu kopu savstarpējo saistību.
Lai iegūtu priekšstatu par divu datu kopu korelāciju, atliek datu vērtības – skaitļu pārus kā punktus koordinātu plaknē. Pēc punktu izvietojuma var spriest par korelāciju. Ja iegūtie punkti izvietojas uz vienas taisnes jeb cieši ap kādu taisni, starp abu kopu elementiem pastāv korelācija – sakarība. Tātad, mainoties vienas pazīmes vērtībām, mainās arī otras pazīmes vērtības.
Pieņemsim, ka esam veikuši aptauju, kurā noskaidrojām iedzīvotāju vidējos mēneša ienākumus un izklaidei un atpūtai atvēlēto summu mēnesī. Mēs vēlamies noskaidrot, vai ir iemesls apgalvot, ka „jo vairāk cilvēks nopelna, jo vairāk viņš atvēl izklaidei un atpūtai”.
Ja palielinoties vienas pazīmes vērtībām, arī otras pazīmes vērtības palielinās, tad korelācija ir pozitīva.
Ja palielinoties vienas pazīmes vērtībām, otras pazīmes vērtības samazinās, tad
korelācija ir negatīva.
Piemēram, negatīva korelācija ir novērojama starp produkcijas ražošanas apjomu un produkcijas vienības pašizmaksu.
Ja punkti ir ļoti „izkliedēti”, tad nav korelācijas starp pazīmēm, vai tā ir ļoti niecīga.
Piemēri:
a) pozitīva korelācija;
|
b) negatīva korelācija;
|
c) korelācijas nav.
|
|
|
|
Piemērs pozitīvai korelācijai
Piemērs negatīvai korelācijai
Skolēni rakstījuši pārbaudes darbu. Tiek salīdzināts iegūtais punktu skaits vienā, piemēram, 1. uzdevumā un visā pārbaudes darbā kopumā; ja skolēns ieguvis lielāku punktu skaitu apskatāmajā uzdevumā, tad arī visā darbā iegūtais punktu skaits ir lielāks:
Tiek salīdzināts laiks stundās, kas veltīts apmācībai, un konkrēta uzdevuma izpildes laiks pēc šīs apmācības. Var ievērot tendenci – jo ilgāks laiks bijis apmācībai, jo ātrāk tiek izpildīts uzdevums.