3.8. Datu korelācija

Statistikas metodes ļauj analizēt arī kopsakaru starp divām dažādām datu kopām – viena objekta divu dažādu pazīmju vērtību kopām.

Piemēram:

  • cilvēka garumu un masu;
  • mācībām atvēlēto laiku un zināšanu novērtējumu;
  • ienākumu līmeni,  pirktspēju utt.

Korelācija ir statistikas jēdziens, kas ļauj novērtēt divu datu kopu savstarpējo saistību.

Lai iegūtu priekšstatu par divu datu kopu korelāciju, atliek datu vērtības – skaitļu pārus kā punktus koordinātu plaknē. Pēc punktu izvietojuma var spriest par korelāciju. Ja iegūtie punkti izvietojas uz vienas taisnes jeb cieši ap kādu taisni, starp abu kopu elementiem pastāv korelācija – sakarība. Tātad, mainoties vienas pazīmes vērtībām, mainās arī otras pazīmes vērtības.

Pieņemsim, ka esam veikuši aptauju, kurā noskaidrojām iedzīvotāju vidējos mēneša ienākumus un izklaidei un atpūtai atvēlēto summu mēnesī. Mēs vēlamies noskaidrot, vai ir iemesls apgalvot, ka „jo vairāk cilvēks nopelna, jo vairāk viņš atvēl izklaidei un atpūtai”.

Ja palielinoties vienas pazīmes vērtībām, arī otras pazīmes vērtības palielinās, tad korelācija ir pozitīva.

Ja palielinoties vienas pazīmes vērtībām, otras pazīmes vērtības samazinās, tad korelācija ir negatīva.
Piemēram, negatīva korelācija ir novērojama starp produkcijas ražošanas apjomu un produkcijas vienības pašizmaksu.

Ja punkti ir ļoti „izkliedēti”, tad nav korelācijas starp pazīmēm, vai tā ir ļoti niecīga.

Piemēri:

a) pozitīva korelācija; b) negatīva korelācija; c) korelācijas nav.

Piemērs pozitīvai korelācijai
Piemērs negatīvai korelācijai