Funcția Excel CORREL - Calculați corelația statistică

Descărcați Exemplu de registru de lucru

Descărcați exemplul de registru de lucru

Acest tutorial arată cum să utilizați fișierul Funcția Excel CORREL în Excel pentru a calcula corelația.

Prezentare generală a funcției CORREL

Funcția CORREL Calculează corelația a două serii de numere.

Pentru a utiliza funcția Foaie de lucru CORREL Excel, selectați o celulă și tastați:

(Observați cum apar datele introduse de formulă)

Funcția CORREL Sintaxă și intrări:

1 = CORREL (matrice1, matrice2)

matrice1 - Matrice de numere.

Ce este funcția CORREL?

Funcția Excel CORREL returnează coeficientul de corelație (Pearson’s r) din două intervale de date.

Care este coeficientul de corelație?

Coeficientul de corelație, denumit de obicei Pearson r (numit după Karl Pearson, persoana care a dezvoltat-o), este o statistică care vă spune cât de puternic sunt legate două variabile.

Pearson’s r este o cifră între -1 și 1, care poate duce la trei interpretări posibile: o corelație pozitivă, o corelație negativă și nicio corelație.

Corelație pozitivă

O corelație pozitivă (r > 0) înseamnă că atunci când cele două variabile sunt în tandem - atunci când observați un scor mare într-o variabilă, aveți tendința de a observa și un scor mare în cealaltă. La fel, atunci când o variabilă este scăzută, cealaltă tinde să fie și scăzută.

De exemplu, înălțimea și greutatea au o corelație pozitivă. Vedeți graficul de mai jos, care prezintă înălțimea și greutatea unui mic eșantion de jucători de baseball:

The r din acest mic eșantion este 0,73 - o corelație pozitivă foarte puternică. Acest lucru are sens logic - oamenii mai înalți tind să fie mai grei, în medie, deoarece acea înălțime suplimentară este formată din oase și mușchi și alte țesuturi care cântăresc ceva.

Dar corelația nu este perfectă (într-o corelație perfectă cu un r din 1, toate scorurile ar cădea pe linia de tendință). Unii oameni mai scurți pot fi mai grei - poate că transportă un pic de grăsime în plus sau se antrenează la sala de sport. La fel, unii oameni înalți ar putea fi foarte slabi și, de fapt, cântăresc mai puțin decât mulți oameni mai mici.

Corelația de aici este probabil atât de mare, deoarece avem de-a face cu sportivi, ar fi mai mică în populația generală. Nu uitați să țineți cont de acest lucru atunci când utilizați CORREL - the r obțineți nu este definitiv - trebuie să vă gândiți la datele dvs. și la modul în care le-ați obținut atunci când faceți interpretările.

Corelația negativă

O corelație negativă (r <0) înseamnă că atunci când observați un scor mare într-o variabilă, aveți tendința de a observa un scor scăzut în cealaltă variabilă și invers.

De exemplu, scorurile testelor elevilor și numărul de absențe pe care le-au avut de la școală sunt corelate negativ. Adică, cu cât ratează mai multe zile, cu atât scorurile lor sunt mai mici. Cu cât ratează mai puține zile, cu atât scorurile tind să fie mai mari:

Din nou, corelația nu este perfectă (așa cum aproape niciodată nu sunt). Aici avem un student care a ratat 5 zile, dar a reușit să înscrie 85%. De asemenea, avem unul care a obținut 52%, în ciuda faptului că au lipsit doar două zile.

Avem încă o tendință negativă clară. Dar există încă multe variații în rezultatele testelor care nu pot fi explicate doar prin absență. Acest lucru s-ar putea datora altor variabile, cum ar fi aptitudinea, motivația, sănătatea și mulți alți factori potențiali.

Așadar, atunci când utilizați CORREL, rețineți că există o imagine mai largă pe care datele dvs. s-ar putea să nu o explice pe deplin.

Fără corelație

Fără corelație (r = 0 sau este aproape de 0) înseamnă că nu puteți prevedea scorul unei variabile pe baza alteia. Dacă parcelați datele, nu veți vedea nicio tendință distinctă, iar linia de tendință va fi plană sau aproape plată.

Iată câteva date despre lungimea degetului inelar și IQ:

După cum puteți vedea, nu există nicio legătură între aceste două variabile în acest eșantion, deci putem presupune că nu au legătură.

În practică, este puțin probabil să obțineți un r de exact 0. Amintiți-vă că atunci când colectați date, există adesea unele variații datorate erorilor, poate la măsurare sau raportare. Deci doar pentru că r nu este exact 0, nu înseamnă că ați găsit ceva.

Corelația nu este cauzalitate

Este crucial să rețineți că CORREL nu vă poate spune ce variabilă îl influențează pe celălalt - sau chiar dacă există vreo relație cauzală între variabile. De exemplu, a fost găsită o corelație între următoarele variabile:

  • Cantitatea de înghețată vândută și cantitatea de infracțiuni violente
  • Cât de fericit ești și cât de reușit ai în carieră
  • Numărul de oameni care s-au înecat într-o piscină și numărul de filme pe care Nicolas Cage le-a apărut pe an

Primul exemplu este a treia problemă variabilă. Desigur, înghețata nu îi face pe oameni violenți și nici implicarea în violență nu declanșează pofta de lapte și zahăr congelat. A treia variabilă este vremea. Pe vreme caldă, oamenii pur și simplu ies mai mult - există mai mult contact între oameni, deci există mai multe șanse să apară un conflict. Pe vreme caldă, oamenii cumpără și mai multă înghețată. Deci, vânzările de înghețată și criminalitatea violentă se corelează doar pentru că ambele sunt legate de o a treia variabilă.

Al doilea ar putea fi un exemplu de dublă cauzalitate. A avea succes la locul de muncă poate fi bun pentru fericirea ta - vei câștiga mai mulți bani și, în general, vei avea mai mult control asupra activității pe care o faci și cu cine o faci. Dar fericirea ar putea fi benefică și pentru succes, poate că oamenii mai fericiți sunt mai ușor să se înțeleagă și să dezvolte relații de muncă mai puternice sau poate că sunt mai rezistenți mental la contracariere. În acest caz, ambele variabile se influențează reciproc.

Al treilea este pur și simplu un corelație falsă. Doar pentru că două variabile se corelează în datele dvs., nu înseamnă că acestea interacționează oricum în viața reală.

Concluzia este că o corelație nu vă poate spune dacă două variabile sunt legate cauzal.

Cum se utilizează CORREL

Utilizați funcția Excel CORREL astfel:

1 = CORREL (B3: B15, C3: C15)

Cu CORREL definiți două argumente - cele două intervale de date pe care doriți să le corelați.

Iată câteva puncte cheie pe care trebuie să le țineți cont de CORREL:

  • Textul, booleanul (TRUE / FALSE) și celulele goale sunt ignorate.
  • Ambele intervale de date trebuie să aibă un număr egal de puncte de date, altfel veți primi o eroare # N / A
  • Dacă unul dintre intervalele de date este gol, sau dacă nu există deloc variații în date (adică, dacă toate punctele de date sunt același număr), veți primi un # DIV / 0! Eroare

Funcția CORREL în Foi de calcul Google

Funcția CORREL funcționează exact la fel în Foi de calcul Google ca în Excel:

Note Aditionale

Exemple CORREL în VBA

De asemenea, puteți utiliza funcția CORREL în VBA. Tip:
application.worksheetfunction.correl (array1, array2)
Pentru argumentele funcției (matrice1 etc.), le puteți introduce direct în funcție sau puteți defini variabile de utilizat.

Reveniți la lista tuturor funcțiilor din Excel

wave wave wave wave wave