Hoe de lineaire correlatiecoëfficiënt te berekenen?

Schrijver: William Ramirez
Datum Van Creatie: 16 September 2021
Updatedatum: 1 Juli- 2024
Anonim
Correlatiecoëfficiënt
Video: Correlatiecoëfficiënt

Inhoud

De correlatiecoëfficiënt (of lineaire correlatiecoëfficiënt) wordt aangeduid als "r" (in zeldzame gevallen als "ρ") en kenmerkt de lineaire correlatie (dat wil zeggen, de relatie die wordt gegeven door een waarde en richting) van twee of meer variabelen. De waarde van de coëfficiënt ligt tussen -1 en +1, dat wil zeggen dat de correlatie zowel positief als negatief kan zijn. Als de correlatiecoëfficiënt -1 is, is er een perfecte negatieve correlatie; als de correlatiecoëfficiënt +1 is, is er een perfecte positieve correlatie. Anders is er een positieve correlatie tussen de twee variabelen, een negatieve correlatie of geen correlatie. De correlatiecoëfficiënt kan handmatig worden berekend, met gratis online rekenmachines, of met een goede grafische rekenmachine.

Stappen

Methode 1 van 4: De correlatiecoëfficiënt handmatig berekenen

  1. 1 Data verzamelen. Bestudeer deze getallenparen voordat u begint met het berekenen van de correlatiecoëfficiënt. Het is beter om ze op te schrijven in een tabel die verticaal of horizontaal kan worden gerangschikt. Label elke rij of kolom met "x" en "y".
    • Bijvoorbeeld, gegeven vier waardeparen (getallen) van de variabelen "x" en "y". U kunt de volgende tabel maken:
      • x || ja
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Bereken het rekenkundig gemiddelde "x". Om dit te doen, telt u alle x-waarden bij elkaar op en deelt u het resultaat door het aantal waarden.
    • In ons voorbeeld zijn er vier waarden voor de variabele "x". Om het rekenkundig gemiddelde "x" te berekenen, voegt u deze waarden toe en deelt u de som door 4. De berekeningen zijn als volgt geschreven:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ weergavestijl mu _ {x} = 3}
  3. 3 Zoek het rekenkundig gemiddelde "y". Volg hiervoor dezelfde stappen, d.w.z. tel alle y-waarden bij elkaar op en deel de som door het aantal waarden.
    • In ons voorbeeld worden vier waarden van de variabele "y" gegeven. Voeg deze waarden toe en deel de som door 4. De berekeningen worden als volgt geschreven:
    • μja=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μja=16/4{ displaystyle mu _ {y} = 16/4}
    • μja=4{ weergavestijl mu _ {y} = 4}
  4. 4 Bereken de standaarddeviatie "x". Zoek na het berekenen van de gemiddelden van "x" en "y", de standaarddeviaties van deze variabelen. De standaarddeviatie wordt berekend met de volgende formule:
    • σx=1N1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • In ons voorbeeld worden de berekeningen als volgt geschreven:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1.83}
  5. 5 Bereken de standaarddeviatie "y". Volg de stappen die in de vorige stap zijn beschreven. Gebruik dezelfde formule, maar vul de y-waarden in.
    • In ons voorbeeld worden de berekeningen als volgt geschreven:
    • σja=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σja=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σja=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σja=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σja=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Noteer de basisformule voor het berekenen van de correlatiecoëfficiënt. Deze formule bevat de gemiddelden, standaarddeviaties en het aantal (n) getallenparen van beide variabelen. De correlatiecoëfficiënt wordt aangeduid als "r" (in zeldzame gevallen als "ρ"). In dit artikel wordt een formule gebruikt om de Pearson-correlatiecoëfficiënt te berekenen.
    • ρ=(1N1)Σ(xμxσx)(jaμjaσja){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } rechts) * links ({ frac {y- mu _ {y}} { sigma _ {y}}} rechts)}
    • Hier en in andere bronnen kunnen hoeveelheden op verschillende manieren worden aangegeven. Sommige formules bevatten bijvoorbeeld "ρ" en "σ", terwijl andere "r" en "s" bevatten. Sommige leerboeken geven verschillende formules, maar het zijn wiskundige tegenhangers van de bovenstaande formule.
  7. 7 Bereken de correlatiecoëfficiënt. U hebt de gemiddelden en standaarddeviaties van beide variabelen berekend, dus u kunt de formule gebruiken om de correlatiecoëfficiënt te berekenen. Bedenk dat "n" het aantal waardeparen is voor beide variabelen. Andere waarden zijn eerder berekend.
    • In ons voorbeeld worden de berekeningen als volgt geschreven:
    • ρ=(1N1)Σ(xμxσx)(jaμjaσja){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } rechts) * links ({ frac {y- mu _ {y}} { sigma _ {y}}} rechts)}
    • ρ=(13){ displaystyle rho = links ({ frac {1} {3}} rechts) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} rechts) * links ({ frac {3-4} {2.58}} rechts)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ( { frac { 5-3} {1.83}} rechts) * links ({ frac {7-4} {2.58}} rechts)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = links ({ frac {1} {3}} rechts) * 2.965}
    • ρ=(2,9653){ displaystyle rho = links ({ frac {2.965} {3}} rechts)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Analyseer het resultaat. In ons voorbeeld is de correlatiecoëfficiënt 0,988. Deze waarde kenmerkt op de een of andere manier een bepaalde reeks getallenparen. Let op het teken en de grootte van de waarde.
    • Aangezien de waarde van de correlatiecoëfficiënt positief is, is er een positieve correlatie tussen de variabelen "x" en "y". Dat wil zeggen, als de waarde van "x" toeneemt, neemt ook de waarde van "y" toe.
    • Aangezien de waarde van de correlatiecoëfficiënt zeer dicht bij +1 ligt, zijn de waarden van de variabelen "x" en "y" sterk gecorreleerd. Als je punten op het coördinatenvlak plaatst, zullen ze dicht bij een rechte lijn liggen.

Methode 2 van 4: Online rekenmachines gebruiken om de correlatiecoëfficiënt te berekenen

  1. 1 Zoek een rekenmachine op internet om de correlatiecoëfficiënt te berekenen. Deze coëfficiënt wordt vaak berekend in statistieken. Als er veel paren getallen zijn, is het bijna onmogelijk om de correlatiecoëfficiënt handmatig te berekenen. Daarom zijn er online rekenmachines om de correlatiecoëfficiënt te berekenen. Voer in een zoekmachine "correlatiecoëfficiëntcalculator" in (zonder aanhalingstekens).
  2. 2 Gegevens invoeren. Controleer de instructies op de website om de juiste gegevens (nummerparen) in te voeren. Het is absoluut noodzakelijk om de juiste cijferparen in te voeren; anders krijgt u het verkeerde resultaat. Onthoud dat verschillende websites verschillende invoerformaten hebben.
    • Op http://ncalculators.com/statistics/correlation-coefficient-calculator.htm worden bijvoorbeeld de waarden van de variabelen x en y in twee horizontale lijnen ingevoerd. De waarden worden gescheiden door komma's. Dat wil zeggen, in ons voorbeeld worden de waarden "x" als volgt ingevoerd: 1,2,4,5, en de waarden "y" als volgt: 1,3,5,7.
    • Op een andere site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, worden gegevens verticaal ingevoerd; verwar in dit geval de corresponderende getallenparen niet.
  3. 3 Bereken de correlatiecoëfficiënt. Nadat u de gegevens hebt ingevoerd, klikt u eenvoudig op de knop "Berekenen", "Berekenen" of een vergelijkbare knop om het resultaat te krijgen.

Methode 3 van 4: Een grafische rekenmachine gebruiken

  1. 1 Gegevens invoeren. Neem een ​​grafische rekenmachine, ga naar de statistische berekeningsmodus en selecteer de opdracht "Bewerken".
    • Voor verschillende rekenmachines moeten verschillende toetsen worden ingedrukt. Dit artikel bespreekt de Texas Instruments TI-86 rekenmachine.
    • Druk op [2nd] - Stat (boven de + toets) om naar de statistische berekeningsmodus te gaan. Druk vervolgens op F2 - Bewerken.
  2. 2 Verwijder de eerder opgeslagen gegevens. De meeste rekenmachines bewaren de statistieken die u invoert totdat u ze wist. Om te voorkomen dat oude gegevens met nieuwe worden verward, moet u eerst alle opgeslagen informatie verwijderen.
    • Gebruik de pijltoetsen om de cursor te verplaatsen en markeer de kop 'xStat'. Druk vervolgens op Clear en Enter om alle waarden te wissen die in de xStat-kolom zijn ingevoerd.
    • Gebruik de pijltoetsen om de kop 'yStat' te markeren. Druk vervolgens op Wissen en Enter om alle waarden te wissen die in de kolom yStat zijn ingevoerd.
  3. 3 Vul de begingegevens in. Gebruik de pijltoetsen om de cursor naar de eerste cel onder de kop "xStat" te verplaatsen. Voer de eerste waarde in en druk op Enter. Onder aan het scherm wordt "xStat (1) = __" weergegeven, waarbij de ingevoerde waarde een spatie vervangt. Nadat u op Enter heeft gedrukt, verschijnt de ingevoerde waarde in de tabel en gaat de cursor naar de volgende regel; hierdoor wordt "xStat (2) = __" onderaan het scherm weergegeven.
    • Voer alle waarden in voor de variabele "x".
    • Nadat u alle waarden voor x hebt ingevoerd, gebruikt u de pijltoetsen om naar de kolom yStat te navigeren en voert u de waarden voor y in.
    • Nadat u alle cijferparen hebt ingevoerd, drukt u op Exit om het scherm te wissen en de aggregatiemodus te verlaten.
  4. 4 Bereken de correlatiecoëfficiënt. Het karakteriseert hoe dicht de gegevens bij een bepaalde rechte lijn liggen. De grafische rekenmachine kan snel de geschikte rechte lijn bepalen en de correlatiecoëfficiënt berekenen.
    • Klik op Statistiek - Bereken. Druk op de TI-86 op [2nd] - [Stat] - [F1].
    • Selecteer de functie Lineaire regressie. Druk op de TI-86 op [F3] met het label "LinR". Het scherm toont de regel "LinR _" met een knipperende cursor.
    • Voer nu de namen van twee variabelen in: xStat en yStat.
      • Open op de TI-86 de lijst met namen; om dit te doen, drukt u op [2nd] - [List] - [F3].
      • De beschikbare variabelen worden weergegeven op de onderste regel van het scherm. Selecteer [xStat] (u moet hiervoor waarschijnlijk op F1 of F2 drukken), voer een komma in en selecteer vervolgens [yStat].
      • Druk op Enter om de ingevoerde gegevens te verwerken.
  5. 5 Analyseer uw resultaten. Door op Enter te drukken, geeft het scherm de volgende informatie weer:
    • ja=een+Bx{ weergavestijl y = a + bx}: dit is de functie die de lijn beschrijft. Houd er rekening mee dat de functie niet in standaardvorm is geschreven (y = kx + b).
    • een={ weergavestijl a =}... Dit is de y-coördinaat van het snijpunt van de rechte lijn met de y-as.
    • B={ weergavestijl b =}... Dit is de helling van de lijn.
    • corr={ weergavestijl { tekst {corr}} =}... Dit is de correlatiecoëfficiënt.
    • N={ weergavestijl n =}... Dit is het aantal getallenparen dat in de berekeningen is gebruikt.

Methode 4 van 4: Basisconcepten uitleggen

  1. 1 Begrijp het concept van correlatie. Correlatie is de statistische relatie tussen twee grootheden. De correlatiecoëfficiënt is een numerieke waarde die kan worden berekend voor twee datasets. De waarde van de correlatiecoëfficiënt ligt altijd in het bereik van -1 tot +1 en kenmerkt de mate van relatie tussen twee variabelen.
    • Bijvoorbeeld gezien de lengte en leeftijd van kinderen (ongeveer 12 jaar oud). Hoogstwaarschijnlijk zal er een sterke positieve correlatie zijn, omdat kinderen groter worden naarmate ze ouder worden.
    • Een voorbeeld van een negatieve correlatie: strafseconden en tijd besteed aan biatlontraining, dat wil zeggen, hoe meer een atleet traint, hoe minder strafseconden worden toegekend.
    • Ten slotte is er soms heel weinig correlatie (positief of negatief), zoals tussen schoenmaat en wiskundescores.
  2. 2 Onthoud hoe u het rekenkundig gemiddelde berekent. Om het rekenkundig gemiddelde (of gemiddelde) te berekenen, moet u de som van al deze waarden vinden en deze vervolgens delen door het aantal waarden. Onthoud dat het rekenkundig gemiddelde nodig is om de correlatiecoëfficiënt te berekenen.
    • De gemiddelde waarde van een variabele wordt aangegeven door een letter met daarboven een horizontale balk. In het geval van de variabelen "x" en "y" worden hun gemiddelde waarden bijvoorbeeld als volgt aangegeven: x̅ en y̅. Het gemiddelde wordt soms aangeduid met de Griekse letter "μ" (mu). Gebruik de notatie μ . om het rekenkundig gemiddelde van de waarden van de variabele "x" te schrijvenx of μ (x).
    • Bijvoorbeeld, gegeven de volgende waarden voor de variabele "x": 1,2,5,6,9,10. Het rekenkundig gemiddelde van deze waarden wordt als volgt berekend:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5.5}
  3. 3 Let op het belang van de standaarddeviatie. In statistieken kenmerkt de standaarddeviatie de mate waarin getallen verspreid zijn ten opzichte van hun gemiddelde. Als de standaarddeviatie klein is, liggen de getallen dicht bij het gemiddelde; als de standaarddeviatie groot is, liggen de getallen ver van het gemiddelde.
    • Standaarddeviatie wordt aangegeven met de letter "s" of de Griekse letter "σ" (sigma). De standaarddeviatie van de waarden van de variabele "x" wordt dus als volgt aangegeven: sx ofx.
  4. 4 Onthoud het symbool voor de optelbewerking. Het sommatiesymbool is een van de meest voorkomende symbolen in de wiskunde en geeft de som van waarden aan. Dit symbool is de Griekse letter "Σ" (sigma in hoofdletters).
    • Als bijvoorbeeld de volgende waarden van de variabele "x" worden gegeven: 1,2,5,6,9,10, dan betekent Σx:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Tips

  • De correlatiecoëfficiënt wordt soms de "Pearson-correlatiecoëfficiënt" genoemd, naar de ontwikkelaar Carl Pearson.
  • In de meeste gevallen, wanneer de correlatiecoëfficiënt groter is dan 0,8 (positief of negatief), is er een sterke correlatie; als de correlatiecoëfficiënt kleiner is dan 0,5 (positief of negatief), wordt een zwakke correlatie waargenomen.

Waarschuwingen

  • Correlatie kenmerkt de relatie tussen de waarden van twee variabelen. Maar onthoud dat correlatie niets te maken heeft met causaliteit. Als u bijvoorbeeld de lengte en schoenmaat van mensen vergelijkt, vindt u waarschijnlijk een sterke positieve correlatie. Over het algemeen geldt: hoe groter de persoon, hoe groter de schoenmaat. Maar dit betekent niet dat een toename in lengte leidt tot een automatische toename van de schoenmaat, of dat grotere voeten tot snellere groei leiden. Deze hoeveelheden zijn eenvoudig met elkaar verbonden.