Hoe statistische significantie te evalueren

Schrijver: Randy Alexander
Datum Van Creatie: 2 April 2021
Updatedatum: 26 Juni- 2024
Anonim
Hoe betrouwbaar is een online DNA-test?
Video: Hoe betrouwbaar is een online DNA-test?

Inhoud

Het toetsen van hypothesen wordt geleid door statistische analyse. Statistisch significant vertrouwen wordt berekend met behulp van de p-waarde - die de waarschijnlijkheid van een waargenomen resultaat aangeeft wanneer een bepaalde (nulhypothese) waar is. Als de p-waarde kleiner is dan het significantieniveau (meestal 0,05), kan de onderzoeker concluderen dat er voldoende bewijs is om de nulhypothese te weerleggen en de omgekeerde hypothese toe te geven. Met een eenvoudige t-toets kunt u de p-waarde berekenen en de significantie tussen twee verschillende gegevensgroepen bepalen.

Stappen

Deel 1 van 3: Stel uw experimenten op

  1. Bepaal uw hypothese. De eerste stap bij het evalueren van statistische significantie is het identificeren van de vragen die moeten worden beantwoord en het formuleren van uw hypothese. Hypothese is een verklaring van de empirische gegevens en mogelijke discrepanties in de populatie. Elk experiment heeft een nulhypothese en een omgekeerde hypothese. Over het algemeen vergelijk je twee groepen om te zien of ze hetzelfde of verschillend zijn.
    • Over het algemeen is de hypothese niet (H.0) bevestigen dat er geen verschil is tussen de twee groepen gegevens. Voorbeeld: studenten die de stof vóór de les lezen, halen geen betere eindcijfers.
    • De omgekeerde hypothese (H.een) is in strijd met de nulhypothese en is een bewering die u probeert te ondersteunen met uw empirische gegevens. Bijvoorbeeld: studenten die de stof vóór de les lezen, halen zelfs betere eindcijfers.

  2. Selecteer het significantieniveau om de mate van verschil te bepalen die als betekenisvol in de gegevens kan worden beschouwd. Significantieniveau (ook wel alfa genoemd) is de drempel die u kiest om de betekenis te bepalen. Als de p-waarde kleiner is dan of gelijk is aan een bepaald significantieniveau, worden de gegevens als statistisch significant beschouwd.
    • Als algemene regel geldt dat het significantieniveau (of alfa) meestal wordt gekozen op het 0,05-niveau - wat betekent dat de kans om het verschil te zien op de gegevens slechts 5% willekeurig is.
    • Hoe hoger het betrouwbaarheidsniveau (en dus hoe lager de p-waarde), hoe betekenisvoller de resultaten.
    • Als meer vertrouwen vereist is, verlaagt u de p-waarde tot 0,01. Een lage p-waarde wordt in de fabricage vaak gebruikt om productdefecten op te sporen. Hoge betrouwbaarheid is zo belangrijk dat het acceptabel is dat elk onderdeel zal functioneren zoals het hoort.
    • Voor de meeste op hypotheses gebaseerde experimenten is een significantieniveau van 0,05 acceptabel.

  3. Beslis of je een eenzijdige of tweezijdige toets wilt gebruiken. Een van de aannames voor de t-test is dat uw gegevens zich in een normale verdeling bevinden. De normale verdeling vormt een belcurve met het merendeel van de waarnemingen gecentreerd. De t-test is een wiskundige test die controleert of uw gegevens aan de buitenkant van de normale verdeling, boven of onder, in het "bovenste" deel van de curve vallen.
    • Als u niet zeker weet of de gegevens boven of onder de controlegroep liggen, gebruik dan een tweezijdige test. Hiermee kunt u de significantie in beide richtingen controleren.
    • Als u weet wat de verwachte richting van uw gegevens is, gebruik dan een eenzijdige test. In bovenstaand voorbeeld verwacht je dat de scores van de leerling zullen verbeteren. Daarom gebruik je de eenzijdige toets.

  4. Bepaal de steekproefomvang met krachtanalyse. De kracht van een test is het vermogen om het verwachte resultaat te observeren met een bepaalde steekproefomvang. De gemeenschappelijke drempel voor kracht (of β) is 80%. Krachtanalyse kan behoorlijk ingewikkeld zijn zonder enige voorlopige gegevens, omdat u wat informatie nodig hebt over het verwachte gemiddelde tussen de groepen en hun standaarddeviaties. Gebruik online krachtanalyse om de optimale steekproefomvang voor uw gegevens te bepalen.
    • Onderzoekers voeren vaak een kleine premisse-studie uit om de krachtanalyse te informeren en om de steekproefomvang te bepalen die nodig is voor een grote en uitgebreide studie.
    • Als er geen middelen zijn om complex uitgangspuntonderzoek te doen, schat dan het mogelijke gemiddelde op basis van het lezen van artikelen en onderzoek dat andere personen hebben gedaan. Het kan u een goed begin geven bij het bepalen van de steekproefomvang.
    advertentie

Deel 2 van 3: Standaarddeviatie berekenen

  1. Bepaal de formule voor standaarddeviatie. Standaarddeviatie meet de spreiding van de gegevens. Het geeft u informatie over de identiteit van elk gegevenspunt in de steekproef. Wanneer u voor het eerst begint, kunnen vergelijkingen er behoorlijk ingewikkeld uitzien. De onderstaande stappen zullen u echter helpen het berekeningsproces gemakkelijk te begrijpen. De formule is s = √∑ ((xik - µ) / (N - 1)).
    • s is de standaarddeviatie.
    • ∑ geeft aan dat u alle verzamelde observaties moet optellen.
    • Xik elk vertegenwoordigt uw gegevenswaarde.
    • µ is het gemiddelde van de gegevens voor elke groep.
    • N is het totale aantal waarnemingen.
  2. Het gemiddelde van het aantal waarnemingen in elke groep. Om de standaarddeviatie te berekenen, moet u eerst het gemiddelde van de waarnemingen voor elke individuele groep berekenen. Deze waarde wordt gesymboliseerd met de Griekse letter mu of µ. Om dat te doen, voegt u eenvoudig de waarnemingen toe en deelt u deze door het totale aantal waarnemingen.
    • Om bijvoorbeeld de gemiddelde score te vinden van de groep die het materiaal voor de les heeft gelezen, gaan we eens kijken naar enkele gegevens. Voor het gemak gebruiken we een dataset van 5 punten: 90, 91, 85, 83 en 94 (op een schaal van 100 punten).
    • Tel alle waarnemingen bij elkaar op: 90 + 91 + 85 + 83 + 94 = 443.
    • Deel de bovenstaande som door het aantal waarnemingen N (N = 5): 443/5 = 88,6.
    • De gemiddelde score voor deze groep is 88,6.
  3. Trek het gemiddelde van elke waargenomen waarde af. De volgende stap betreft deel (xik - µ) van de vergelijking. Trek de gemiddelde waarde van elke waargenomen waarde af. Met het bovenstaande voorbeeld hebben we vijf aftrekkingen.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) en (94 - 88,6).
    • De berekende waarde is 1,4; 2,4; -3,6; -5.6 en 5.4.
  4. Maak de bovenstaande verschillen vierkant en tel ze op. Elke nieuwe zojuist berekende waarde wordt nu in het kwadraat weergegeven. Hier wordt ook het minteken verwijderd. Als er na deze stap of aan het einde van de berekening een minteken verschijnt, bent u wellicht vergeten de bovenstaande stap uit te voeren.
    • In ons voorbeeld gaan we nu werken met 1.96; 5,76; 12,96; 31.36 en 29.16.
    • Tel deze vierkanten bij elkaar op: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Deel door het totale aantal waarnemingen minus 1. Delen door N - 1 helpt om een ​​berekening te compenseren die niet op de populatie als geheel wordt uitgevoerd, maar is gebaseerd op een steekproef van alle studenten.
    • Trek af: N - 1 = 5 - 1 = 4
    • Delen: 81,2 / 4 = 20,3
  6. Verkrijg de vierkantswortel. Eenmaal gedeeld door het aantal waarnemingen minus 1, neemt u de vierkantswortel van de verkregen waarde. Dit is de laatste stap bij het berekenen van de standaarddeviatie. Sommige statistische programma's helpen u bij het uitvoeren van deze berekening nadat de originele gegevens zijn geïmporteerd.
    • Met het bovenstaande voorbeeld is de standaarddeviatie van het einde-semestercijfer van studenten die het document vóór de les lezen: s = √20,3 = 4,51.
    advertentie

Deel 3 van 3: Bepaling van statistische significantie

  1. Bereken de variantie tussen uw twee groepen observaties. Tot nu toe heeft het voorbeeld slechts één groep observaties behandeld. Om twee groepen te vergelijken, heb je uiteraard gegevens van beide nodig. Bereken de standaarddeviatie van de tweede groep observaties en gebruik deze om de variantie tussen de twee experimentele groepen te berekenen. De formule voor het berekenen van variantie is: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd is het verschil tussen de groepen.
    • S1 is de standaarddeviatie van groepen 1 en N1 is de grootte van groep 1.
    • S2 is de standaarddeviatie van groepen 2 en N2 is de grootte van groep 2.
    • Laten we in ons voorbeeld zeggen dat de gegevens van groep 2 (leerlingen die de tekst niet voor de les hebben gelezen) een grootte hebben van 5 en een standaarddeviatie van 5,81. De variantie is:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Bereken de t-score van de gegevens. Met een t-statistiek kunt u gegevens omzetten in een vorm die vergelijkbaar is met andere gegevens. Met de t-waarde kunt u ook een t-test uitvoeren, een test waarmee u de kans op een statistisch significant verschil tussen de twee groepen kunt berekenen. De formule voor het berekenen van de t-statistiek is: t = (µ1 – µ2) / Sd.
    • µ1 is het gemiddelde van de eerste groep.
    • µ2 is het gemiddelde van de tweede groep.
    • Sd is de variantie tussen de waarnemingen.
    • Gebruik het grotere gemiddelde als µ1 om geen negatieve t-statistiek te krijgen.
    • Stel voor ons voorbeeld dat het waargenomen gemiddelde voor groep 2 (die het vorige artikel niet heeft gelezen) 80 is. De t-score is: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Bepaal de vrijheidsgraad van het monster. Bij gebruik van de t-statistiek worden de vrijheidsgraden bepaald op basis van de steekproefomvang. Tel het aantal waarnemingen voor elke groep bij elkaar op en trek er twee af. In het bovenstaande voorbeeld is de vrijheidsgraad (d.f.) 8 omdat er 5 waarnemingen zijn in de eerste groep en 5 monsters in de tweede groep ((5 + 5) - 2 = 8).
  4. Gebruik tabel t om de significantie te evalueren. Tabellen met t-waarden en vrijheidsgraden zijn te vinden in een standaard statistiekenboek of online. Zoek de rij met de vrijheidsgraden van de gegevens en de p-waarde die overeenkomt met de t-statistiek die je hebt.
    • Bij vrijheidsgraden 8 en t = 2,61 ligt de p-waarde voor een eenzijdige toets tussen 0,01 en 0,025. Aangezien het gekozen significantieniveau kleiner is dan of gelijk is aan 0,05, zijn onze gegevens statistisch significant. Met deze gegevens verwerpen we de nulhypothese en accepteren we de omgekeerde hypothese: studenten die de stof voor de les lezen, hebben hogere eindcijfers.
  5. Overweeg om verder onderzoek te doen. Veel onderzoekers voeren premisse-onderzoeken uit met verschillende statistieken om te begrijpen hoe ze een grotere studie kunnen ontwerpen. Door ander onderzoek te doen met meer statistieken, vergroot u uw vertrouwen in uw conclusies. advertentie

Advies

  • Statistiek is een groot en complex veld. Volg een cursus voor het testen van statistische hypothesen op een middelbare school of universiteit (of hoger) om de statistische significantie te begrijpen.

Waarschuwing

  • Deze analyse richt zich op de t-test om het verschil tussen de twee normale distributiepopulaties te controleren. Afhankelijk van de complexiteit van de gegevens, heeft u mogelijk nog een statistische test nodig.