Frihedsgrader Definition
Hvad er frihedsgrader?
Frihedsgrader refererer til det maksimale antal logisk uafhængige værdier, som er værdier, der har frihed til at variere, i dataprøven.
Vigtige takeaways
- Frihedsgrader refererer til det maksimale antal logisk uafhængige værdier, som er værdier, der har frihed til at variere, i dataprøven.
- Frihedsgrader diskuteres almindeligvis i forbindelse med forskellige former for hypotesetest i statistik, såsom en Chi-Square.
- Beregning af frihedsgrader er nøglen, når man forsøger at forstå vigtigheden af en Chi-Square-statistik og gyldigheden af nulhypotesen.
Forstå frihedsgrader
Den letteste måde at forstå frihedsgrader konceptuelt er gennem et eksempel:
- Overvej en dataprøve, der for enkelthedens skyld består af fem positive heltal. Værdierne kan være et hvilket som helst tal uden noget kendt forhold mellem dem. Denne dataprøve ville teoretisk set have fem frihedsgrader.
- Fire af tallene i prøven er {3, 8, 5 og 4}, og gennemsnittet af hele dataprøven afsløres at være 6.
- Dette må betyde, at det femte tal skal være 10. Det kan ikke være andet. Det har ikke frihed til at variere.
- Så frihedsgraderne for denne dataprøve er 4.
Formlen for frihedsgrader er lig med størrelsen på dataprøven minus en:
Df=N−1hvor:Df=grader af frihedN=prøve størrelse
Frihedsgrader diskuteres almindeligvis i forbindelse med forskellige former for hypotesetest i statistik, såsom en Chi-Square. Det er vigtigt at beregne frihedsgrader, når man forsøger at forstå vigtigheden af en Chi-Square-statistik og nulhypotesens validitet.
Chi-Square test
Der er to forskellige slags Chi-Square tests: uafhængighedstesten, der stiller et spørgsmål om forholdet, f.eks. "Er der et forhold mellem køn og SAT -score?"; og godhedstilpasningstest, der spørger noget i retning af "Hvis en mønt bliver kastet 100 gange, vil den så komme op 50 gange og haler 50 gange?"
Til disse tests bruges frihedsgrader til at afgøre, om en bestemt nulhypotesen kan afvises baseret på det samlede antal variabler og prøver inden for eksperimentet. For eksempel, når man overvejer studerende og valg af kursus, er en stikprøvestørrelse på 30 eller 40 elever sandsynligvis ikke stor nok til at generere betydelige data. At få de samme eller lignende resultater fra en undersøgelse ved hjælp af en stikprøvestørrelse på 400 eller 500 elever er mere gyldig.
Frihedsgraders historie
Det tidligste og mest grundlæggende begreb om frihedsgrader blev noteret i begyndelsen af 1800 -tallet, sammenflettet i matematiker og astronom Carl Friedrich Gauss værker. Den moderne brug og forståelse af udtrykket blev først beskrevet af William Sealy Gosset, en englænder statistiker, i sin artikel "The Probable Error of a Mean", udgivet i Biometrika i 1908 under et pseudonym for at bevare hans anonymitet.
I sine skrifter brugte Gosset ikke specifikt udtrykket "frihedsgrader". Han gav dog en forklaring på konceptet i løbet af udviklingen af det, der i sidste ende ville blive kendt som Studerende T-distribution. Det egentlige udtryk blev først populært i 1922. Den engelske biolog og statistiker Ronald Fisher begyndte at bruge udtrykket "frihedsgrader", da han begyndte at udgive rapporter og data om sit arbejde med at udvikle chi-firkanter.