Definice stupňů svobody
Co jsou stupně svobody?
Stupně volnosti se vztahují k maximálnímu počtu logicky nezávislých hodnot, což jsou hodnoty, které se mohou volně měnit, ve vzorku dat.
Klíčové informace
- Stupně volnosti se vztahují k maximálnímu počtu logicky nezávislých hodnot, což jsou hodnoty, které se mohou volně měnit, ve vzorku dat.
- Stupně svobody jsou běžně diskutovány ve vztahu k různým formám testování hypotéz ve statistikách, jako je například Chi-Square.
- Výpočet stupňů svobody je klíčový, když se pokoušíte porozumět důležitosti statistiky Chi-Square a platnosti nulové hypotézy.
Pochopení stupňů svobody
Nejjednodušší způsob, jak koncepčně porozumět stupňům svobody, je na příkladu:
- Zvažte vzorek dat, který se pro jednoduchost skládá z pěti kladných celých čísel. Hodnotami může být libovolné číslo bez známého vztahu mezi nimi. Tento vzorek dat by teoreticky měl pět stupňů volnosti.
- Čtyři z čísel ve vzorku jsou {3, 8, 5 a 4} a průměr celého vzorku dat je odhalen na 6.
- To musí znamenat, že páté číslo musí být 10. Nemůže to být nic jiného. Nemá žádnou svobodu se měnit.
- Stupně svobody pro tento vzorek dat jsou tedy 4.
Vzorec pro Stupně svobody se rovná velikosti vzorku dat minus jeden:
DF=N.−1kde:DF=stupně svobodyN.=velikost vzorku
Stupně svobody jsou běžně diskutovány ve vztahu k různým formám testování hypotéz ve statistikách, jako je například Chi-Square. Při pokusu porozumět důležitosti statistiky Chi-Square a platnosti nulové hypotézy je nezbytné vypočítat stupně volnosti.
Chi-Square testy
Existují dva různé druhy Chi-Square testy: test nezávislosti, který pokládá otázku vztahu, například: „Existuje vztah mezi pohlavím a skóre SAT?“; a test dobroty, který se ptá na něco jako „Když se mincí hodí 100krát, padne 50krát do hlavy a 50krát do ocasu?“
Pro tyto testy se používají stupně volnosti k určení, zda určitý nulová hypotéza lze odmítnout na základě celkového počtu proměnných a vzorků v rámci experimentu. Například při zvažování studentů a výběru kurzu velikost vzorku 30 nebo 40 studentů pravděpodobně není dostatečně velká na to, aby generovala významná data. Získání stejných nebo podobných výsledků ze studie s použitím velikosti vzorku 400 nebo 500 studentů je platnější.
Historie stupňů svobody
Nejranější a nejzákladnější koncept stupňů svobody byl zaznamenán na počátku 19. století, propletený v pracích matematika a astronoma Carla Friedricha Gausse. Moderní použití a porozumění tomuto pojmu vysvětlil nejprve William Sealy Gosset, Angličan statistik, ve svém článku „Pravděpodobná chyba střední hodnoty“, publikovaném v Biometrika v roce 1908 pod pseudonymem pro zachování jeho anonymita.
Ve svých spisech Gosset výslovně nepoužíval výraz „Stupně svobody“. Dal však vysvětlení konceptu v průběhu vývoje toho, čemu by se nakonec říkalo Studentské T-distribuce. Skutečný termín nebyl populární až do roku 1922. Anglický biolog a statistik Ronald Fisher začal používat termín „Stupně svobody“, když začal publikovat zprávy a data o své práci na vývoji chi-square.