Definicja stopni swobody
Jakie są stopnie wolności?
Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, czyli wartości, które mogą się swobodnie zmieniać w próbce danych.
Kluczowe dania na wynos
- Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, czyli wartości, które mogą się swobodnie zmieniać w próbce danych.
- Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystyce, takich jak Chi-Square.
- Obliczanie stopni swobody jest kluczowe, gdy próbujemy zrozumieć znaczenie statystyki Chi-kwadrat i słuszność hipotezy zerowej.
Zrozumienie stopni wolności
Najłatwiejszym sposobem zrozumienia pojęciowego Stopni Wolności jest przykład:
- Rozważmy próbkę danych składającą się, dla uproszczenia, z pięciu dodatnich liczb całkowitych. Wartości mogą być dowolną liczbą bez znanego związku między nimi. Ta próbka danych miałaby teoretycznie pięć stopni swobody.
- Cztery liczby w próbce to {3, 8, 5 i 4}, a średnia całej próbki danych okazuje się wynosić 6.
- To musi oznaczać, że piąta liczba musi wynosić 10. To może być nic innego. Nie może się zmieniać.
- Zatem stopnie swobody dla tej próbki danych wynoszą 4.
Wzór na stopnie swobody jest równy rozmiarowi próbki danych minus jeden:
DF=n−1gdzie:DF=stopnie swobodyn=wielkość próbki
Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystyce, takich jak Chi-Square. Niezbędne jest obliczenie stopni swobody, gdy próbujemy zrozumieć znaczenie statystyki Chi-kwadrat i słuszność hipotezy zerowej.
Testy chi-kwadrat
Istnieją dwa różne rodzaje Testy chi-kwadrat: test niezależności, który zadaje pytanie o związek, takie jak „Czy istnieje związek między płcią a wynikami SAT?”; i test dopasowania, który pyta coś w stylu „Jeśli moneta zostanie rzucona 100 razy, czy 50 razy wypadnie rewersem i 50 razy rewersem?”
W przypadku tych testów wykorzystuje się stopnie swobody do określenia, czy pewna Hipoteza zerowa można odrzucić na podstawie całkowitej liczby zmiennych i próbek w eksperymencie. Na przykład, biorąc pod uwagę uczniów i wybór kursu, próba licząca 30 lub 40 uczniów prawdopodobnie nie jest wystarczająco duża, aby wygenerować istotne dane. Bardziej zasadne jest uzyskanie takich samych lub podobnych wyników z badania na próbie liczącej 400 lub 500 uczniów.
Historia stopni wolności
Najwcześniejsza i najbardziej podstawowa koncepcja Stopni Wolności została odnotowana na początku XIX wieku, wpleciona w prace matematyka i astronoma Carla Friedricha Gaussa. Współczesne użycie i rozumienie tego terminu zostało wyjaśnione po raz pierwszy przez Williama Sealy'ego Gosseta, Anglika statystyk, w artykule „Prawdopodobny błąd środka”, opublikowanym w Biometrice w 1908 roku pod pseudonimem zachować jego anonimowość.
W swoich pismach Gosset nie używał konkretnie terminu „stopnie wolności”. Dał jednak wyjaśnienie koncepcji w trakcie opracowywania tego, co ostatecznie będzie znane jako Studenckie Dystrybucja T. Właściwy termin został spopularyzowany dopiero w 1922 roku. Angielski biolog i statystyk Ronald Fisher zaczął używać terminu „stopnie wolności”, kiedy zaczął publikować raporty i dane na temat swojej pracy nad tworzeniem chi-kwadratów.