Определение степеней свободы
Что такое степени свободы?
Степени свободы относятся к максимальному количеству логически независимых значений, которые могут изменяться в выборке данных.
Ключевые выводы
- Степени свободы относятся к максимальному количеству логически независимых значений, которые могут изменяться в выборке данных.
- Степени свободы обычно обсуждаются в связи с различными формами проверки гипотез в статистике, такими как хи-квадрат.
- Расчет степеней свободы является ключевым при попытке понять важность статистики хи-квадрат и обоснованность нулевой гипотезы.
Понимание степеней свободы
Самый простой способ концептуально понять Степени свободы - это на примере:
- Рассмотрим образец данных, состоящий для простоты из пяти положительных целых чисел. Значения могут быть любым числом без известной связи между ними. Эта выборка данных теоретически должна иметь пять степеней свободы.
- Четыре числа в выборке - это {3, 8, 5 и 4}, а среднее значение всей выборки данных равно 6.
- Это должно означать, что пятое число должно быть 10. Иначе быть не может. У него нет свободы варьироваться.
- Таким образом, степень свободы для этой выборки данных равна 4.
Формула для степеней свободы равна размеру выборки данных минус один:
Dж=N−1куда:Dж=степени свободыN=размер образца
Степени свободы обычно обсуждаются в связи с различными формами проверки гипотез в статистике, такими как хи-квадрат. Очень важно рассчитать степени свободы, когда вы пытаетесь понять важность статистики хи-квадрат и обоснованность нулевой гипотезы.
Хи-квадрат тесты
Есть два разных вида Хи-квадрат тесты: тест на независимость, который задает вопрос о взаимоотношениях, например: «Есть ли связь между полом и результатами SAT?»; и критерий согласия, который спрашивает что-то вроде "Если монета подброшена 100 раз, выпадет ли 50 раз орел и 50 раз?"
Для этих тестов используются степени свободы, чтобы определить, нулевая гипотеза могут быть отклонены на основании общего количества переменных и выборок в эксперименте. Например, при рассмотрении студентов и выбора курса размер выборки из 30 или 40 студентов, вероятно, недостаточно велик для получения значимых данных. Получение таких же или аналогичных результатов в исследовании с использованием выборки из 400 или 500 студентов более актуально.
История степеней свободы
Самая ранняя и основная концепция степеней свободы была отмечена в начале 1800-х годов, переплетаясь в трудах математика и астронома Карла Фридриха Гаусса. Современное использование и понимание этого термина были впервые изложены Уильямом Сили Госсетом, англичанином. статистик в своей статье «Вероятная ошибка среднего», опубликованной в журнале Biometrika в 1908 году под псевдонимом, чтобы сохранить его анонимность.
В своих работах Госсет не использовал конкретно термин «степени свободы». Однако он дал объяснение концепции в ходе разработки того, что в конечном итоге станет известно как Студенты Т-распределение. Фактический термин не был популярен до 1922 года. Английский биолог и статистик Рональд Фишер начал использовать термин «степени свободы», когда начал публиковать отчеты и данные о своей работе по разработке хи-квадратов.