Визначення ступенів свободи
Що таке ступені свободи?
Ступені свободи відноситься до максимальної кількості логічно незалежних значень, які є значеннями, які мають право змінюватись, у вибірці даних.
Ключові висновки
- Ступені свободи відноситься до максимальної кількості логічно незалежних значень, які є значеннями, які мають право змінюватись, у вибірці даних.
- Ступені свободи зазвичай обговорюються стосовно різних форм перевірки гіпотез у статистиці, таких як квадрат Chi.
- Розрахунок ступенів свободи є ключовим, коли намагаємося зрозуміти важливість статистики Хі-квадрата та справедливість нульової гіпотези.
Розуміння ступенів свободи
Найпростіший спосіб зрозуміти ступінь свободи концептуально - це на прикладі:
- Для простоти розглянемо вибірку даних, що складається з п’яти натуральних чисел. Значеннями може бути будь -яке число без відомого зв’язку між ними. Теоретично ця вибірка даних мала б п’ять ступенів свободи.
- Чотири числа у вибірці - {3, 8, 5 і 4}, а середнє значення всієї вибірки даних виявилося 6.
- Це має означати, що п’яте число має бути 10. Це не може бути нічим іншим. Вона не має свободи змінюватись.
- Отже, ступені свободи для цієї вибірки даних складають 4.
Формула ступенів свободи дорівнює розміру вибірки даних мінус один:
Df=N−1де:Df=ступеня свободиN=обсяг вибірки
Ступені свободи зазвичай обговорюються стосовно різних форм перевірки гіпотез у статистиці, таких як квадрат Chi. Під час спроби зрозуміти важливість статистики Хі-квадрата та справедливість нульової гіпотези важливо обчислити ступінь свободи.
Тести Chi-Square
Існує два різних види Тести Chi-Square: тест на незалежність, який задає питання про взаємозв’язок, наприклад, «Чи існує зв’язок між статтю та балами SAT?»; та тест на придатність, який запитує щось на кшталт "Якщо монету підкинути 100 разів, вона 50 разів підніметься вгору і 50 разів у хвости?"
Для цих тестів ступінь свободи використовується для визначення того, чи є певна нульова гіпотеза можуть бути відхилені на основі загальної кількості змінних та вибірок у межах експерименту. Наприклад, при розгляді студентів та вибору курсу розмір вибірки 30 або 40 студентів, ймовірно, не є достатньо великим для створення значних даних. Отримання тих самих або подібних результатів дослідження за допомогою вибірки 400 або 500 студентів є більш обґрунтованим.
Історія ступенів свободи
Найдавніша і найосновніша концепція ступенів свободи була відзначена на початку 1800 -х років, переплітаючись у працях математика та астронома Карла Фрідріха Гаусса. Сучасне вживання та розуміння цього терміну було викладено спочатку англійцем Вільямом Сілі Госсетом статистик у своїй статті "Імовірна помилка середнього показника", опублікованій у Biometrika в 1908 р. під псевдонімом для збереження його анонімність.
У своїх працях Госсет спеціально не вживав терміну «ступені свободи». Однак він дав пояснення концепції протягом усього розвитку того, що в кінцевому підсумку стане відомим Студентські Т-розподіл. Фактичний термін став популярним лише в 1922 році. Англійський біолог і статистик Рональд Фішер почав вживати термін "Ступені свободи", коли почав публікувати звіти та дані про свою роботу, розробляючи хі-квадрати.