Better Investing Tips

Jak funguje distribuce vzorkování

click fraud protection

Co je distribuce vzorkování?

Distribuce vzorkování je a rozdělení pravděpodobnosti statistiky získané z většího počtu vzorků odebraných z konkrétní populace. Distribuce vzorkování dané populace je distribucí frekvencí řady různých výsledků, které by mohly nastat pro statistiku populace.

statistika„Populace je celý fond, ze kterého statistika vzorek je nakreslena. Populace se může vztahovat na celou skupinu lidí, předmětů, událostí, návštěv nemocnice nebo měření. O populaci lze tedy říci, že je souhrnným pozorováním subjektů seskupených podle společného rysu.

  • Distribuce vzorkování je statistika, která vychází z opakovaného vzorkování z větší populace.
  • Popisuje řadu možných výsledků statistik, jako je průměr nebo způsob nějaké proměnné, protože skutečně existuje v populaci.
  • Většina dat analyzovaných výzkumnými pracovníky pochází ve skutečnosti ze vzorků, a nikoli z populací.

Pochopení distribuce vzorkování

Hodně data kreslí a používají akademici, statistici, výzkumníci, obchodníci, analytici atd. jsou ve skutečnosti vzorky, nikoli populace. Ukázka je podmnožinou populace. Například lékařský výzkumník, který chtěl porovnat průměrnou hmotnost všech dětí narozených v Severní Americe od roku 1995 do roku 2005 s těmi narozenými v Jižní Americe v rámci stejné časové období nemůže v rozumném čase čerpat data pro celou populaci více než milionu porodů, které proběhly v desetiletém časovém rámci. Místo toho použije k závěru pouze váhu řekněme 100 dětí na každém kontinentu. Hmotnost 200 použitých dětí je vzorek a průměrná vypočtená hmotnost je průměrem vzorku.

Předpokládejme nyní, že místo odebrání pouze jednoho vzorku 100 novorozeneckých hmotností z každého kontinentu, lékařského výzkumník odebere opakované náhodné vzorky z obecné populace a vypočítá průměr vzorku pro každý vzorek skupina. Takže pro Severní Ameriku získává údaje o 100 hmotnostech novorozenců zaznamenaných v USA, Kanadě a Mexiku takto: čtyři 100 vzorků z vybraných nemocnice v USA, pět 70 vzorků z Kanady a tři 150 záznamů z Mexika, celkem 1200 hmotností novorozenců seskupených do 12 sady. Shromažďuje také ukázková data 100 porodních hmotností z každé z 12 zemí Jižní Ameriky.

Každý vzorek má svůj vlastní průměr vzorku a distribuce prostředku výběru vzorku je známá jako distribuce vzorku.

Průměrná hmotnost vypočítaná pro každou sadu vzorků je distribucí vzorkování průměru. Ze vzorku lze vypočítat nejen průměr. Další statistiky, jako je standardní odchylka, rozptyl, poměr a rozsah, lze vypočítat ze vzorových dat. Směrodatná odchylka a rozptyl měří variabilitu distribuce vzorkování.

Variabilitu distribuce vzorkování určuje počet pozorování v populaci, počet pozorování ve vzorku a postup použitý pro kreslení sad vzorků. Standardní odchylka distribuce vzorkování se nazývá standardní chyba. Zatímco průměr distribuce vzorkování je stejný jako průměr populace, standardní chyba závisí na standardní odchylce populace, velikosti populace a velikosti souboru vzorek.

Vědět, jak oddělený je průměr každého ze souborů vzorků od sebe navzájem a od průměru populace, bude ukazovat, jak blízko je průměr vzorku k průměru populace. Standardní chyba distribuce vzorkování klesá s rostoucí velikostí vzorku.

Zvláštní úvahy

Populace nebo jedna ukázková sada čísel bude mít normální rozdělení. Protože však distribuce vzorkování zahrnuje více sad pozorování, nemusí mít nutně a zakřivený tvar.

Podle našeho příkladu má průměrná hmotnost populace dětí v Severní Americe a Jižní Americe normální rozdělení, protože některá děti budou mít podváhu (pod průměrem) nebo nadváhu (nad průměrem), přičemž většina dětí spadne mezi (kolem průměru). Pokud je průměrná hmotnost novorozenců v Severní Americe sedm liber, průměrná hmotnost vzorku v každém z nich z 12 sad pozorování vzorků zaznamenaných pro Severní Ameriku bude téměř sedm liber jako studna.

Pokud však vytvoříte graf každého z průměrů vypočtených v každé z 1 200 skupin vzorků, výsledný tvar může výsledkem je rovnoměrné rozdělení, ale je obtížné s jistotou předpovědět, k čemu se skutečný tvar ukáže být. Čím více vzorků výzkumník použije z populace s více než milionem hmotnostních čísel, tím více graf začne vytvářet normální rozdělení.

4 odvětví, v nichž roboti znamenají revoluci

Robotika přinesla revoluci ve světě ve dvou odlišných fázích. První fáze přinesla elektrické str...

Přečtěte si více

Investice do zdravotnictví

The zdravotnictví se skládá z mnoha různých průmyslových odvětví - od farmaceutik a zařízení až ...

Přečtěte si více

Definice nákladů na získání provozu (TAC)

Co jsou náklady na získání provozu (TAC)? Náklady na získání provozu (TAC) se skládají z plateb...

Přečtěte si více

stories ig