Better Investing Tips

Kaip veikia neparametrinė statistika

click fraud protection

Kas yra neparametrinė statistika?

Neparametrinė statistika reiškia statistinį metodą, kurio metu nėra manoma, kad duomenys gaunami iš nustatytų modelių, kuriuos lemia nedidelis parametrų skaičius; tokių modelių pavyzdžiai yra normaliojo pasiskirstymo modelis ir linijinės regresijos modelis. Neparametrinėje statistikoje kartais naudojami eiliniai duomenys, tai reiškia, kad jie remiasi ne skaičiais, o reitingu ar rūšiavimo tvarka. Pavyzdžiui, apklausa, kurioje pateikiami vartotojų pageidavimai, pradedant nuo nemėgstamų ir nemėgstančių, būtų laikomi eiliniais duomenimis.

Neparametrinė statistika apima neparametrinę aprašomoji statistika, statistiniai modeliai, išvados ir statistiniai testai. Neparametrinių modelių modelio struktūra nenurodyta a priori bet vietoj to nustatoma pagal duomenis. Terminas neparametrinis Tai nereiškia, kad tokiems modeliams visiškai trūksta parametrų, o tai, kad parametrų skaičius ir pobūdis yra lankstūs ir nėra iš anksto nustatyti. Histograma yra neparametrinio tikimybės pasiskirstymo įvertinimo pavyzdys.

Pagrindiniai išsinešimai

  • Neparametrinę statistiką lengva naudoti, tačiau ji nesuteikia tikslaus kitų statistinių modelių tikslumo.
  • Tokio tipo analizė dažnai geriausiai tinka svarstant kažko eiliškumą, kai, net jei skaitmeniniai duomenys pasikeičia, rezultatai greičiausiai nesikeis.

Nepaprastosios statistikos supratimas

Statistikoje parametrinė statistika apima tokius parametrus kaip vidurkis, standartinis nuokrypis, Pearsono koreliacija, dispersija ir kt. Ši statistikos forma naudoja stebimus duomenis, kad įvertintų pasiskirstymo parametrus. Pagal parametrinę statistiką dažnai manoma, kad duomenys gaunami iš normalaus pasiskirstymo, kurio parametrai μ (populiacijos vidurkis) ir σ2 (populiacijos dispersija), kurie vėliau įvertinami naudojant imties vidurkį ir imtį dispersija.

Neparametrinė statistika nedaro prielaidų apie imties dydį arba tai, ar stebimi duomenys yra kiekybiniai.

Neparametrinė statistika nereiškia, kad duomenys yra paimti iš normalaus skirstinio. Vietoj to, pasiskirstymo forma įvertinama pagal šią statistinio matavimo formą. Nors yra daug situacijų, kai galima daryti prielaidą, kad pasiskirstymas yra normalus, taip pat yra keletas scenarijų, kai tikrasis duomenų generavimo procesas toli gražu nėra normaliai paskirstytas.

Neparametrinės statistikos pavyzdžiai

Pirmajame pavyzdyje apsvarstykite finansų analitiką, kuris nori įvertinti investicijos rizikos vertę (VaR). Analitikas renka pajamų duomenis iš 100 panašių investicijų per panašų laikotarpį. Užuot manęs, kad pajamos pasiskirsto normaliai, ji naudoja histogramą, kad įvertintų pasiskirstymą neparametriškai. 5 -asis šios histogramos procentilis analitikui pateikia neparametrinį VaR įvertinimą.

Antrame pavyzdyje apsvarstykite kitą tyrėją, kuris nori sužinoti, ar vidutinės miego valandos yra susijusios su tuo, kaip dažnai žmogus serga. Kadangi daugelis žmonių suserga retai, jei išvis, o kartais kiti suserga kur kas dažniau nei dauguma kitų atveju ligų dažnio pasiskirstymas yra aiškiai nenormalus, yra iškraipytas ir linkę į pašalinius. Taigi, o ne naudoti metodą, kuris numato normalų ligos dažnio pasiskirstymą, kaip tai daroma klasikinėje regresijos analizė, pavyzdžiui, tyrėjas nusprendžia naudoti neparametrinį metodą, pvz., kvantiliąją regresiją analizė.

Specialios aplinkybės

Neparametrinė statistika buvo įvertinta dėl jų naudojimo paprastumo. Kai sumažėja parametrų poreikis, duomenys tampa labiau pritaikomi įvairiems bandymams. Šio tipo statistika gali būti naudojama be vidurkio, imties dydžio, standartinio nuokrypio ar kitų susijusių parametrų įvertinimo, kai tokios informacijos nėra.

Kadangi neparametrinė statistika daro mažiau prielaidų apie imties duomenis, jos taikymas yra platesnis nei parametrų statistika. Tais atvejais, kai parametriniai bandymai yra tinkamesni, neparametriniai metodai bus mažiau veiksmingi. Taip yra todėl, kad neparametrinė statistika atmeta tam tikrą informaciją, kuri yra prieinama duomenyse, skirtingai nei parametrinė statistika.

„Make-to-Assemble“-MTA apibrėžimas

Kas yra surinkimas? „Make-to-surinkti“ arba „MTA“ strategija yra gamybos gamybos strategija, ka...

Skaityti daugiau

Kapitalo turto kainodaros modelio (CAPM) paaiškinimas

Kad ir kiek diversifikuotumėte savo investicijas, tam tikras rizikos lygis visada egzistuoja. Ta...

Skaityti daugiau

Kas yra lyginamas sandoris?

Kas yra lyginamas sandoris? Palyginamo sandorio kaina yra vienas iš pagrindinių veiksnių vertin...

Skaityti daugiau

stories ig