„Excel“ dispersija: kaip apskaičiuoti
Dispersija yra skirtumo tarp skaičių duomenų rinkinyje matavimas. Dispersija matuoja, kiek kiekvienas rinkinio numeris yra nuo reiškia.
Naudodami duomenų rinkinio diagramą galime stebėti, koks yra tiesinis įvairių duomenų taškų arba skaičių santykis. Mes tai darome piešdami a regresija linija, kuri bando sumažinti bet kurio atskiro duomenų taško atstumą nuo pačios linijos. Žemiau esančioje diagramoje duomenų taškai yra mėlyni taškai, oranžinė - regresijos linija, o raudonos rodyklės - atstumas nuo stebimų duomenų ir regresijos linijos.
Skaičiuodami dispersiją, atsižvelgiant į visų šių duomenų taškų ryšį, mes klausiame, kokio atstumo mes tikimės Kitas duomenų tašką? Šis „atstumas“ vadinamas klaidos terminas, ir tai matuoja dispersiją.
Skirtumas savaime nėra dažnai naudingas, nes neturi vieneto, todėl sunku jį išmatuoti ir palyginti. Tačiau dispersinė kvadratinė šaknis yra standartinis nuokrypis, ir tai yra praktiška kaip matavimas.
„Excel“ dispersijos apskaičiavimas
„Excel“ dispersiją lengva apskaičiuoti, jei duomenų rinkinį jau įvedėte į programinę įrangą. Žemiau pateiktame pavyzdyje apskaičiuosime 20 dienų dienos dispersiją grįžta itin populiariame biržos fondas (ETF) pavadintas SPY, kuris investuoja į S&P 500.
- Formulė yra = VAR.S (pasirinkite duomenis)
Priežastis, kodėl norite naudoti VAR.S, o ne VAR.P (kuri yra dar viena siūloma formulė), yra ta, kad dažnai neturite visos duomenų populiacijos, kurią reikia įvertinti. Pavyzdžiui, jei savo lentelėje turėtume visas SPY ETF grąžinimo istorijas, galėtume naudoti populiaciją matavimo VAR.P, bet kadangi mes matuojame tik paskutines 20 dienų, kad iliustruotume koncepciją, mes naudosime VAR.S.
Kaip matote, apskaičiuota 0,000018674 dispersijos vertė mums mažai ką pasako apie duomenų rinkinį. Jei pereitume prie kvadratinės šaknies, kad gautume standartinį grąžos nuokrypį, tai būtų naudingiau.