Better Investing Tips

Как да използвате Winsorized Mean

click fraud protection

Какво означава Winsorized?

Уинсоризираната средна стойност е метод за осредняване, който първоначално замества най -малката и най -голямата стойност с най -близките до тях наблюдения. Това се прави, за да се ограничи ефектът от пределните стойности или анормалните екстремни стойности или отклоненията върху изчислението.

След подмяна на стойностите, средноаритметично след това формулата се използва за изчисляване на winsorized средната стойност.

ключови изводи

  • Уинсоризираната средна стойност е метод за усредняване, който включва заместване на най -малката и най -голямата стойност на набор от данни с най -близките до тях наблюдения.
  • Той смекчава ефектите на отклоненията, като ги замества с по -малко екстремни стойности.
  • Уинсоризираното средно не е същото като подрязаното средно, което включва премахване на точки от данни, вместо да ги замествате - въпреки че резултатите от двете са близки.

Формула за Winsorized средна стойност

Уинсоризирано средно. = х. н. х. н. + 1. + х. н. + 2. х. н. Н.

където: н. = Броят на най -големите и най -малките данни. точки, които трябва да бъдат заменени от наблюдението. най -близо до тях. Н. = Общ брой точки от данни. \ start {align} & \ text {Winsorized Mean} \ = \ \ frac {x_ {n} \ dots x_ {n+1} \+\ x_ {n+2} \ dots x_ {n}} {N} \ \ & \ textbf {където:} \\ & \ start {align} n \ = \ & \ text {Броят на най -големите и най -малките данни} \\ & \ text {точки, които да бъдат заменени от наблюдението} \\ & \ text {най -близо до тях} \ end {подравнено} \\ & N \ = \ \ text {Общ брой точки от данни} \ end {align} Уинсоризирано средно=нхнхн+1+хн+2хнкъдето:н=Броят на най -големите и най -малките данниточки, които трябва да бъдат заменени от наблюдениетонай -близо до тяхн=Общ брой точки от данни

Уинсоризираните средства се изразяват по два начина. А "кн"winsorized mean се отнася до заместването на" k "най -малките и най -големите наблюдения, където" k "е цяло число. Уинсоризирано средно "X%" включва заместване на даден процент от стойностите от двата края на данните.

Уинсоризираната средна стойност се постига чрез замяна на най -малката и най -голямата точка от данни, след това сумиране на всички точки от данни и разделяне на сумата на общия брой точки от данни.

Какво ви казва Winsorized?

Уинсоризираната средна стойност е по -малко чувствителна към отклоненията, тъй като може да ги замени с по -малко екстремни стойности. Тоест, тя е по -малко податлива на отклонения спрямо средната аритметична. Въпреки това, ако разпределението има мастни опашки, ефектът от премахването на най -високите и най -ниските стойности в разпределението ще има малко влияние поради високата степен на променливост в разпределение фигури.

Един основен недостатък на winsorized средствата е, че те естествено въвеждат известни пристрастия в набора от данни. Чрез намаляване на влиянието на отклонения, анализът се модифицира за по -добър анализ, но също така премахва информация за основните данни.

Пример за това как да се използва Winsorized Mean

Нека изчислим winsorized средната стойност за следния набор от данни: 1, 5, 7, 8, 9, 10, 34. В този пример, ние приемаме, че уинсоризираната средна стойност е в първия ред, в който заменяме най -малката и най -голямата стойност с най -близките им наблюдения.

Наборът от данни сега се появява, както следва: 5, 5, 7, 8, 9, 10, 10. Вземането на средна аритметична стойност от новия набор води до уинсорифицирана средна стойност от 7,7 или (5 + 5 + 7 + 8 + 9 + 10 + 10), разделена на 7. Имайте предвид, че средната аритметична стойност би била по -висока - 10.6. Уинсоризираното средно ефективно намалява влиянието на 34 -та стойност като външно.

Или помислете за 20% winsorized средно значение, което взема горните 10% и долните 10% и ги заменя със следващата им най -близка стойност. Ще спечелим следния набор от данни: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Двете най -малки и две най -големи точки на данни - 20% от 20 -те точки на данни - ще бъдат заменени със следващата им най -близка стойност. Така новият набор от данни е следният: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Уинсоризираната средна стойност е 33,9 или общата сума на данните (678), разделена на общия брой точки от данни (20).

Winsorized Mean vs. Изрязана средна стойност

Уинсоризираната средна стойност включва модифициране на точки от данни, докато подрязано средно включва премахване на точки от данни. Обичайно е winsorized средното и подрязаното средно да са близки или понякога равни по стойност една на друга.

Как да използваме уравнението Хамада, за да намерим идеалната капиталова структура

Какво е уравнението на Хамада? Уравнението на Хамада е основен метод за анализ на анализиране н...

Прочетете още

Определение на индикатора за MBA в Харвард

Какво е индикатор за МВА в Харвард? Индикаторът за MBA в Харвард е a противоположно дългосрочен...

Прочетете още

Дефиниция с висок минус нисък (HML)

Какво е нисък висок минус (HML)? High Minus Low (HML), наричан още премията за стойност, е един...

Прочетете още

stories ig