Better Investing Tips

Hur man använder Winsorized Mean

click fraud protection

Vad är det Winsorized betyder?

Winsorized mean är en medelvärdesmetod som initialt ersätter de minsta och största värdena med observationerna närmast dem. Detta görs för att begränsa effekten av avvikelser eller onormala extrema värden eller avvikelser på beräkningen.

Efter att värdena har bytts ut visas aritmetiskt medelvärde formel används sedan för att beräkna medelvärdet för vinst.

viktiga takeaways

  • Det winsoriserade medelvärdet är en medelvärdesmetod som innebär att de minsta och största värdena i en datamängd ersätts med observationerna närmast dem.
  • Det mildrar effekterna av avvikare genom att ersätta dem med mindre extrema värden.
  • Vinstvärdet är inte detsamma som det trimmade medelvärdet, vilket innebär att man tar bort datapunkter i stället för att ersätta dem - även om resultaten från de två tenderar att vara nära.

Formel för Winsorized Mean

Winsorized Mean. = x. n. x. n. + 1. + x. n. + 2. x. n. N. var: n. = Antalet största och minsta data. punkter som ska ersättas av observationen. närmast dem. N. = Totalt antal datapunkter.

\ begin {align} & \ text {Winsorized Mean} \ = \ \ frac {x_ {n} \ dots x_ {n+1} \+\ x_ {n+2} \ dots x_ {n}} {N} \ \ & \ textbf {där:} \\ & \ börja {justerat} n \ = \ & \ text {Antalet största och minsta data} \\ & \ text {punkter som ska ersättas av observationen} \\ & \ text {närmast dem} \ end {align} \\ & N \ = \ \ text {Totalt antal datapunkter} \ end {align} Winsorized Mean=Nxnxn+1+xn+2xnvar:n=Antalet största och minsta datapunkter som ska ersättas av observationennärmast demN=Totalt antal datapunkter

Winsorized -medel uttrycks på två sätt. A "kn"winsoriserat medelvärde avser ersättning av" k "minsta och största observationer, där" k "är ett heltal. Ett "X%" winsoriserat medelvärde innebär att en given procentandel värden ersätts från båda ändarna av data.

Vinstvärdet uppnås genom att ersätta de minsta och största datapunkterna, sedan summera alla datapunkter och dela summan med det totala antalet datapunkter.

Vad säger Winsorized Mean dig?

Det winsoriserade medelvärdet är mindre känsligt för outliers eftersom det kan ersätta dem med mindre extrema värden. Det vill säga, det är mindre mottagligt för outliers jämfört med det aritmetiska genomsnittet. Men om en distribution har fettsvansar kommer effekten av att ta bort de högsta och lägsta värdena i fördelningen att ha liten påverkan på grund av den höga variationen i distribution siffror.

En stor nackdel för winsoriserade medel är att de naturligtvis introducerar viss fördom i datamängden. Genom att minska påverkan av avvikare ändras analysen för bättre analys, men tar också bort information om den underliggande informationen.

Exempel på hur man använder Winsorized Mean

Låt oss beräkna det medelvärde som används för följande datamängd: 1, 5, 7, 8, 9, 10, 34. I det här exemplet antar vi att det vinnande medelvärdet är i första ordningen, där vi ersätter de minsta och största värdena med sina närmaste observationer.

Datauppsättningen visas nu enligt följande: 5, 5, 7, 8, 9, 10, 10. Att ta ett aritmetiskt medelvärde för den nya uppsättningen ger ett vinstmedelvärde på 7,7, eller (5 + 5 + 7 + 8 + 9 + 10 + 10) dividerat med 7. Observera att det aritmetiska medelvärdet skulle ha varit högre - 10,6. Det winsoriserade medelvärdet minskar effektivt påverkan av 34 -värdet som en outlier.

Eller överväga ett 20% vinstsoriserat medelvärde som tar de 10% och nedre 10% och ersätter dem med deras närmaste värde. Vi kommer att vinna följande datamängd: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. De två minsta och två största datapunkterna - 20% av de 20 datapunkterna - kommer att ersättas med deras närmaste värde. Således är den nya datamängden följande: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Vinstvärdet är 33,9, eller summan av data (678) dividerat med det totala antalet datapunkter (20).

Winsorized Mean vs. Trimmad medelvärde

Det winsoriserade medelvärdet inkluderar modifiering av datapunkter, medan trimmat medelvärde innebär att ta bort datapunkter. Det är vanligt att det genomsnittliga och det trimmade medelvärdet är nära eller ibland lika i värde med varandra.

Hur man använder Enterprise Value för att jämföra företag

Företagsvärde (EV) är en indikator på hur marknaden tillskriver värde till ett företag som helhet...

Läs mer

Hur kan jag använda börsvärde för att utvärdera en aktie?

Börsvärde är en användbar siffra att undersöka när man försöker förstå ett företags struktur och...

Läs mer

Due Diligence i 10 enkla steg

Due diligence definieras som en undersökning av en potentiell investering (t.ex. stock) eller pro...

Läs mer

stories ig