Better Investing Tips

Hoe de Winsorized Mean te gebruiken

click fraud protection

Wat is het Winsorized-gemiddelde?

Winsorized mean is een middelingsmethode waarbij in eerste instantie de kleinste en grootste waarden worden vervangen door de waarnemingen die er het dichtst bij liggen. Dit wordt gedaan om het effect van uitbijters of abnormale extreme waarden, of uitschieters, op de berekening te beperken.

Na het vervangen van de waarden, de rekenkundig gemiddelde formule wordt vervolgens gebruikt om het gewinsoriseerde gemiddelde te berekenen.

belangrijkste leerpunten

  • Het gewinsoriseerde gemiddelde is een middelingsmethode waarbij de kleinste en grootste waarden van een gegevensset worden vervangen door de waarnemingen die er het dichtst bij liggen.
  • Het verzacht de effecten van uitbijters door ze te vervangen door minder extreme waarden.
  • Het gewinsoriseerde gemiddelde is niet hetzelfde als het getrimde gemiddelde, wat inhoudt dat gegevenspunten worden verwijderd in plaats van ze te vervangen, hoewel de resultaten van beide meestal dicht bij elkaar liggen.

Formule voor het Winsorized Mean

Winsorized gemiddelde. = x. N. x. N. + 1. + x. N. + 2. x. N. N. waar: N. = Het aantal grootste en kleinste gegevens. punten worden vervangen door de waarneming. het dichtst bij hen. N. = Totaal aantal gegevenspunten. \begin{aligned} &\text{Winsorized Mean}\ =\ \frac{x_{n}\dots x_{n+1}\ +\ x_{n+2}\dots x_{n}}{N}\ \ &\textbf{where:}\\ &\begin{aligned} n\ =\ &\text{Het aantal grootste en kleinste gegevens}\\ &\text{punten die moeten worden vervangen door de waarneming}\\ &\text{het dichtst bij hen}\end{uitgelijnd}\\ &N\ =\ \text{Totaal aantal gegevenspunten} \end{uitgelijnd} Winsorized gemiddelde=NxNxN+1+xN+2xNwaar:N=Het aantal grootste en kleinste gegevenspunten die moeten worden vervangen door de observatiehet dichtst bij henN=Totaal aantal gegevenspunten

Winsorized-gemiddelden worden op twee manieren uitgedrukt. een "kN" Winsorized mean verwijst naar de vervanging van de "k" kleinste en grootste waarnemingen, waarbij "k" een geheel getal is. Een "X%" winsorized gemiddelde houdt in dat een bepaald percentage waarden aan beide uiteinden van de gegevens wordt vervangen.

Het gewinsoriseerde gemiddelde wordt bereikt door de kleinste en grootste gegevenspunten te vervangen, vervolgens alle gegevenspunten op te tellen en de som te delen door het totale aantal gegevenspunten.

Wat vertelt de Winsorized Mean u?

Het gewinsoriseerde gemiddelde is minder gevoelig voor uitbijters omdat het deze kan vervangen door minder extreme waarden. Dat wil zeggen, het is minder gevoelig voor uitbijters ten opzichte van het rekenkundig gemiddelde. Als een distributie echter dikke staarten heeft, zal het effect van het verwijderen van de hoogste en laagste waarden in de distributie weinig invloed hebben vanwege de hoge mate van variabiliteit in de distributie. verdeling figuren.

Een groot nadeel van gewinsoriseerde middelen is dat ze van nature enige vooringenomenheid in de dataset introduceren. Door de invloed van uitbijters te verminderen, wordt de analyse aangepast voor een betere analyse, maar verwijdert ook informatie over de onderliggende data.

Voorbeeld van het gebruik van Winsorized Mean

Laten we het gewinsoriseerde gemiddelde berekenen voor de volgende dataset: 1, 5, 7, 8, 9, 10, 34. In dit voorbeeld nemen we aan dat het gewinsoriseerde gemiddelde in de eerste volgorde staat, waarbij we de kleinste en grootste waarden vervangen door hun dichtstbijzijnde waarnemingen.

De dataset ziet er nu als volgt uit: 5, 5, 7, 8, 9, 10, 10. Het nemen van een rekenkundig gemiddelde van de nieuwe set levert een winsorized gemiddelde van 7,7 op, of (5 + 5 + 7 + 8 + 9 + 10 + 10) gedeeld door 7. Merk op dat het rekenkundig gemiddelde hoger zou zijn geweest: 10,6. Het gewinsoriseerde gemiddelde vermindert effectief de invloed van de 34-waarde als uitbijter.

Of overweeg een 20% winsorized gemiddelde dat de bovenste 10% en de onderste 10% neemt en deze vervangt door hun volgende dichtstbijzijnde waarde. We zullen de volgende dataset winsoriseren: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. De twee kleinste en twee grootste gegevenspunten - 20% van de 20 gegevenspunten - worden vervangen door hun eerstvolgende waarde. De nieuwe dataset is dus als volgt: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Het gewinsoriseerde gemiddelde is 33,9, of het totaal van de gegevens (678) gedeeld door het totale aantal gegevenspunten (20).

Winsorized gemiddelde vs. bijgesneden gemiddelde

Het gewinsoriseerde gemiddelde omvat het wijzigen van gegevenspunten, terwijl de bijgesneden gemiddelde omvat het verwijderen van datapunten. Het is gebruikelijk dat het gewinsoriseerde gemiddelde en het getrimde gemiddelde dicht bij elkaar liggen of soms gelijk zijn aan elkaar.

Boekwaarde per aandeel voor banken: is het een goede maatstaf?

Bankaandelen staan ​​erom bekend dat ze tegen onderstaande prijzen worden verhandeld: Boekwaarde...

Lees verder

Gemeenschappelijke schuld / eigen vermogen-ratio's voor olie- en gasbedrijven

Olie- en gasactiviteiten zijn zeer kapitaalintensief, maar de meeste olie- en gasmaatschappijen h...

Lees verder

Hoe luchtvaartmaatschappijen het effect van terrorisme voelen

Wanneer terroristen toeslaan, zoals tijdens de aanslagen in Parijs in november 2015 en de bomaan...

Lees verder

stories ig