Better Investing Tips

Variation Inflation Factor (VIF) Definition

click fraud protection

Hvad er en variationsinflationsfaktor (VIF)?

Variationsinflationsfaktor (VIF) er et mål for mængden af multicollinearitet i et sæt med flere regression variabler. Matematisk er VIF for en regressionsmodelvariabel lig med forholdet mellem den overordnede model varians til variansen af ​​en model, der kun indeholder den enkelte uafhængige variabel. Dette forhold beregnes for hver uafhængige variabel. En høj VIF angiver, at den associerede uafhængige variabel er meget kollinær med de andre variabler i modellen.

Vigtige takeaways

  • En variansinflationsfaktor (VIF) giver et mål for multikollinearitet blandt de uafhængige variabler i en multipel regressionsmodel.
  • Det er vigtigt at opdage multicollinearitet, for selvom multicollinearity ikke reducerer modellens forklaringskraft, reducerer det den statistiske signifikans af de uafhængige variabler.
  • En stor variansinflationsfaktor (VIF) på en uafhængig variabel indikerer et stærkt kollinært forhold til andre variabler, der bør overvejes eller justeres for i modellens struktur og valg af uafhængige variabler.

Forståelse af en variationsinflationsfaktor (VIF)

En variansinflationsfaktor er et værktøj til at hjælpe med at identificere graden af ​​multikollinearitet. En multipel regression bruges, når en person ønsker at teste effekten af ​​flere variabler på et bestemt resultat. Den afhængige variabel er det resultat, der bliver påvirket af de uafhængige variabler - input til modellen. Multikollinearitet eksisterer, når der er en lineær relation eller korrelation mellem en eller flere af de uafhængige variabler eller input.

Multikollinearitet skaber et problem i multipel regression, fordi input alle påvirker hinanden. Derfor er de faktisk ikke uafhængige, og det er svært at teste, hvor meget kombinationen af ​​de uafhængige variabler påvirker den afhængige variabel eller udfald inden for regressionsmodellen. Statistisk set vil en multipel regressionsmodel, hvor der er høj multicollinearitet, gøre det mere svært at estimere forholdet mellem hver af de uafhængige variabler og den afhængige variabel. Små ændringer i de anvendte data eller i opbygningen af ​​modelligningen kan producere store og uregelmæssige ændringer i de estimerede koefficienter på de uafhængige variabler.

For at sikre, at modellen er korrekt specificeret og fungerer korrekt, er der tests, der kan køres for multicollinearity. Variationsinflationsfaktor er et sådant måleværktøj. Brug af variansinflationsfaktorer hjælper med at identificere sværhedsgraden af ​​eventuelle multikollinearitetsproblemer, så modellen kan justeres. Variationsinflationsfaktor måler, hvor meget adfærden (variansen) for en uafhængig variabel påvirkes eller oppustes af dens interaktion/korrelation med de andre uafhængige variabler. Variationsinflationsfaktorer giver et hurtigt mål for, hvor meget en variabel bidrager til standard fejl i regressionen. Når der er betydelige multikollinearitetsproblemer, vil variansinflationsfaktoren være meget stor for de involverede variabler. Efter at disse variabler er identificeret, kan flere metoder bruges til at eliminere eller kombinere kollinære variabler, der løser problemet med multikollinearitet.

Særlige overvejelser

Multikollinearitet

Selvom multicollinearitet ikke reducerer en models samlede forudsigelseskraft, kan den producere estimater af regressionskoefficienterne, der ikke er statistisk signifikante. På en måde kan det betragtes som en slags dobbelttælling i modellen. Når to eller flere uafhængige variabler er nært beslægtede eller måler næsten det samme, bliver den underliggende effekt, de måler, redegjort for to gange (eller flere) på tværs af variablerne. Det bliver svært eller umuligt at sige, hvilken variabel der virkelig påvirker den uafhængige variabel. Dette er et problem, fordi målet for mange økonometrisk modeller er at teste præcis denne form for statistisk sammenhæng mellem de uafhængige variabler og den afhængige variabel.

Antag for eksempel, at en økonom vil teste, om der er en statistisk signifikant forholdet mellem arbejdsløsheden (uafhængig variabel) og inflationen (afhængig variabel). Herunder yderligere uafhængige variabler, der er relateret til arbejdsløshedsprocent, sådan en ny initial arbejdsløse krav, ville sandsynligvis introducere multicollinearity i modellen. Den overordnede model viser muligvis en stærk, statistisk tilstrækkelig forklaringskraft, men er ikke i stand til at identificere, om effekten mest skyldes arbejdsløshedsprocenten eller de nye indledende arbejdsløse krav. Dette er, hvad VIF ville opdage, og det ville foreslå muligvis at droppe en af ​​variablerne ud af modellen eller finde nogle måde at konsolidere dem til at fange deres fælles effekt afhængigt af hvilken specifik hypotese forskeren er interesseret i test.

Robert E. Lucas Jr. Definition

Hvem er Robert E. Lucas Jr.? Robert Emerson Lucas Jr. er en Ny klassisk økonom ved University o...

Læs mere

Conference Board (CB) Definition

Hvad er Conference Board (CB)? Conference Board (CB) er medlemsstyret økonomisk tænketank. Grun...

Læs mere

Hvilke faktorer forårsager ændringer i den samlede efterspørgsel?

Aggregeret efterspørgsel (AD) er den samlede mængde varer og tjenester, forbrugerne er villige t...

Læs mere

stories ig