Better Investing Tips

Comment créer un modèle de régression linéaire dans Excel

click fraud protection

Qu'est-ce que la régression linéaire?

Linéaire régression est un graphique de données qui représente graphiquement relation linéaire entre une variable indépendante et une variable dépendante. Il est généralement utilisé pour montrer visuellement la force de la relation et le dispersion des résultats – le tout dans le but d'expliquer le comportement de la variable dépendante.

Supposons que nous voulions tester la force de la relation entre la quantité de crème glacée consommée et l'obésité. Nous prendrions la variable indépendante, la quantité de crème glacée, et la relierions à la variable dépendante, l'obésité, pour voir s'il y avait une relation. Étant donné qu'une régression est un affichage graphique de cette relation, plus le variabilité dans les données, plus la relation est forte et plus l'ajustement à la droite de régression est étroit.

Points clés à retenir

  • La régression linéaire modélise la relation entre une ou plusieurs variables dépendantes et indépendantes.
  • Une analyse de régression peut être réalisée si les variables sont indépendantes, s'il n'y a pas d'hétéroscédasticité et si les termes d'erreur des variables ne sont pas corrélés.
  • La modélisation de la régression linéaire dans Excel est plus facile avec le Data Analysis ToolPak.

Considérations importantes

Il y a quelques hypothèses critiques sur votre ensemble de données qui doivent être vraies pour procéder à un analyse de régression:

  1. Les variables doivent être vraiment indépendantes (à l'aide d'un Chi carré test).
  2. Les données ne doivent pas avoir d'erreur différente écarts (c'est appelé hétéroscédasticité (également orthographié hétéroscédasticité)).
  3. Les termes d'erreur de chaque variable doivent être non corrélés. Sinon, cela signifie que les variables sont corrélée en série.

Si ces trois choses semblent compliquées, elles le sont. Mais l'effet de l'une de ces considérations n'étant pas vrai est une estimation biaisée. Essentiellement, vous diriez mal la relation que vous mesurez.

Sortie d'une régression dans Excel

La première étape de l'exécution d'une analyse de régression dans Excel consiste à vérifier que le plug-in Excel gratuit Data Analysis ToolPak est installé. Ce plugin rend le calcul d'une gamme de statistiques très facile. Il est ne pas nécessaire pour tracer une ligne de régression linéaire, mais cela simplifie la création de tableaux de statistiques. Pour vérifier s'il est installé, sélectionnez "Données" dans la barre d'outils. Si « Analyse des données » est une option, la fonctionnalité est installée et prête à être utilisée. Si elle n'est pas installée, vous pouvez demander cette option en cliquant sur le bouton Office et en sélectionnant "Options Excel".

À l'aide du Data Analysis ToolPak, la création d'une sortie de régression ne prend que quelques clics.

La variable indépendante va dans la plage X.

Compte tenu du S&P 500 retours, disons que nous voulons savoir si nous pouvons estimer la force et la relation de Visa (V) StockRetour. Les données de retour d'actions Visa (V) remplissent la colonne 1 en tant que variable dépendante. Le S&P 500 renvoie les données de la colonne 2 en tant que variable indépendante.

  1. Sélectionnez "Données" dans la barre d'outils. Le menu "Données" s'affiche.
  2. Sélectionnez "Analyse des données". La boîte de dialogue Analyse des données - Outils d'analyse s'affiche.
  3. Dans le menu, sélectionnez "Régression" et cliquez sur "OK".
  4. Dans la boîte de dialogue Régression, cliquez sur la case « Plage Y d'entrée » et sélectionnez les données de la variable dépendante (rendements boursiers Visa (V)).
  5. Cliquez sur la case "Input X Range" et sélectionnez les données variables indépendantes (retours S&P 500).
  6. Cliquez sur "OK" pour exécuter les résultats.

[Remarque: Si le tableau semble petit, faites un clic droit sur l'image et ouvrez-le dans un nouvel onglet pour une résolution plus élevée.]

Interpréter les résultats

En utilisant ces données (les mêmes que celles de notre R au carré article), on obtient le tableau suivant:

Le R2 La valeur, également connue sous le nom de coefficient de détermination, mesure la proportion de variation dans le variable dépendante expliquée par la variable indépendante ou dans quelle mesure le modèle de régression s'adapte à la Les données. Le R2 la valeur varie de 0 à 1, et une valeur plus élevée indique un meilleur ajustement. La valeur p, ou valeur de probabilité, varie également de 0 à 1 et indique si le test est significatif. Contrairement au R2 valeur, une valeur p plus petite est favorable car elle indique une corrélation entre les variables dépendantes et indépendantes.

Tracer une régression dans Excel

Nous pouvons tracer une régression dans Excel en mettant en évidence les données et en les représentant sous forme de nuage de points. Pour ajouter une ligne de régression, choisissez "Mise en page" dans le menu "Outils de graphique". Dans la boîte de dialogue, sélectionnez "Ligne de tendance" puis "Ligne de tendance linéaire". Pour ajouter le R2 valeur, sélectionnez "Plus d'options de ligne de tendance" dans le "menu Ligne de tendance. Enfin, sélectionnez "Afficher la valeur R au carré sur le graphique". Le résultat visuel résume la force de la relation, mais au détriment de ne pas fournir autant de détails que le tableau ci-dessus.

Image
Image de Sabrina Jiang © Investopedia 2020

Comment le vote cumulatif est utilisé

Qu'est-ce que le vote cumulatif? Le vote cumulatif est la procédure suivie lors de l'élection d...

Lire la suite

Définition de l'assurance excédentaire globale

Qu'est-ce que l'assurance excédentaire globale? L'assurance excédentaire globale limite le mont...

Lire la suite

Définition de l'assurance à risque fini

Qu'est-ce que l'assurance risque fini? L'assurance contre les risques finis est une Assurance o...

Lire la suite

stories ig