비즈니스 분석을 위한 회귀 기초
두 개 이상의 데이터가 서로 어떻게 관련되어 있는지(예: GDP 실업 및 인플레이션의 변화에 의해 영향을 받습니다.) 또는 상사에게 예측을 생성하거나 변수 간의 관계를 기반으로 예측을 분석하도록 요청한 적이 있다면 학습 회귀 분석에 시간을 할애할 가치가 있습니다.
이 기사에서는 '보통 최소 제곱' 또는 OLS 회귀—예측 및 재무 분석에 일반적으로 사용되는 도구입니다. 회귀의 핵심 원리를 학습하고 먼저 공분산과 상관에 대해 학습한 다음 회귀 출력을 작성하고 해석하는 것으로 시작합니다. 다음과 같은 인기 있는 비즈니스 소프트웨어 마이크로 소프트 엑셀 모든 회귀 계산 및 출력을 수행할 수 있지만 기본 역학을 배우는 것은 여전히 중요합니다.
핵심 테이크아웃
- 단순 선형 회귀는 일반적으로 예측 및 재무 분석에 사용됩니다. 예를 들어 기업에서 GDP의 변화가 매출에 어떤 영향을 미칠 수 있는지 알려줍니다.
- Microsoft Excel 및 기타 소프트웨어가 모든 계산을 수행할 수 있지만 단순 선형 회귀의 메커니즘이 작동하는 방식을 아는 것이 좋습니다.
변수
회귀 모델의 핵심은 종속 변수와 독립 변수라고 하는 두 개의 서로 다른 변수 간의 관계입니다. 예를 들어 회사의 매출을 예측하고 GDP의 변화에 따라 회사의 매출이 오르락내리락한다는 결론을 내렸다고 가정합니다.
당신이 예측하는 매출은 그 값이 GDP의 가치에 "의존"하고 GDP가 독립변수이기 때문에 종속변수가 될 것입니다. 그런 다음 판매를 예측하기 위해 이 두 변수 간의 관계의 강도를 결정해야 합니다. GDP가 1% 증가/감소하면 매출은 얼마나 증가하거나 감소합니까?
공분산
씨영형V(NS,와이)=∑NS(NSNS−NS유)(와이NS−와이유)
두 변수 간의 관계를 계산하는 공식을 공분산. 이 계산은 관계의 방향을 보여줍니다. 한 변수가 증가하고 다른 변수도 증가하는 경향이 있는 경우 공분산은 양수입니다. 한 변수가 올라가고 다른 변수가 내려가는 경향이 있으면 공분산은 음수가 됩니다.
이것을 계산하여 얻은 실제 숫자는 표준화되지 않았기 때문에 해석하기 어려울 수 있습니다. 예를 들어 공분산이 5이면 양의 관계로 해석될 수 있지만 관계는 숫자가 4일 때보다 더 강하고 숫자가 4일 때보다 더 약하다고 말할 수 있습니다. 육.
상관 계수
씨영형NSNS이자형엘NSNSNS영형NS=ρNS와이=NSNSNS와이씨영형VNS와이
예측에서 더 잘 해석하고 사용할 수 있도록 공분산을 표준화해야 하며, 그 결과는 다음과 같습니다. 상관 관계 계산. 상관 계산은 단순히 공분산을 취하여 의 곱으로 나눕니다. 표준 편차 두 변수 중. 이것은 -1과 +1의 값 사이의 상관관계를 묶을 것입니다.
+1의 상관 관계는 두 변수가 서로 완벽하게 양의 상관 관계가 있음을 의미하고 -1은 완전히 음의 상관 관계가 있음을 의미하는 것으로 해석될 수 있습니다. 이전 예에서 상관 관계가 +1이고 GDP가 1% 증가하면 매출은 1% 증가합니다. 상관 관계가 -1이면 GDP가 1% 증가하면 매출이 1% 감소합니다. 정반대입니다.
회귀 방정식
이제 두 변수 간의 상대적 관계가 계산되는 방법을 알았으므로 원하는 변수를 예측하거나 예측하는 회귀 방정식을 개발할 수 있습니다. 다음은 단순 선형 회귀에 대한 공식입니다. "y"는 예측하려는 값, "b"는 회귀선의 기울기, "x"는 독립 값의 값, "a"는 y 절편을 나타냅니다. 회귀 방정식은 단순히 종속 변수(y)와 독립 변수(x) 간의 관계를 설명합니다.
와이=NSNS+NS
절편 또는 "a"는 x(독립 변수)의 값이 0인 경우 y(종속 변수)의 값입니다. 때로는 단순히 '상수'라고도 합니다. 따라서 GDP에 변화가 없다면 회사는 여전히 약간의 수익을 올릴 것입니다. 매상. 이 값은 GDP의 변화가 0일 때 절편입니다. 회귀 방정식의 그래픽 묘사를 보려면 아래 그래프를 보십시오. 이 그래프에는 그래프의 5개의 점으로 표시되는 5개의 데이터 포인트만 있습니다. 선형 회귀는 데이터에 가장 잘 맞는 선을 추정하려고 시도합니다(a 가장 잘 맞는 라인) 및 해당 라인의 방정식은 회귀 방정식을 생성합니다.
Excel의 회귀
이제 회귀 분석에 대한 몇 가지 배경을 이해했으므로 다음을 사용하여 간단한 예를 들어 보겠습니다. Excel의 회귀 도구. GDP 변화를 기반으로 내년 매출을 예측하려는 이전 예를 기반으로 합니다. 다음 표에는 일부 인공 데이터 포인트가 나열되어 있지만 이러한 숫자는 실생활에서 쉽게 액세스할 수 있습니다.
년도 | 매상 | GDP |
2015 | 100 | 1.00% |
2016 | 250 | 1.90% |
2017 | 275 | 2.40% |
2018 | 200 | 2.60% |
2019 | 300 | 2.90% |
표를 보면 매출과 GDP 사이에 양의 상관관계가 있음을 알 수 있습니다. 둘 다 같이 올라가는 경향이 있습니다. Excel을 사용하면 클릭하기만 하면 됩니다. 도구 드롭다운 메뉴, 선택 데이터 분석 그리고 거기에서 선택 회귀. 팝업 상자는 거기에서 쉽게 채울 수 있습니다. 입력 Y 범위는 "판매" 열이고 입력 X 범위는 GDP 열의 변화입니다. 스프레드시트에서 데이터를 표시할 출력 범위를 선택하고 확인을 누릅니다. 아래 표에 나와 있는 것과 유사한 내용이 표시되어야 합니다.
회귀 통계 계수
다중 R | 0.8292243 | 가로채기 | 34.58409 |
R스퀘어. |
0.687613 | GDP | 88.15552 |
조정됨. R스퀘어. |
0.583484 | - |
- |
표준 에러 | 51.021807 | - | - |
관찰 | 5 | - |
- |
해석
단순 선형 회귀에 대해 우려해야 하는 주요 출력은 다음과 같습니다. R-제곱, 절편(상수) 및 GDP의 베타(b) 계수. 이 예에서 R-제곱 수는 68.7%입니다. 이것은 우리 모델이 미래 판매를 얼마나 잘 예측하거나 예측하는지 보여줍니다. 이는 모델의 설명 변수가 종속 변수 변동의 68.7%를 예측했음을 나타냅니다. 다음으로 34.58의 절편이 있습니다. 이는 GDP의 변화가 0으로 예측되면 판매가 약 35단위가 될 것임을 알려줍니다. 마지막으로 GDP 베타 또는 상관 계수 의 88.15는 GDP가 1% 증가하면 매출이 약 88단위 증가할 가능성이 있음을 알려줍니다.
결론
그렇다면 이 간단한 모델을 비즈니스에서 어떻게 사용하시겠습니까? 연구 결과 다음 GDP 변화가 특정 비율이 될 것이라고 믿게 되면 해당 비율을 모델에 연결하고 판매 예측을 생성할 수 있습니다. 이를 통해 내년도에 대한 보다 객관적인 계획과 예산을 수립할 수 있습니다.
물론 이것은 단순한 회귀일 뿐이며 다음이 있습니다. 만들 수 있는 모델 라고 불리는 여러 독립 변수를 사용하는 다중 선형 회귀. 그러나 다중 선형 회귀는 더 복잡하고 논의할 다른 기사가 필요한 몇 가지 문제가 있습니다.