**공분산(Covariance)**은 두 변수 간의 관계를 측정하는 통계적 개념으로, 한 변수의 변화가 다른 변수의 변화와 어떻게 연관되어 있는지를 나타냅니다. 공분산은 변수 간의 방향성과 크기를 설명합니다.
공분산의 정의
공분산은 두 변수 (X)와 (Y)의 값들이 각각 평균에서 벗어난 정도를 곱한 값의 평균으로 계산됩니다.
수식으로는 다음과 같습니다:
[ \text{Cov}(X, Y) = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{n} ]
- (X_i, Y_i): 각 변수 (X)와 (Y)의 관측값
- (\bar{X}, \bar{Y}): 변수 (X)와 (Y)의 평균값
- (n): 관측값의 개수
공분산의 특징
-
양수(Positive):
- 두 변수가 같은 방향으로 움직일 때, 즉 (X)가 증가할 때 (Y)도 증가하면 공분산은 양수입니다.
예: 주가와 경제 성장률이 함께 증가할 경우.
- 두 변수가 같은 방향으로 움직일 때, 즉 (X)가 증가할 때 (Y)도 증가하면 공분산은 양수입니다.
-
음수(Negative):
- 두 변수가 반대 방향으로 움직일 때, 즉 (X)가 증가하면 (Y)가 감소하면 공분산은 음수입니다.
예: 금 가격과 주식 가격이 반대로 움직이는 경우.
- 두 변수가 반대 방향으로 움직일 때, 즉 (X)가 증가하면 (Y)가 감소하면 공분산은 음수입니다.
-
0 또는 근처 값:
- 두 변수 간에 아무 상관관계가 없거나 독립적일 때 공분산은 0에 가까운 값을 가집니다.
공분산과 상관계수의 차이
공분산과 상관계수(Correlation)는 둘 다 변수 간의 관계를 나타내지만, 다음과 같은 차이가 있습니다:
-
공분산(Covariance):
- 값에 단위가 있습니다.
- 해석하기 어렵고, 비교가 어렵습니다.
- 크기가 두 변수의 측정 단위에 따라 달라집니다.
-
상관계수(Correlation):
- 공분산을 두 변수의 표준편차로 나누어 표준화한 값입니다.
- 값의 범위는 (-1)에서 (+1) 사이로 제한됩니다.
- 공분산보다 해석과 비교가 용이합니다.
[ \text{Correlation}(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y} ]
공분산의 예
두 자산 (A)와 (B)의 수익률이 다음과 같다고 가정합니다:
| 시점 | (A)의 수익률 | (B)의 수익률 |
|---|---|---|
| 1 | 10% | 15% |
| 2 | 12% | 14% |
| 3 | 8% | 12% |
-
평균 계산:
- (A)의 평균 수익률: ( (10 + 12 + 8)/3 = 10%)
- (B)의 평균 수익률: ( (15 + 14 + 12)/3 = 13.67%)
-
각 시점에서 편차 계산:
- (A): ([10-10, 12-10, 8-10] = [0, 2, -2])
- (B): ([15-13.67, 14-13.67, 12-13.67] = [1.33, 0.33, -1.67])
-
편차의 곱 계산 및 평균:
[ \text{Cov}(A, B) = \frac{(0 \cdot 1.33) + (2 \cdot 0.33) + (-2 \cdot -1.67)}{3} = 1.22 ]
공분산이 **양수(1.22)**이므로 (A)와 (B)는 같은 방향으로 움직이는 경향이 있습니다.
공분산의 활용
-
포트폴리오 관리:
- 공분산은 자산 간 상관관계를 나타내어 분산 투자를 최적화하는 데 사용됩니다.
- 예를 들어, 공분산이 음수인 자산(상관관계가 낮은 자산)을 결합하면 포트폴리오의 위험을 줄일 수 있습니다.
-
통계 분석:
- 변수 간의 관계를 이해하고, 회귀 분석이나 머신러닝 모델 구축에 중요한 기초 데이터를 제공합니다.
공분산은 단독으로는 해석이 어렵지만, 상관계수와 함께 사용하면 더 유용한 정보를 제공합니다.