통계분석

[통계분석]로지스틱 회귀에서 오즈비의 의미

dondon-a 2024. 6. 20. 23:26
반응형

로지스틱 회귀 분석에서 오즈비(odds ratio)는 독립 변수의 단위 변화가 종속 변수의 발생 확률에 미치는 영향을 설명하는 중요한 지표입니다. 주어진 예시에서는, 'age' 변수의 오즈비를 계산하였고, 그 의미는 다음과 같습니다.

오즈비의 의미

로지스틱 회귀 모델의 계수는 로그 오즈비(log odds ratio)를 나타냅니다. 즉, 모델에서 'age'의 계수 (\beta_{\text{age}})는 'age'가 한 단위 증가할 때 로그 오즈비가 어떻게 변하는지를 보여줍니다. 이를 수학적으로 표현하면 다음과 같습니다:

[ \log\left(\frac{p}{1-p}\right) = \beta_0 + \beta_{\text{age}} \cdot \text{age} + \beta_1 \cdot X_1 + \cdots + \beta_k \cdot X_k ]

여기서 (\beta_{\text{age}})는 'age' 변수의 계수입니다.

오즈비는 이 로그 오즈비를 지수 함수로 변환한 값입니다. 즉, (\beta_{\text{age}})의 지수 함수 값을 계산하여 오즈비를 얻습니다:

[ \text{odds ratio} = \exp(\beta_{\text{age}}) ]

오즈비의 해석

계산된 오즈비 (\text{odds ratio})는 'age' 변수가 한 단위 증가할 때 종속 변수(예: 이벤트 발생 확률)가 어떻게 변하는지를 설명합니다:

  • 오즈비 > 1: 'age'가 한 단위 증가할 때, 이벤트 발생의 오즈가 증가합니다.
  • 오즈비 = 1: 'age'가 이벤트 발생의 오즈에 영향을 미치지 않습니다.
  • 오즈비 < 1: 'age'가 한 단위 증가할 때, 이벤트 발생의 오즈가 감소합니다.

따라서, 예시 코드에서 계산된 오즈비의 의미는 다음과 같습니다:

# age의 weight 오즈비 계산
odds_ratios = np.exp(model.params['age'])
odds_ratios

이 계산의 결과로 얻은 오즈비는 'age'가 한 단위 증가할 때, 이벤트(예: 종속 변수 'target'의 값이 1이 되는 경우)의 오즈가 얼마나 증가 또는 감소하는지를 나타냅니다.

예를 들어, 만약 계산된 오즈비가 1.05라면, 'age'가 한 단위 증가할 때 이벤트 발생 오즈가 5% 증가하는 것을 의미합니다. 반대로, 만약 오즈비가 0.95라면, 'age'가 한 단위 증가할 때 이벤트 발생 오즈가 5% 감소하는 것을 의미합니다.

반응형