statsmodels
라이브러리를 사용하여 OLS(Ordinary Least Squares) 회귀 모델을 적합시킨 후 반환되는 결과 객체에는 많은 속성과 메서드가 있습니다. 아래에 각 속성과 메서드의 풀 네임과 함께 간략한 설명을 제공하겠습니다.
주요 속성과 메서드 설명
aic
(Akaike Information Criterion):- 모델의 적합도와 복잡도 간의 균형을 평가하는 지표입니다. 값이 낮을수록 더 적합한 모델입니다.
bic
(Bayesian Information Criterion):- AIC와 유사하지만, 모델의 복잡도를 더 강하게 처벌합니다. 값이 낮을수록 더 적합한 모델입니다.
bse
(Standard errors of the parameters):- 회귀 계수의 표준 오차입니다.
centered_tss
(Centered total sum of squares):- 중심화된 총 제곱합으로, 전체 변동성을 나타냅니다.
compare_f_test
:- 두 모델을 비교하는 F-검정을 수행합니다.
compare_lm_test
:- 두 모델을 비교하는 Lagrange Multiplier(라그랑주 승수) 검정을 수행합니다.
compare_lr_test
:- 두 모델을 비교하는 가능도 비율(Likelihood Ratio) 검정을 수행합니다.
condition_number
:- 조건수로, 행렬의 안정성을 평가합니다. 높은 조건수는 다중 공선성(multicollinearity)을 나타낼 수 있습니다.
conf_int
(Confidence Intervals):- 회귀 계수에 대한 신뢰 구간을 제공합니다.
conf_int_el
:- 신뢰 구간을 계산하는 또 다른 메서드입니다.
cov_HC0
,cov_HC1
,cov_HC2
,cov_HC3
:- 각기 다른 방법으로 계산된 이분산성(heteroskedasticity)을 고려한 공분산 행렬입니다.
cov_kwds
:- 공분산 옵션을 포함하는 사전(dictionary)입니다.
cov_params
(Covariance of parameters):- 회귀 계수의 공분산 행렬입니다.
cov_type
:- 공분산 행렬의 유형을 나타냅니다.
df_model
(Degrees of freedom of the model):- 모델의 자유도입니다.
df_resid
(Degrees of freedom of the residuals):- 잔차의 자유도입니다.
eigenvals
(Eigenvalues):- 설계 행렬의 고유값입니다.
el_test
:- 경험적 가능성(empirical likelihood)을 사용하는 검정입니다.
ess
(Explained sum of squares):- 모델에 의해 설명된 제곱합입니다.
f_pvalue
(F-statistic p-value):- 모델의 전체 유의성에 대한 F-검정의 p값입니다.
f_test
:- 모델에 대한 F-검정을 수행합니다.
fittedvalues
(Fitted values):- 모델이 예측한 값입니다.
fvalue
(F-statistic):- 모델의 전체 유의성에 대한 F-통계량입니다.
get_influence
:- 모델 진단을 위한 영향을 평가합니다.
get_prediction
:- 새로운 데이터에 대한 예측을 제공합니다.
get_robustcov_results
:- 강건한 공분산 행렬을 사용하여 결과를 반환합니다.
info_criteria
:- 정보 기준(AIC, BIC 등)을 반환합니다.
initialize
:- 결과 객체를 초기화합니다.
k_constant
:- 모델에 포함된 상수의 수입니다.
llf
(Log-likelihood):- 로그 가능도 값입니다.
load
:- 저장된 결과 객체를 로드합니다.
model
:- 모델 클래스 객체입니다.
mse_model
(Mean squared error of the model):- 모델의 평균 제곱 오차입니다.
mse_resid
(Mean squared error of the residuals):- 잔차의 평균 제곱 오차입니다.
mse_total
(Total mean squared error):- 전체 평균 제곱 오차입니다.
nobs
(Number of observations):- 관측치 수입니다.
normalized_cov_params
:- 정규화된 공분산 행렬입니다.
outlier_test
:- 이상치 검정을 수행합니다.
params
(Parameters):- 회귀 계수입니다.
predict
:- 예측 값을 계산합니다.
pvalues
(p-values of the parameters):- 회귀 계수의 p값입니다.
remove_data
:- 데이터를 제거하여 메모리를 절약합니다.
resid
(Residuals):- 잔차 값입니다.
resid_pearson
(Pearson residuals):- 피어슨 잔차 값입니다.
rsquared
(R-squared):- 결정 계수로, 모델의 설명력을 나타냅니다.
rsquared_adj
(Adjusted R-squared):- 조정된 결정 계수로, 설명 변수의 수를 고려한 모델의 설명력을 나타냅니다.
save
:- 결과 객체를 저장합니다.
scale
:- 잔차의 분산을 나타냅니다.
ssr
(Sum of squared residuals):- 잔차의 제곱합입니다.
summary
:- 결과 요약을 제공합니다.
summary2
:- 보다 포괄적인 결과 요약을 제공합니다.
t_test
:- t-검정을 수행합니다.
t_test_pairwise
:- 쌍별 t-검정을 수행합니다.
tvalues
(t-values of the parameters):- 회귀 계수의 t값입니다.
uncentered_tss
(Uncentered total sum of squares):- 비중심화된 총 제곱합입니다.
use_t
:- t 통계를 사용할지 여부를 나타냅니다.
wald_test
:- Wald 검정을 수행합니다.
wald_test_terms
:- 용어별 Wald 검정을 수행합니다.
wresid
(Weighted residuals):- 가중 잔차 값입니다.
이 항목들은 모델의 적합도, 검정, 예측 및 기타 여러 통계량과 관련된 중요한 정보를 제공합니다. statsmodels
를 통해 제공되는 다양한 도구들을 사용하여 회귀 분석을 더욱 깊이 이해하고 분석할 수 있습니다.