[빅분기]sm.OLS(y,X).fit()가 가지는 속성

카테고리 없음

[빅분기]sm.OLS(y,X).fit()가 가지는 속성

dondon-a 2024. 6. 21. 22:57

statsmodels 라이브러리를 사용하여 OLS(Ordinary Least Squares) 회귀 모델을 적합시킨 후 반환되는 결과 객체에는 많은 속성과 메서드가 있습니다. 아래에 각 속성과 메서드의 풀 네임과 함께 간략한 설명을 제공하겠습니다.

주요 속성과 메서드 설명

aic (Akaike Information Criterion):
- 모델의 적합도와 복잡도 간의 균형을 평가하는 지표입니다. 값이 낮을수록 더 적합한 모델입니다.
bic (Bayesian Information Criterion):
- AIC와 유사하지만, 모델의 복잡도를 더 강하게 처벌합니다. 값이 낮을수록 더 적합한 모델입니다.
bse (Standard errors of the parameters):
- 회귀 계수의 표준 오차입니다.
centered_tss (Centered total sum of squares):
- 중심화된 총 제곱합으로, 전체 변동성을 나타냅니다.
compare_f_test:
- 두 모델을 비교하는 F-검정을 수행합니다.
compare_lm_test:
- 두 모델을 비교하는 Lagrange Multiplier(라그랑주 승수) 검정을 수행합니다.
compare_lr_test:
- 두 모델을 비교하는 가능도 비율(Likelihood Ratio) 검정을 수행합니다.
condition_number:
- 조건수로, 행렬의 안정성을 평가합니다. 높은 조건수는 다중 공선성(multicollinearity)을 나타낼 수 있습니다.
conf_int (Confidence Intervals):
- 회귀 계수에 대한 신뢰 구간을 제공합니다.
conf_int_el:
- 신뢰 구간을 계산하는 또 다른 메서드입니다.
cov_HC0, cov_HC1, cov_HC2, cov_HC3:
- 각기 다른 방법으로 계산된 이분산성(heteroskedasticity)을 고려한 공분산 행렬입니다.
cov_kwds:
- 공분산 옵션을 포함하는 사전(dictionary)입니다.
cov_params (Covariance of parameters):
- 회귀 계수의 공분산 행렬입니다.
cov_type:
- 공분산 행렬의 유형을 나타냅니다.
df_model (Degrees of freedom of the model):
- 모델의 자유도입니다.
df_resid (Degrees of freedom of the residuals):
- 잔차의 자유도입니다.
eigenvals (Eigenvalues):
- 설계 행렬의 고유값입니다.
el_test:
- 경험적 가능성(empirical likelihood)을 사용하는 검정입니다.
ess (Explained sum of squares):
- 모델에 의해 설명된 제곱합입니다.
f_pvalue (F-statistic p-value):
- 모델의 전체 유의성에 대한 F-검정의 p값입니다.
f_test:
- 모델에 대한 F-검정을 수행합니다.
fittedvalues (Fitted values):
- 모델이 예측한 값입니다.
fvalue (F-statistic):
- 모델의 전체 유의성에 대한 F-통계량입니다.
get_influence:
- 모델 진단을 위한 영향을 평가합니다.
get_prediction:
- 새로운 데이터에 대한 예측을 제공합니다.
get_robustcov_results:
- 강건한 공분산 행렬을 사용하여 결과를 반환합니다.
info_criteria:
- 정보 기준(AIC, BIC 등)을 반환합니다.
initialize:
- 결과 객체를 초기화합니다.
k_constant:
- 모델에 포함된 상수의 수입니다.
llf (Log-likelihood):
- 로그 가능도 값입니다.
load:
- 저장된 결과 객체를 로드합니다.
model:
- 모델 클래스 객체입니다.
mse_model (Mean squared error of the model):
- 모델의 평균 제곱 오차입니다.
mse_resid (Mean squared error of the residuals):
- 잔차의 평균 제곱 오차입니다.
mse_total (Total mean squared error):
- 전체 평균 제곱 오차입니다.
nobs (Number of observations):
- 관측치 수입니다.
normalized_cov_params:
- 정규화된 공분산 행렬입니다.
outlier_test:
- 이상치 검정을 수행합니다.
params (Parameters):
- 회귀 계수입니다.
predict:
- 예측 값을 계산합니다.
pvalues (p-values of the parameters):
- 회귀 계수의 p값입니다.
remove_data:
- 데이터를 제거하여 메모리를 절약합니다.
resid (Residuals):
- 잔차 값입니다.
resid_pearson (Pearson residuals):
- 피어슨 잔차 값입니다.
rsquared (R-squared):
- 결정 계수로, 모델의 설명력을 나타냅니다.
rsquared_adj (Adjusted R-squared):
- 조정된 결정 계수로, 설명 변수의 수를 고려한 모델의 설명력을 나타냅니다.
save:
- 결과 객체를 저장합니다.
scale:
- 잔차의 분산을 나타냅니다.
ssr (Sum of squared residuals):
- 잔차의 제곱합입니다.
summary:
- 결과 요약을 제공합니다.
summary2:
- 보다 포괄적인 결과 요약을 제공합니다.
t_test:
- t-검정을 수행합니다.
t_test_pairwise:
- 쌍별 t-검정을 수행합니다.
tvalues (t-values of the parameters):
- 회귀 계수의 t값입니다.
uncentered_tss (Uncentered total sum of squares):
- 비중심화된 총 제곱합입니다.
use_t:
- t 통계를 사용할지 여부를 나타냅니다.
wald_test:
- Wald 검정을 수행합니다.
wald_test_terms:
- 용어별 Wald 검정을 수행합니다.
wresid (Weighted residuals):
- 가중 잔차 값입니다.

이 항목들은 모델의 적합도, 검정, 예측 및 기타 여러 통계량과 관련된 중요한 정보를 제공합니다. statsmodels를 통해 제공되는 다양한 도구들을 사용하여 회귀 분석을 더욱 깊이 이해하고 분석할 수 있습니다.

현재글[빅분기]sm.OLS(y,X).fit()가 가지는 속성

dondon-a 님의 블로그

dondon-a 님의 블로그 입니다.

Today :
Yesterday :

dondon-a 님의 블로그

[빅분기]sm.OLS(y,X).fit()가 가지는 속성

주요 속성과 메서드 설명

'카테고리 없음'의 다른글

티스토리툴바

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30