카테고리 없음

[빅분기]sm.OLS(y,X).fit()가 가지는 속성

dondon-a 2024. 6. 21. 22:57
반응형

statsmodels 라이브러리를 사용하여 OLS(Ordinary Least Squares) 회귀 모델을 적합시킨 후 반환되는 결과 객체에는 많은 속성과 메서드가 있습니다. 아래에 각 속성과 메서드의 풀 네임과 함께 간략한 설명을 제공하겠습니다.

주요 속성과 메서드 설명

  1. aic (Akaike Information Criterion):

    • 모델의 적합도와 복잡도 간의 균형을 평가하는 지표입니다. 값이 낮을수록 더 적합한 모델입니다.
  2. bic (Bayesian Information Criterion):

    • AIC와 유사하지만, 모델의 복잡도를 더 강하게 처벌합니다. 값이 낮을수록 더 적합한 모델입니다.
  3. bse (Standard errors of the parameters):

    • 회귀 계수의 표준 오차입니다.
  4. centered_tss (Centered total sum of squares):

    • 중심화된 총 제곱합으로, 전체 변동성을 나타냅니다.
  5. compare_f_test:

    • 두 모델을 비교하는 F-검정을 수행합니다.
  6. compare_lm_test:

    • 두 모델을 비교하는 Lagrange Multiplier(라그랑주 승수) 검정을 수행합니다.
  7. compare_lr_test:

    • 두 모델을 비교하는 가능도 비율(Likelihood Ratio) 검정을 수행합니다.
  8. condition_number:

    • 조건수로, 행렬의 안정성을 평가합니다. 높은 조건수는 다중 공선성(multicollinearity)을 나타낼 수 있습니다.
  9. conf_int (Confidence Intervals):

    • 회귀 계수에 대한 신뢰 구간을 제공합니다.
  10. conf_int_el:

    • 신뢰 구간을 계산하는 또 다른 메서드입니다.
  11. cov_HC0, cov_HC1, cov_HC2, cov_HC3:

    • 각기 다른 방법으로 계산된 이분산성(heteroskedasticity)을 고려한 공분산 행렬입니다.
  12. cov_kwds:

    • 공분산 옵션을 포함하는 사전(dictionary)입니다.
  13. cov_params (Covariance of parameters):

    • 회귀 계수의 공분산 행렬입니다.
  14. cov_type:

    • 공분산 행렬의 유형을 나타냅니다.
  15. df_model (Degrees of freedom of the model):

    • 모델의 자유도입니다.
  16. df_resid (Degrees of freedom of the residuals):

    • 잔차의 자유도입니다.
  17. eigenvals (Eigenvalues):

    • 설계 행렬의 고유값입니다.
  18. el_test:

    • 경험적 가능성(empirical likelihood)을 사용하는 검정입니다.
  19. ess (Explained sum of squares):

    • 모델에 의해 설명된 제곱합입니다.
  20. f_pvalue (F-statistic p-value):

    • 모델의 전체 유의성에 대한 F-검정의 p값입니다.
  21. f_test:

    • 모델에 대한 F-검정을 수행합니다.
  22. fittedvalues (Fitted values):

    • 모델이 예측한 값입니다.
  23. fvalue (F-statistic):

    • 모델의 전체 유의성에 대한 F-통계량입니다.
  24. get_influence:

    • 모델 진단을 위한 영향을 평가합니다.
  25. get_prediction:

    • 새로운 데이터에 대한 예측을 제공합니다.
  26. get_robustcov_results:

    • 강건한 공분산 행렬을 사용하여 결과를 반환합니다.
  27. info_criteria:

    • 정보 기준(AIC, BIC 등)을 반환합니다.
  28. initialize:

    • 결과 객체를 초기화합니다.
  29. k_constant:

    • 모델에 포함된 상수의 수입니다.
  30. llf (Log-likelihood):

    • 로그 가능도 값입니다.
  31. load:

    • 저장된 결과 객체를 로드합니다.
  32. model:

    • 모델 클래스 객체입니다.
  33. mse_model (Mean squared error of the model):

    • 모델의 평균 제곱 오차입니다.
  34. mse_resid (Mean squared error of the residuals):

    • 잔차의 평균 제곱 오차입니다.
  35. mse_total (Total mean squared error):

    • 전체 평균 제곱 오차입니다.
  36. nobs (Number of observations):

    • 관측치 수입니다.
  37. normalized_cov_params:

    • 정규화된 공분산 행렬입니다.
  38. outlier_test:

    • 이상치 검정을 수행합니다.
  39. params (Parameters):

    • 회귀 계수입니다.
  40. predict:

    • 예측 값을 계산합니다.
  41. pvalues (p-values of the parameters):

    • 회귀 계수의 p값입니다.
  42. remove_data:

    • 데이터를 제거하여 메모리를 절약합니다.
  43. resid (Residuals):

    • 잔차 값입니다.
  44. resid_pearson (Pearson residuals):

    • 피어슨 잔차 값입니다.
  45. rsquared (R-squared):

    • 결정 계수로, 모델의 설명력을 나타냅니다.
  46. rsquared_adj (Adjusted R-squared):

    • 조정된 결정 계수로, 설명 변수의 수를 고려한 모델의 설명력을 나타냅니다.
  47. save:

    • 결과 객체를 저장합니다.
  48. scale:

    • 잔차의 분산을 나타냅니다.
  49. ssr (Sum of squared residuals):

    • 잔차의 제곱합입니다.
  50. summary:

    • 결과 요약을 제공합니다.
  51. summary2:

    • 보다 포괄적인 결과 요약을 제공합니다.
  52. t_test:

    • t-검정을 수행합니다.
  53. t_test_pairwise:

    • 쌍별 t-검정을 수행합니다.
  54. tvalues (t-values of the parameters):

    • 회귀 계수의 t값입니다.
  55. uncentered_tss (Uncentered total sum of squares):

    • 비중심화된 총 제곱합입니다.
  56. use_t:

    • t 통계를 사용할지 여부를 나타냅니다.
  57. wald_test:

    • Wald 검정을 수행합니다.
  58. wald_test_terms:

    • 용어별 Wald 검정을 수행합니다.
  59. wresid (Weighted residuals):

    • 가중 잔차 값입니다.

이 항목들은 모델의 적합도, 검정, 예측 및 기타 여러 통계량과 관련된 중요한 정보를 제공합니다. statsmodels를 통해 제공되는 다양한 도구들을 사용하여 회귀 분석을 더욱 깊이 이해하고 분석할 수 있습니다.

반응형