Skip to content

inging5839/AIML_Project

Repository files navigation

AIML_Project - 김건

'금융 문해력'과 '적금 관심도'간의 상관관계 파악을 위한 머신러닝 모델

👨🏾‍💻 모델 구조 도식화

  • 이미지 파일 첨부

👨🏾‍💻 하이퍼파라미터 설명 및 값

모델 하이퍼파라미터 설정값 설명
LinearRegression - - -
RandomForestRegressor random_state 42 재현성을 위한 랜덤 시드 값
GradientBoostingRegressor random_state 42 재현성을 위한 랜덤 시드 값
SVR kernel 'rbf' RBF(Radial Basis Function) 커널 사용

RandomForest 그리드서치 하이퍼파라미터

하이퍼파라미터 탐색 범위 설명
n_estimators [100, 200] 의사결정 트리의 개수
max_depth [None, 10, 20] 트리의 최대 깊이 (None은 제한 없음)
min_samples_split [2, 5] 노드를 분할하기 위한 최소 샘플 수
min_samples_leaf [1, 2] 리프 노드가 가져야 할 최소 샘플 수

교차 검증 설정

파라미터 설명
cv 5 5-fold 교차 검증 수행
scoring neg_mean_squared_error 평가 지표로 MSE의 음수값 사용
n_jobs -1 모든 가용 CPU 코어 사용

데이터 분할

파라미터 설명
test_size 0.2 테스트 세트 비율 20%
random_state 42 재현성을 위한 랜덤 시드 값
shuffle True 데이터 섞기 활성화

👨🏾‍💻 모델 성능 평가

R² (결정계수): 0.0932

  • R²값이 0.0932라는 것은 모델이 데이터의 분산을 약 9.32%만 설명할 수 있다는 의미
  • 일반적으로 R²값이 0.7 이상이면 좋은 모델로 평가되는데, 이 모델은 매우 낮은 수준

Adjusted R²: 0.0026

  • Adjusted R²는 특성 수를 고려한 수정된 R² 값
  • 거의 0에 가까운 값으로, 모델의 설명력이 매우 낮다는 것을 의미

RMSE: 0.5486

  • RMSE는 예측값과 실제값의 차이를 나타내는 지표
  • 목표변수의 스케일을 고려했을 때 (1.0-5.0 사이), 0.5486의 오차는 상당히 큰 편

상관계수: 0.4936, P-value: 0.1029

  • 상관계수가 0.5 미만으로, 변수 간의 상관관계가 약함
  • P-value가 0.05보다 크므로, 통계적으로 유의미하지 않음

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages