Repository files navigation
'금융 문해력'과 '적금 관심도'간의 상관관계 파악을 위한 머신러닝 모델
모델
하이퍼파라미터
설정값
설명
LinearRegression
-
-
-
RandomForestRegressor
random_state
42
재현성을 위한 랜덤 시드 값
GradientBoostingRegressor
random_state
42
재현성을 위한 랜덤 시드 값
SVR
kernel
'rbf'
RBF(Radial Basis Function) 커널 사용
RandomForest 그리드서치 하이퍼파라미터
하이퍼파라미터
탐색 범위
설명
n_estimators
[100, 200]
의사결정 트리의 개수
max_depth
[None, 10, 20]
트리의 최대 깊이 (None은 제한 없음)
min_samples_split
[2, 5]
노드를 분할하기 위한 최소 샘플 수
min_samples_leaf
[1, 2]
리프 노드가 가져야 할 최소 샘플 수
파라미터
값
설명
cv
5
5-fold 교차 검증 수행
scoring
neg_mean_squared_error
평가 지표로 MSE의 음수값 사용
n_jobs
-1
모든 가용 CPU 코어 사용
파라미터
값
설명
test_size
0.2
테스트 세트 비율 20%
random_state
42
재현성을 위한 랜덤 시드 값
shuffle
True
데이터 섞기 활성화
R²값이 0.0932라는 것은 모델이 데이터의 분산을 약 9.32%만 설명할 수 있다는 의미
일반적으로 R²값이 0.7 이상이면 좋은 모델로 평가되는데, 이 모델은 매우 낮은 수준
Adjusted R²는 특성 수를 고려한 수정된 R² 값
거의 0에 가까운 값으로, 모델의 설명력이 매우 낮다는 것을 의미
RMSE는 예측값과 실제값의 차이를 나타내는 지표
목표변수의 스케일을 고려했을 때 (1.0-5.0 사이), 0.5486의 오차는 상당히 큰 편
상관계수: 0.4936, P-value: 0.1029
상관계수가 0.5 미만으로, 변수 간의 상관관계가 약함
P-value가 0.05보다 크므로, 통계적으로 유의미하지 않음
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
You can’t perform that action at this time.