- 이미지 파일 첨부
| 모델 | 하이퍼파라미터 | 설정값 | 설명 |
|---|---|---|---|
| LinearRegression | - | - | - |
| RandomForestRegressor | random_state | 42 | 재현성을 위한 랜덤 시드 값 |
| GradientBoostingRegressor | random_state | 42 | 재현성을 위한 랜덤 시드 값 |
| SVR | kernel | 'rbf' | RBF(Radial Basis Function) 커널 사용 |
| 하이퍼파라미터 | 탐색 범위 | 설명 |
|---|---|---|
| n_estimators | [100, 200] | 의사결정 트리의 개수 |
| max_depth | [None, 10, 20] | 트리의 최대 깊이 (None은 제한 없음) |
| min_samples_split | [2, 5] | 노드를 분할하기 위한 최소 샘플 수 |
| min_samples_leaf | [1, 2] | 리프 노드가 가져야 할 최소 샘플 수 |
| 파라미터 | 값 | 설명 |
|---|---|---|
| cv | 5 | 5-fold 교차 검증 수행 |
| scoring | neg_mean_squared_error | 평가 지표로 MSE의 음수값 사용 |
| n_jobs | -1 | 모든 가용 CPU 코어 사용 |
| 파라미터 | 값 | 설명 |
|---|---|---|
| test_size | 0.2 | 테스트 세트 비율 20% |
| random_state | 42 | 재현성을 위한 랜덤 시드 값 |
| shuffle | True | 데이터 섞기 활성화 |
- R²값이 0.0932라는 것은 모델이 데이터의 분산을 약 9.32%만 설명할 수 있다는 의미
- 일반적으로 R²값이 0.7 이상이면 좋은 모델로 평가되는데, 이 모델은 매우 낮은 수준
- Adjusted R²는 특성 수를 고려한 수정된 R² 값
- 거의 0에 가까운 값으로, 모델의 설명력이 매우 낮다는 것을 의미
- RMSE는 예측값과 실제값의 차이를 나타내는 지표
- 목표변수의 스케일을 고려했을 때 (1.0-5.0 사이), 0.5486의 오차는 상당히 큰 편
- 상관계수가 0.5 미만으로, 변수 간의 상관관계가 약함
- P-value가 0.05보다 크므로, 통계적으로 유의미하지 않음