0% found this document useful (0 votes)

5 views4 pages

Telecom Churn Proj

Uploaded by

FACTZ

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views4 pages

Telecom Churn Proj

Uploaded by

FACTZ

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.model_selection import train_test_split, cross_val_score

from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.metrics import classification_report, confusion_matrix,
roc_auc_score
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
from imblearn.over_sampling import SMOTE

# Load dataset
df = pd.read_csv('/content/WA_Fn-UseC_-Telco-Customer-Churn.csv')

# Drop customerID
df.drop('customerID', axis=1, inplace=True)

# Handle TotalCharges (has missing values)

df['TotalCharges'] = pd.to_numeric(df['TotalCharges'],
errors='coerce')
df.dropna(inplace=True)

# Encode target variable

df['Churn'] = df['Churn'].map({'Yes': 1, 'No': 0})

# Convert binary categorical features

binary_cols = ['gender', 'Partner', 'Dependents', 'PhoneService',
'PaperlessBilling']
for col in binary_cols:
df[col] = df[col].map({'Yes': 1, 'No': 0, 'Male': 1, 'Female': 0})

# One-hot encode remaining categorical variables

df = pd.get_dummies(df, drop_first=True)

# Features and target

X = df.drop('Churn', axis=1)
y = df['Churn']

# Scale numerical features

scaler = StandardScaler()
X[['tenure', 'MonthlyCharges', 'TotalCharges']] =
scaler.fit_transform(X[['tenure', 'MonthlyCharges', 'TotalCharges']])

# Balance the dataset using SMOTE

smote = SMOTE(random_state=42)
X_bal, y_bal = smote.fit_resample(X, y)
# Split the data
X_train, X_test, y_train, y_test = train_test_split(X_bal, y_bal,
test_size=0.2, random_state=42)

# --- 1. Logistic Regression ---

logreg = LogisticRegression(max_iter=1000)
logreg.fit(X_train, y_train)
y_pred_log = logreg.predict(X_test)
print("Logistic Regression:")
print(classification_report(y_test, y_pred_log))
print("ROC-AUC:", roc_auc_score(y_test, logreg.predict_proba(X_test)
[:, 1]))
print("-" * 60)

Logistic Regression:
precision recall f1-score support

0 0.81 0.78 0.80 1037

1 0.79 0.82 0.80 1029

accuracy 0.80 2066

macro avg 0.80 0.80 0.80 2066
weighted avg 0.80 0.80 0.80 2066

ROC-AUC: 0.880777135210056
------------------------------------------------------------

# --- 2. Random Forest ---

rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)
y_pred_rf = rf.predict(X_test)
print("Random Forest:")
print(classification_report(y_test, y_pred_rf))
print("ROC-AUC:", roc_auc_score(y_test, rf.predict_proba(X_test)[:,
1]))
print("-" * 60)

Random Forest:
precision recall f1-score support

0 0.84 0.82 0.83 1037

1 0.82 0.85 0.83 1029

accuracy 0.83 2066

macro avg 0.83 0.83 0.83 2066
weighted avg 0.83 0.83 0.83 2066
ROC-AUC: 0.9135555861688939
------------------------------------------------------------

# --- 3. XGBoost ---

xgb = XGBClassifier(use_label_encoder=False, eval_metric='logloss',
random_state=42)
xgb.fit(X_train, y_train)
y_pred_xgb = xgb.predict(X_test)
print("XGBoost Classifier:")
print(classification_report(y_test, y_pred_xgb))
print("ROC-AUC:", roc_auc_score(y_test, xgb.predict_proba(X_test)[:,
1]))
print("-" * 60)

/usr/local/lib/python3.11/dist-packages/xgboost/core.py:158:
UserWarning: [14:42:51] WARNING: /workspace/src/learner.cc:740:
Parameters: { "use_label_encoder" } are not used.

warnings.warn(smsg, UserWarning)

XGBoost Classifier:
precision recall f1-score support

0 0.84 0.81 0.82 1037

1 0.81 0.84 0.83 1029

accuracy 0.83 2066

macro avg 0.83 0.83 0.83 2066
weighted avg 0.83 0.83 0.83 2066

ROC-AUC: 0.9048410933460034
------------------------------------------------------------

# Feature Importance from Random Forest

importances = rf.feature_importances_
indices = np.argsort(importances)[-10:]
features = X.columns[indices]

plt.figure(figsize=(10, 6))
plt.title("Top 10 Feature Importances (Random Forest)")
plt.barh(range(len(indices)), importances[indices], align="center")
plt.yticks(range(len(indices)), features)
plt.xlabel("Relative Importance")
plt.show()

Random Forest Classifier on Banking Dataset
No ratings yet
Random Forest Classifier on Banking Dataset
7 pages
Decision Tree, Random Forest
No ratings yet
Decision Tree, Random Forest
37 pages
Car Evaluation Data Analysis & Random Forest Model
No ratings yet
Car Evaluation Data Analysis & Random Forest Model
12 pages
Random Forest
No ratings yet
Random Forest
8 pages
Rev Insurance Business Report
No ratings yet
Rev Insurance Business Report
4 pages
Assgn 06 ML - Ipynb - Colab
No ratings yet
Assgn 06 ML - Ipynb - Colab
5 pages
NF Assighment4
No ratings yet
NF Assighment4
5 pages
Loan Default Prediction System 1753830667
No ratings yet
Loan Default Prediction System 1753830667
11 pages
DA PRA WEEK 13 (Random Forest) - 054551
No ratings yet
DA PRA WEEK 13 (Random Forest) - 054551
12 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
AAM 6th Prac
No ratings yet
AAM 6th Prac
3 pages
Classification
No ratings yet
Classification
3 pages
Big Data Practical
No ratings yet
Big Data Practical
20 pages
Dsbda 10
No ratings yet
Dsbda 10
5 pages
Code ExerciseModelSelection
100% (1)
Code ExerciseModelSelection
19 pages
Machine Learning Cheat Sheet
No ratings yet
Machine Learning Cheat Sheet
15 pages
Binary Classifier Evaluation Guide
No ratings yet
Binary Classifier Evaluation Guide
12 pages
ML Functions
No ratings yet
ML Functions
12 pages
CS326 Report
No ratings yet
CS326 Report
36 pages
Major Project
No ratings yet
Major Project
9 pages
Najir Shaikh Practical 4
No ratings yet
Najir Shaikh Practical 4
4 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
Exp 6
No ratings yet
Exp 6
3 pages
05 E RandomForest LoanData
No ratings yet
05 E RandomForest LoanData
8 pages
Machine Learning Assignment
No ratings yet
Machine Learning Assignment
8 pages
Random Forest
100% (1)
Random Forest
11 pages
Random Forest 1737667979
No ratings yet
Random Forest 1737667979
11 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
ML Asst.-01
No ratings yet
ML Asst.-01
21 pages
Detect Fake Profiles in Online Social Networks Using Support Vector Machine
No ratings yet
Detect Fake Profiles in Online Social Networks Using Support Vector Machine
8 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
CCD - Ipynb - Colab
No ratings yet
CCD - Ipynb - Colab
6 pages
Maternal-Risk-Prediction - Ipynb - Colab
No ratings yet
Maternal-Risk-Prediction - Ipynb - Colab
9 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Slip
No ratings yet
Slip
5 pages
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 3
No ratings yet
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 3
30 pages
ML Lab Programs 2
No ratings yet
ML Lab Programs 2
16 pages
AML Code For m2
No ratings yet
AML Code For m2
7 pages
ML Prac1-10
No ratings yet
ML Prac1-10
32 pages
ML Fat
No ratings yet
ML Fat
9 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Assign 4 8057
No ratings yet
Assign 4 8057
7 pages
Text Classification with ML Algorithms
No ratings yet
Text Classification with ML Algorithms
5 pages
Import As Import As From Import From Import From Import From Import
No ratings yet
Import As Import As From Import From Import From Import From Import
4 pages
Heart Disease Prediction Guide
100% (1)
Heart Disease Prediction Guide
73 pages
Supple Maximizing Performance in Cs CuBiCl
No ratings yet
Supple Maximizing Performance in Cs CuBiCl
5 pages
ML Lab 8
No ratings yet
ML Lab 8
9 pages
Reast Cancer Prediction Using Debt
No ratings yet
Reast Cancer Prediction Using Debt
18 pages
Ensemble Learning
No ratings yet
Ensemble Learning
1 page
Facebook Graph Link Prediction
No ratings yet
Facebook Graph Link Prediction
14 pages
10 Random - Forest - Algo
No ratings yet
10 Random - Forest - Algo
6 pages
Build A Random Forest Algorithm Aim
No ratings yet
Build A Random Forest Algorithm Aim
3 pages
ML Manual With Outputs
No ratings yet
ML Manual With Outputs
30 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Machine Learning Evaluation Guide
100% (1)
Machine Learning Evaluation Guide
504 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
DWDM Lab 3
No ratings yet
DWDM Lab 3
10 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
Cot Arts 6 Q4
No ratings yet
Cot Arts 6 Q4
10 pages
Optimization With R - Tips and Tricks
No ratings yet
Optimization With R - Tips and Tricks
17 pages
22 - Elementary Graph Algorithms
No ratings yet
22 - Elementary Graph Algorithms
55 pages
Spring Hibernate
No ratings yet
Spring Hibernate
3 pages
Hawk Modular RC Wing Airplane
No ratings yet
Hawk Modular RC Wing Airplane
19 pages
TM 2122 AVEVA Marine 12 1 Project Administration Hull Rev 4 0 PDF
100% (1)
TM 2122 AVEVA Marine 12 1 Project Administration Hull Rev 4 0 PDF
94 pages
Have A Question?: Customers Who Viewed This Item Also Viewed
No ratings yet
Have A Question?: Customers Who Viewed This Item Also Viewed
1 page
Medium Error During Reconstruction
No ratings yet
Medium Error During Reconstruction
3 pages
Guide Declaration Maladie Amc Sur Application Mobile DM Online Sanlam
No ratings yet
Guide Declaration Maladie Amc Sur Application Mobile DM Online Sanlam
18 pages
Past Papers LDC To UDC
No ratings yet
Past Papers LDC To UDC
118 pages
Protection of Multimedia Works Under: Research Synopsis
No ratings yet
Protection of Multimedia Works Under: Research Synopsis
7 pages
Bayes' Theorem
No ratings yet
Bayes' Theorem
20 pages
Introduction To Electrical Safety
No ratings yet
Introduction To Electrical Safety
5 pages
Group Ib Soc Consulting Whitepaper 2024
No ratings yet
Group Ib Soc Consulting Whitepaper 2024
40 pages
Web Evolution & Internet Basics
No ratings yet
Web Evolution & Internet Basics
33 pages
On The e Perturbation Method For Avoiding Degeneracy
No ratings yet
On The e Perturbation Method For Avoiding Degeneracy
7 pages
Distributed System Design Patterns
No ratings yet
Distributed System Design Patterns
25 pages
Breadth First Search-BFS
No ratings yet
Breadth First Search-BFS
24 pages
LabManualV1 5
No ratings yet
LabManualV1 5
121 pages
Legacy EA Instruction Manual
No ratings yet
Legacy EA Instruction Manual
2 pages
BPSC 102 em 2022 23
No ratings yet
BPSC 102 em 2022 23
16 pages
Node JS Routing
No ratings yet
Node JS Routing
107 pages
PFRS 25 New Brochure Rev D
No ratings yet
PFRS 25 New Brochure Rev D
4 pages
6 Diagnostic Stago
No ratings yet
6 Diagnostic Stago
6 pages
Bruteforce Android Pattern
No ratings yet
Bruteforce Android Pattern
5 pages
Loan Management System Report
No ratings yet
Loan Management System Report
30 pages
Bpr-Examples From Indian Corporate World
No ratings yet
Bpr-Examples From Indian Corporate World
29 pages
HUAWEI IdeaHub Pro & IdeaHub S Datasheet
No ratings yet
HUAWEI IdeaHub Pro & IdeaHub S Datasheet
8 pages
Eaton 9390 Datasheet Com5
No ratings yet
Eaton 9390 Datasheet Com5
12 pages
Falcon 7X-Ice and Rain Protection
No ratings yet
Falcon 7X-Ice and Rain Protection
106 pages