0% found this document useful (0 votes)

21 views2 pages

Assignment 2

The document outlines a Python notebook for a Titanic survival prediction assignment using logistic regression. It includes data preprocessing steps such as handling missing values and encoding categorical variables, followed by model training and evaluation. The final results indicate an accuracy of 81.01% and a ROC AUC score of 0.80.

Uploaded by

vaibhavi.darda

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views2 pages

Assignment 2

Uploaded by

vaibhavi.darda

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

4/14/25, 12:10 PM assignment2.

ipynb - Colab

!pip install -q scikit-learn pandas matplotlib seaborn

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score, roc_auc_score, confusion_matrix

from google.colab import files

uploaded = files.upload()

Choose Files train.csv

train.csv(text/csv) - 61194 bytes, last modified: 4/14/2025 - 100% done
Saving train csv to train csv
 

import pandas as pd

df = pd.read_csv('train.csv')
df.head()

PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked

0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S

Cumings, Mrs. John Bradley

1 2 1 1 female 38.0 1 0 PC 17599 71.2833 C85 C
(Florence Briggs Th...

STON/O2.
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 7.9250 NaN S
3101282

Futrelle, Mrs. Jacques Heath

3 4 1 1 female 35.0 1 0 113803 53.1000 C123 S
(Lily May Peel)

Next steps: Generate code with df toggle_off View recommended plots New interactive sheet

# Select relevant features and copy to avoid chained assignment warnings

titanic_data = df[['Survived', 'Pclass', 'Sex', 'Age']].copy()

# Fill missing Age values with median

titanic_data['Age'] = titanic_data['Age'].fillna(titanic_data['Age'].median())

# Convert 'Sex' to numeric: female = 0, male = 1

titanic_data['Sex'] = titanic_data['Sex'].map({'female': 0, 'male': 1})

# Check cleaned data

titanic_data.head()

Survived Pclass Sex Age

0 0 3 1 22.0

1 1 1 0 38.0

2 1 3 0 26.0

3 1 1 0 35.0

4 0 3 1 35.0

Next steps: Generate code with titanic_data toggle_off View recommended plots New interactive sheet

X = titanic_data[['Pclass', 'Sex', 'Age']]

y = titanic_data['Survived']

# Train-test split (80% train, 20% test)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LogisticRegression()
model.fit(X_train, y_train)

# Predict on test data

y_pred = model.predict(X_test)

accuracy = accuracy score(y test y pred)

https://colab.research.google.com/drive/1_2f18ZOIF0czondiv0Npfco5OKfbvbLJ#scrollTo=QJSHF4eaDQnt&printMode=true 1/2
4/14/25, 12:10 PM assignment2.ipynb - Colab
accuracy accuracy_score(y_test, y_pred)
roc_auc = roc_auc_score(y_test, y_pred)

# Print results
print(f"Accuracy: {accuracy * 100:.2f}%")
print(f"ROC AUC Score: {roc_auc:.2f}")

Accuracy: 81.01%
ROC AUC Score: 0.80

https://colab.research.google.com/drive/1_2f18ZOIF0czondiv0Npfco5OKfbvbLJ#scrollTo=QJSHF4eaDQnt&printMode=true 2/2

Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
5 pages
Titanic Logistic Regression Project
No ratings yet
Titanic Logistic Regression Project
35 pages
Program 7
No ratings yet
Program 7
2 pages
Python Experiment
No ratings yet
Python Experiment
3 pages
ML 3
No ratings yet
ML 3
9 pages
Titanic Survival Analysis
100% (2)
Titanic Survival Analysis
13 pages
01-Logistic Regression With Python
No ratings yet
01-Logistic Regression With Python
12 pages
TITANIC EJERCICIO - Ipynb - Colab
No ratings yet
TITANIC EJERCICIO - Ipynb - Colab
3 pages
Logistic Regression On Titanic Dataset
No ratings yet
Logistic Regression On Titanic Dataset
6 pages
Lab 5.ipynb - Colab
No ratings yet
Lab 5.ipynb - Colab
6 pages
178 - NaiveBaye's.ipynb - Colab
No ratings yet
178 - NaiveBaye's.ipynb - Colab
3 pages
Project Report
No ratings yet
Project Report
7 pages
Ds 9
No ratings yet
Ds 9
12 pages
9924 ML Lab3
No ratings yet
9924 ML Lab3
9 pages
Titanic PuneethRegonda
No ratings yet
Titanic PuneethRegonda
8 pages
Titanic Survival Prediction - Step-by-Step Guide
No ratings yet
Titanic Survival Prediction - Step-by-Step Guide
4 pages
Titanic Data Analysis
No ratings yet
Titanic Data Analysis
14 pages
ML - Lab 03.ipynb Colab
No ratings yet
ML - Lab 03.ipynb Colab
4 pages
Pandas Day 4
No ratings yet
Pandas Day 4
7 pages
Assignment ML
No ratings yet
Assignment ML
4 pages
Titanic Data Analysis with Python
No ratings yet
Titanic Data Analysis with Python
1 page
LogisticRegressionMLModel - Jupyter Notebook
No ratings yet
LogisticRegressionMLModel - Jupyter Notebook
14 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
Day 20
No ratings yet
Day 20
5 pages
Random Forest: Random Forest Has Classifier For Classification and Regressor For Regression
No ratings yet
Random Forest: Random Forest Has Classifier For Classification and Regressor For Regression
9 pages
TP Ai Titanic
No ratings yet
TP Ai Titanic
1 page
Dspracticalexternak 23 Aug
No ratings yet
Dspracticalexternak 23 Aug
8 pages
Titanic Data
No ratings yet
Titanic Data
5 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
Advanced Python for Data Scientists
No ratings yet
Advanced Python for Data Scientists
19 pages
9914 ML Lab3
No ratings yet
9914 ML Lab3
6 pages
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
7 pages
Naive Baye
No ratings yet
Naive Baye
1 page
Iml Project
No ratings yet
Iml Project
13 pages
Titanic Dataset
No ratings yet
Titanic Dataset
9 pages
Titanic Data Analysis & Modeling
No ratings yet
Titanic Data Analysis & Modeling
11 pages
Titanic Eda
No ratings yet
Titanic Eda
17 pages
Titanic Data Analysis Guide
No ratings yet
Titanic Data Analysis Guide
1 page
Titanic
No ratings yet
Titanic
6 pages
The Titanic Dataset
No ratings yet
The Titanic Dataset
6 pages
Titanic Survival Prediction Guide
No ratings yet
Titanic Survival Prediction Guide
16 pages
Day 20
No ratings yet
Day 20
5 pages
DL Assignment 1
No ratings yet
DL Assignment 1
7 pages
Titanic ML for Data Scientists
No ratings yet
Titanic ML for Data Scientists
36 pages
Machine Learning Lab: Titanic PCA & ID3 Decision Tree
No ratings yet
Machine Learning Lab: Titanic PCA & ID3 Decision Tree
19 pages
Titanic Data Analysis & Modeling
No ratings yet
Titanic Data Analysis & Modeling
12 pages
LOGISTIC - REGRESSION - Jupyter Notebook
No ratings yet
LOGISTIC - REGRESSION - Jupyter Notebook
18 pages
4.1.3.5 Lab - Decision Tree Classification
No ratings yet
4.1.3.5 Lab - Decision Tree Classification
11 pages
DataWare Housing Asg01 Shaheer Zia Qazi-47-2
No ratings yet
DataWare Housing Asg01 Shaheer Zia Qazi-47-2
9 pages
AM19 EDA Assignment1
No ratings yet
AM19 EDA Assignment1
13 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
28 pages
ML - Other Pracs
No ratings yet
ML - Other Pracs
7 pages
Indraneel S (RA2211003010421)
No ratings yet
Indraneel S (RA2211003010421)
21 pages
PANDAS Groupby Continues 2
No ratings yet
PANDAS Groupby Continues 2
5 pages
Coding Titanicmain
No ratings yet
Coding Titanicmain
58 pages
Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
14 pages
Data Mining
No ratings yet
Data Mining
59 pages
ML Dataset Performance
No ratings yet
ML Dataset Performance
11 pages
BE R A-2019 Final Syllabus
No ratings yet
BE R A-2019 Final Syllabus
63 pages
Assignment 4
No ratings yet
Assignment 4
4 pages
Networking Basics Certificate Vaibhavi Darda Gmail Com C69ad510 23d3 41d3 957a 5ad6b4d86a44
No ratings yet
Networking Basics Certificate Vaibhavi Darda Gmail Com C69ad510 23d3 41d3 957a 5ad6b4d86a44
1 page
AIFR Unit 1
No ratings yet
AIFR Unit 1
7 pages
Assignment 1
No ratings yet
Assignment 1
2 pages
Metaheuristics Vs Mathematical Optimization
No ratings yet
Metaheuristics Vs Mathematical Optimization
5 pages
Advertising Expenditure (RM'000)
No ratings yet
Advertising Expenditure (RM'000)
5 pages
A Comparative Study On Machine Learning Techniques Using Titanic Dataset
No ratings yet
A Comparative Study On Machine Learning Techniques Using Titanic Dataset
6 pages
Ayush File 1
No ratings yet
Ayush File 1
37 pages
CS871 Classification Assignment
No ratings yet
CS871 Classification Assignment
4 pages
Lec5 Classification
No ratings yet
Lec5 Classification
27 pages
Machine Learning May 2024
No ratings yet
Machine Learning May 2024
8 pages
An Incremental Clustering Algorithm Based On Mahalanobis Distance
No ratings yet
An Incremental Clustering Algorithm Based On Mahalanobis Distance
1 page
ML Unit-3
No ratings yet
ML Unit-3
15 pages
DWM Lab 07 Saif Bodu
No ratings yet
DWM Lab 07 Saif Bodu
100 pages
L - Unbalanced Credit Card Fraud Detection
No ratings yet
L - Unbalanced Credit Card Fraud Detection
8 pages
PA Research Papers
No ratings yet
PA Research Papers
5 pages
Cluster Analysis
No ratings yet
Cluster Analysis
60 pages
Correlation and Regression
100% (1)
Correlation and Regression
100 pages
Event - Training - Workshop Reporting Templates
No ratings yet
Event - Training - Workshop Reporting Templates
19 pages
Confusion Matrix and Outliers
No ratings yet
Confusion Matrix and Outliers
32 pages
878 2234 1 PB
No ratings yet
878 2234 1 PB
12 pages
AI & ML Unit 4 Notes
No ratings yet
AI & ML Unit 4 Notes
16 pages
AIML Manual V1 2-86
No ratings yet
AIML Manual V1 2-86
85 pages
Analysis of Bank Marketing For Term Deposit Using Data Mining Techniques
No ratings yet
Analysis of Bank Marketing For Term Deposit Using Data Mining Techniques
11 pages
Milk Quality Prediction
No ratings yet
Milk Quality Prediction
28 pages
SGA vs NSSA for Hospital Nutrition Assessment
No ratings yet
SGA vs NSSA for Hospital Nutrition Assessment
8 pages
UNIT5
No ratings yet
UNIT5
60 pages
Define K - Means Clustering? Describe About Bayes Classifier and Support Vector Machine (SVM) ?
No ratings yet
Define K - Means Clustering? Describe About Bayes Classifier and Support Vector Machine (SVM) ?
1 page
CSE 319 Pattern Recognition: Clustering
No ratings yet
CSE 319 Pattern Recognition: Clustering
58 pages
Machine Learning Laboratory Record Book: 1 Find S Algorithm
No ratings yet
Machine Learning Laboratory Record Book: 1 Find S Algorithm
22 pages
Machine Learning
No ratings yet
Machine Learning
16 pages
Solutions
No ratings yet
Solutions
25 pages
Dendrogram - Slides
No ratings yet
Dendrogram - Slides
27 pages
Unacademy Plus Trigonometry Formula
No ratings yet
Unacademy Plus Trigonometry Formula
4 pages

Assignment 2

Uploaded by

Assignment 2

Uploaded by

4/14/25, 12:10 PM assignment2.

!pip install -q scikit-learn pandas matplotlib seaborn

from google.colab import files

Choose Files train.csv

Cumings, Mrs. John Bradley

Futrelle, Mrs. Jacques Heath

# Select relevant features and copy to avoid chained assignment warnings

# Fill missing Age values with median

# Convert 'Sex' to numeric: female = 0, male = 1

# Check cleaned data

Survived Pclass Sex Age

X = titanic_data[['Pclass', 'Sex', 'Age']]

# Train-test split (80% train, 20% test)

# Predict on test data

accuracy = accuracy score(y test y pred)

You might also like