ML Week3

The document outlines a process for analyzing the breast cancer dataset using Python libraries such as pandas, seaborn, and scikit-learn. It includes steps for data loading, checking for missing values, visualizing correlations, scaling features, splitting data into training and testing sets, training a Decision Tree Classifier, and evaluating its accuracy. The model achieved an accuracy of approximately 96.1% and includes a visualization of the decision tree.

Uploaded by

gheffley.0001

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views3 pages

ML Week3

Uploaded by

gheffley.0001

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

# Install necessary packages (if running in Colab)

!pip install seaborn

# Import required libraries

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

# Load built-in dataset

data = load_breast_cancer()
df = pd.DataFrame(data.data, columns=data.feature_names)
y = pd.Series(data.target)

# Check for missing values

print("Missing values:\n", df.isna().sum())

# Correlation matrix
plt.figure(figsize=(15, 11))
sns.heatmap(df.corr(), annot=False, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()

# Feature scaling
scaler = StandardScaler()
X_scaled = scaler.fit_transform(df)

# Train-test split
x_train, x_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.27, random_state=42)

# Decision tree model

tree = DecisionTreeClassifier(random_state=42, criterion='entropy', max_depth=4)
tree.fit(x_train, y_train)
y_pred = tree.predict(x_test)

# Accuracy
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy * 100)

# Visualize decision tree

plt.figure(figsize=(12, 8))
plot_tree(tree, filled=True, class_names=data.target_names, feature_names=data.feature_names, rounded=True, fontsize=8)
plt.title('Decision Tree Visualization')
plt.show()
Requirement already satisfied: seaborn in /usr/local/lib/python3.11/dist-packages (0.13.2)
Requirement already satisfied: numpy!=1.24.0,>=1.20 in /usr/local/lib/python3.11/dist-packages (from seaborn) (2.0.2)
Requirement already satisfied: pandas>=1.2 in /usr/local/lib/python3.11/dist-packages (from seaborn) (2.2.2)
Requirement already satisfied: matplotlib!=3.6.1,>=3.4 in /usr/local/lib/python3.11/dist-packages (from seaborn) (3.10.0)
Requirement already satisfied: contourpy>=1.0.1 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn)
Requirement already satisfied: cycler>=0.10 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn) (0.12
Requirement already satisfied: fonttools>=4.22.0 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn)
Requirement already satisfied: kiwisolver>=1.3.1 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn)
Requirement already satisfied: packaging>=20.0 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn) (2
Requirement already satisfied: pillow>=8 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn) (11.1.0
Requirement already satisfied: pyparsing>=2.3.1 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seaborn)
Requirement already satisfied: python-dateutil>=2.7 in /usr/local/lib/python3.11/dist-packages (from matplotlib!=3.6.1,>=3.4->seabor
Requirement already satisfied: pytz>=2020.1 in /usr/local/lib/python3.11/dist-packages (from pandas>=1.2->seaborn) (2025.2)
Requirement already satisfied: tzdata>=2022.7 in /usr/local/lib/python3.11/dist-packages (from pandas>=1.2->seaborn) (2025.2)
Requirement already satisfied: six>=1.5 in /usr/local/lib/python3.11/dist-packages (from python-dateutil>=2.7->matplotlib!=3.6.1,>=3
Missing values:
mean radius 0
mean texture 0
mean perimeter 0
mean area 0
mean smoothness 0
mean compactness 0
mean concavity 0
mean concave points 0
mean symmetry 0
mean fractal dimension 0
radius error 0
texture error 0
perimeter error 0
area error 0
smoothness error 0
compactness error 0
concavity error 0
concave points error 0
symmetry error 0
fractal dimension error 0
worst radius 0
worst texture 0
worst perimeter 0
worst area 0
worst smoothness 0
worst compactness 0
worst concavity 0
worst concave points 0
worst symmetry 0
worst fractal dimension 0
dtype: int64
Accuracy: 96.1038961038961

Cancer Classification
No ratings yet
Cancer Classification
21 pages
20BCP021 Assignment 3
No ratings yet
20BCP021 Assignment 3
7 pages
45B AIML Practical 08
No ratings yet
45B AIML Practical 08
10 pages
ML - LAB 2 - Jupyter Notebook
No ratings yet
ML - LAB 2 - Jupyter Notebook
9 pages
ML Project - Binary - Colaboratory
No ratings yet
ML Project - Binary - Colaboratory
7 pages
1FsWES7YJDERHD-bZ2ujFakbQyzi6 Yin
No ratings yet
1FsWES7YJDERHD-bZ2ujFakbQyzi6 Yin
9 pages
DIY Bagging Boosting
No ratings yet
DIY Bagging Boosting
14 pages
Script Group8
No ratings yet
Script Group8
19 pages
LAB # 08 Naive Bayes - Ipynb - Colab
No ratings yet
LAB # 08 Naive Bayes - Ipynb - Colab
3 pages
Breast Cancer Classification With Machine Learning
No ratings yet
Breast Cancer Classification With Machine Learning
17 pages
Breast Cancer Diagnosis 1703707725
No ratings yet
Breast Cancer Diagnosis 1703707725
52 pages
Breast Cancer Prdiction
No ratings yet
Breast Cancer Prdiction
16 pages
5 Breast Cancer Model - Ipynb Colab
No ratings yet
5 Breast Cancer Model - Ipynb Colab
5 pages
Machine Learning Algorithm
No ratings yet
Machine Learning Algorithm
18 pages
AML - LAB21 6 6 1.ipynb - Colab
No ratings yet
AML - LAB21 6 6 1.ipynb - Colab
6 pages
MLT - Colab
No ratings yet
MLT - Colab
12 pages
Project 1
No ratings yet
Project 1
6 pages
Lab 8
No ratings yet
Lab 8
2 pages
Breast Cancer Data Analysis
No ratings yet
Breast Cancer Data Analysis
6 pages
Experiment - 12: Random Forest in Python
No ratings yet
Experiment - 12: Random Forest in Python
3 pages
Notebooklien 1
No ratings yet
Notebooklien 1
1 page
Sample Dataset - CSV
No ratings yet
Sample Dataset - CSV
27 pages
Breast Cancer Perdication Model - Using ML
No ratings yet
Breast Cancer Perdication Model - Using ML
14 pages
Assignment 1 - Introduction To Machine Learning: Version 1.0 of This Notebook. To Download
0% (1)
Assignment 1 - Introduction To Machine Learning: Version 1.0 of This Notebook. To Download
30 pages
Random Forest
No ratings yet
Random Forest
5 pages
Breast Cancer Classification Using DTC
No ratings yet
Breast Cancer Classification Using DTC
1 page
A008 - KNN.R: # Load The Dataset
No ratings yet
A008 - KNN.R: # Load The Dataset
4 pages
Python Code For Machine Learning
No ratings yet
Python Code For Machine Learning
26 pages
# Import Plotting Libraries: in (1) : Import Pandas As PD
No ratings yet
# Import Plotting Libraries: in (1) : Import Pandas As PD
13 pages
Mini Project
No ratings yet
Mini Project
8 pages
Exercise 10
No ratings yet
Exercise 10
4 pages
Breastcancer
No ratings yet
Breastcancer
13 pages
Feature Selection & Dimensionality Reduction
No ratings yet
Feature Selection & Dimensionality Reduction
3 pages
Support Vector Machines Com Python
No ratings yet
Support Vector Machines Com Python
13 pages
Logistic Regression For Binary Classification With Core APIs - TensorFlow Core
No ratings yet
Logistic Regression For Binary Classification With Core APIs - TensorFlow Core
22 pages
Suneel Varma
No ratings yet
Suneel Varma
11 pages
Project
No ratings yet
Project
18 pages
Practical 6
No ratings yet
Practical 6
8 pages
Mini Project With Output
No ratings yet
Mini Project With Output
8 pages
Apple Vs Orange
No ratings yet
Apple Vs Orange
24 pages
Breat Cancer Detection Using Thermograpgy
No ratings yet
Breat Cancer Detection Using Thermograpgy
15 pages
tp3 Last
No ratings yet
tp3 Last
34 pages
Experiment 3
No ratings yet
Experiment 3
8 pages
Howxtre
No ratings yet
Howxtre
8 pages
Inbuilt Kmeans
No ratings yet
Inbuilt Kmeans
3 pages
MNIST CNN & SVM Classification
No ratings yet
MNIST CNN & SVM Classification
5 pages
Rice Leaf Project
No ratings yet
Rice Leaf Project
15 pages
TP 3
No ratings yet
TP 3
32 pages
PCA
No ratings yet
PCA
23 pages
Data Reduction Cananea
No ratings yet
Data Reduction Cananea
44 pages
Importing Libraries: Pandas PD Matplotlib - Pyplot PLT Numpy NP
No ratings yet
Importing Libraries: Pandas PD Matplotlib - Pyplot PLT Numpy NP
10 pages
EXP 07 (ML) - Ashu
No ratings yet
EXP 07 (ML) - Ashu
4 pages
Naive Bayes Code
No ratings yet
Naive Bayes Code
5 pages
GenAI - Lab-File - Darab Khan 22SCSE1480055
No ratings yet
GenAI - Lab-File - Darab Khan 22SCSE1480055
31 pages
EXP 07 (ML) - Darshu
No ratings yet
EXP 07 (ML) - Darshu
4 pages
Tea & AI
No ratings yet
Tea & AI
21 pages
Ex 5 - NN - Wheat Seed Data
No ratings yet
Ex 5 - NN - Wheat Seed Data
9 pages
Import As Import As Import Import As Import As From Import From Import From Import From Import From Import From Import
No ratings yet
Import As Import As Import Import As Import As From Import From Import From Import From Import From Import From Import
4 pages
Experiment 2
No ratings yet
Experiment 2
5 pages
The Ybanag Literature
80% (5)
The Ybanag Literature
29 pages
Basavaraj Donur
No ratings yet
Basavaraj Donur
3 pages
MTB 2 Q2 Week 2 DLL
No ratings yet
MTB 2 Q2 Week 2 DLL
5 pages
Word List: Unit 2
No ratings yet
Word List: Unit 2
13 pages
Ulrich Pagel: The Bodhisattvapitaka
No ratings yet
Ulrich Pagel: The Bodhisattvapitaka
519 pages
Resume of Satish 16122009
No ratings yet
Resume of Satish 16122009
4 pages
EN0603 - PYQP - To A Pair of Sarus Cranes
No ratings yet
EN0603 - PYQP - To A Pair of Sarus Cranes
7 pages
Ethereum Data Structures: Kamil Jezek
No ratings yet
Ethereum Data Structures: Kamil Jezek
27 pages
Get Fluent With Friends - Talking Dirty (Lesson Sample)
No ratings yet
Get Fluent With Friends - Talking Dirty (Lesson Sample)
3 pages
C Language Question Bca 1st Sem
No ratings yet
C Language Question Bca 1st Sem
3 pages
Xauusd Advanced Predictor
100% (1)
Xauusd Advanced Predictor
3 pages
10 STD English
No ratings yet
10 STD English
4 pages
List #2: HOMOPHONES - Crossword Labs
No ratings yet
List #2: HOMOPHONES - Crossword Labs
2 pages
9403 Brian Grattan Light
No ratings yet
9403 Brian Grattan Light
2 pages
PAS I Bhs Inggris XII
No ratings yet
PAS I Bhs Inggris XII
6 pages
Bigolas Dickolas WoIfwood (@maskofbun) Twitter 2
No ratings yet
Bigolas Dickolas WoIfwood (@maskofbun) Twitter 2
1 page
IPT Chapter 1
No ratings yet
IPT Chapter 1
11 pages
Digital Electronics Exam Paper
No ratings yet
Digital Electronics Exam Paper
2 pages
Marking Guideline
No ratings yet
Marking Guideline
12 pages
I Sem-Question Bank-2024 Module - 5 Matrix Theory For CS and EE
No ratings yet
I Sem-Question Bank-2024 Module - 5 Matrix Theory For CS and EE
6 pages
Mobile Apps: Types and Trends
No ratings yet
Mobile Apps: Types and Trends
10 pages
Essay Rubric: 6-Point Criteria
No ratings yet
Essay Rubric: 6-Point Criteria
3 pages
3139 01 5RP AFP tcm143-700701
No ratings yet
3139 01 5RP AFP tcm143-700701
10 pages
Understanding Surah Al-Ikhlas
100% (1)
Understanding Surah Al-Ikhlas
11 pages
Unit V Development of Surfaces
No ratings yet
Unit V Development of Surfaces
6 pages
Food Genes and Culture Eating Right For Your Origins 2nd Edition Gary Paul Nabhan Online PDF
100% (1)
Food Genes and Culture Eating Right For Your Origins 2nd Edition Gary Paul Nabhan Online PDF
101 pages
Advanced Programming With Net
No ratings yet
Advanced Programming With Net
3 pages
(Oxford Graduate Texts) Jean Zinn-Justin - Path Integrals in Quantum Mechanics (2010, Oxford University Press) - Libgen - Li
No ratings yet
(Oxford Graduate Texts) Jean Zinn-Justin - Path Integrals in Quantum Mechanics (2010, Oxford University Press) - Libgen - Li
335 pages
CSU IEP JAN 26, 2022 - Unit 2 NorthStar 4 - D
No ratings yet
CSU IEP JAN 26, 2022 - Unit 2 NorthStar 4 - D
4 pages
Humor & Villainy in "The Cask of Amontillado"
No ratings yet
Humor & Villainy in "The Cask of Amontillado"
3 pages

ML Week3

Uploaded by

ML Week3

Uploaded by

# Install necessary packages (if running in Colab)

!pip install seaborn

# Import required libraries

# Load built-in dataset

# Check for missing values

# Decision tree model

# Visualize decision tree

You might also like