Random Forest

The document outlines a process for predicting breast cancer using the K-Nearest Neighbors (KNN) algorithm with the sklearn library. It includes steps for loading the dataset, standardizing features, splitting the data into training and testing sets, and evaluating model performance with different values of K. The results are visualized through error rate plots and classification reports for various K values.

Uploaded by

7alphaone

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views2 pages

Random Forest

Uploaded by

7alphaone

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt
import numpy as np
get_ipython ().run_line_magic ('matplotlib', 'inline')

#Get the Data

from sklearn.datasets import load_breast_cancer

cancer load_breast_cancer()

cancer.keys()

print (cancer [DESCR'])

cancer ['feature_names']

# Set up DataFrame
df feat pd.DataFrame (cancer ['data'], columns-cancer ['feature_names']) df
feat.info()
# In [9]:
cancer ['target']
# In [10]:
df_target pd.DataFrame (cancer ['target'], columns=['Cancer'])

df_feat.head()

# Standardizing the variables

from sklearn.preprocessing import StandardScaler
scaler StandardScaler()
scaler.fit(df_feat)
StandardScaler (copy-True, with mean-True, with_std=True)
scaled_features = scaler.transform(df_feat)

# In [25]:
df_feat_scaled= pd.DataFrame(scaled_features, columns=df_feat.columns)
In [26]:
dr_feat_scaled.head()
In [27]:
Train Test Split
from sklearn.model_selection import train_test_split
X_train, X_test, y train, y_test= train_test_split (scaled features, np.ravel
(df_target), test_size=0.30, random_state=105)

# In [20]:
#Using KNN Remember that we are trying to come up with a model to predict TARGET as
cancerouse or not. We'll start with k-1.
from sklearn.neighbors import KNeighborsClassifier
# In [29]:
knn KNeighborsClassifier (n_neighbors-1)
# In [30]:
knn.fit(X_train,y_train)
pred=knn.predict(X_test)
From sklearn.statistics import classification_report,confusion_matrix
print(confusion_matrix(y_test,pred))
print(classification_report(y_test,pred))
error_rate =[]

for i in range (1,40):

knn = KNeighborsClassifier(n_neighbors=i)
knn.fit (X_train, y_train)
pred_i =knn.predict (X_test)
error_rate.append(np.mean (pred_i != y_test))
In [36]:
plt.figure (figsize=(10,6))
plt.plot (range (1,40), error rate, color='blue', linestyle'dashed', marker-'o',
markerfacecolor='red', markersize=10)
plt.title('Error Rate vs. K Value')
plt.xlabel('K')
plt.ylabel('Error Rate')

# WITH K=1
knn=KNeighborsClassifier (n_neighbors=1)
knn.fit (X_train, y_train)
pred= knn.predict (X_test)
print('WITH K-1')
print('\n')
print(confusion matrix (y_test, pred))
print('\n')
print(classification_report (y_test, pred))

In [39]:
#NOW WITH K=21
knn= KNeighborsClassifier (n_neighbors=21)
knn.fit(X_train, y_train)
pred= knn.predict (X_test)
print('WITH k=21)
print('\n')
print (confusion matrix (y_test,pred))
print('\n')
print (classification_report (y_test,pred))

Labaihw
No ratings yet
Labaihw
1 page
KNN Classification with Scaling
No ratings yet
KNN Classification with Scaling
4 pages
DSASSign 4
No ratings yet
DSASSign 4
11 pages
LAB9
No ratings yet
LAB9
3 pages
KnnClassifier - Jupyter Notebook
No ratings yet
KnnClassifier - Jupyter Notebook
2 pages
Experiment 4
No ratings yet
Experiment 4
8 pages
Preductive Modelling Assignment
No ratings yet
Preductive Modelling Assignment
3 pages
Assignment 1
No ratings yet
Assignment 1
2 pages
KNN
No ratings yet
KNN
2 pages
From Import: Dict - Keys ( ('Data', 'Target', 'Frame', 'Target - Names', 'DESCR', 'Feature - Names', 'Filename', 'Data - Module') )
No ratings yet
From Import: Dict - Keys ( ('Data', 'Target', 'Frame', 'Target - Names', 'DESCR', 'Feature - Names', 'Filename', 'Data - Module') )
4 pages
Awesome
No ratings yet
Awesome
6 pages
Cancer Disease Classification
No ratings yet
Cancer Disease Classification
6 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
Heart Disease Prediction
No ratings yet
Heart Disease Prediction
2 pages
1 Supervise Learning (KNN) (Solution) : 1.1 Distance Measuring in Machine Learning
No ratings yet
1 Supervise Learning (KNN) (Solution) : 1.1 Distance Measuring in Machine Learning
14 pages
Ai in HC - 2
No ratings yet
Ai in HC - 2
9 pages
MLLABDA2
No ratings yet
MLLABDA2
5 pages
Samplecode (HDPS)
No ratings yet
Samplecode (HDPS)
29 pages
DWDM Lab 3
No ratings yet
DWDM Lab 3
10 pages
Python Code For KNN Classifier 1. Initial Message
No ratings yet
Python Code For KNN Classifier 1. Initial Message
7 pages
Lab4 23cs142
No ratings yet
Lab4 23cs142
2 pages
Heart Dis
No ratings yet
Heart Dis
13 pages
KNN Using Wisconsin Breast Cancer Dataset
No ratings yet
KNN Using Wisconsin Breast Cancer Dataset
2 pages
Assignment 5 - SourceCode - Ipynb - Colab
No ratings yet
Assignment 5 - SourceCode - Ipynb - Colab
4 pages
Appendix - Complete Code Implementation
No ratings yet
Appendix - Complete Code Implementation
8 pages
Breast Cancer Classification Using DTC
No ratings yet
Breast Cancer Classification Using DTC
1 page
AI - ML22203009 - Assignment-10
No ratings yet
AI - ML22203009 - Assignment-10
3 pages
Breast Cancer SVM Classification Guide
No ratings yet
Breast Cancer SVM Classification Guide
2 pages
00 KNN Classification
No ratings yet
00 KNN Classification
8 pages
ML
No ratings yet
ML
11 pages
Data Com ML PDF Code + Output
No ratings yet
Data Com ML PDF Code + Output
6 pages
Code 1
No ratings yet
Code 1
3 pages
Decision Support
No ratings yet
Decision Support
21 pages
PDF To Jpeg
No ratings yet
PDF To Jpeg
7 pages
Lab 8
No ratings yet
Lab 8
2 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
1
No ratings yet
1
13 pages
Scikit-Learn Python Cheat Sheet
100% (1)
Scikit-Learn Python Cheat Sheet
1 page
Exp 4 ML
No ratings yet
Exp 4 ML
3 pages
DMT Cia2
No ratings yet
DMT Cia2
11 pages
ML L - Ab
No ratings yet
ML L - Ab
13 pages
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
No ratings yet
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
8 pages
Implementing KNN Algorithm On The Iris Dataset
No ratings yet
Implementing KNN Algorithm On The Iris Dataset
7 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
Predicting Breast Cancer Using Logistic Regression - by Mo Kaiser - The Startup - Medium
No ratings yet
Predicting Breast Cancer Using Logistic Regression - by Mo Kaiser - The Startup - Medium
15 pages
Untitled Document
No ratings yet
Untitled Document
1 page
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
ML Lab Programs
No ratings yet
ML Lab Programs
23 pages
KNN
No ratings yet
KNN
2 pages
Assignment 6
No ratings yet
Assignment 6
5 pages
KNN for Cancer Classification
No ratings yet
KNN for Cancer Classification
6 pages
Linear Regression
No ratings yet
Linear Regression
3 pages
1 10
No ratings yet
1 10
4 pages
17.11.24 - Jupyter Notebook - Doc
No ratings yet
17.11.24 - Jupyter Notebook - Doc
6 pages
Untitled Document
No ratings yet
Untitled Document
2 pages
Meaningful Predictive Modeling Week-4 Assignment Cancer Disease Prediction
No ratings yet
Meaningful Predictive Modeling Week-4 Assignment Cancer Disease Prediction
6 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
Breast Cancer Classification with Scikit-learn
No ratings yet
Breast Cancer Classification with Scikit-learn
4 pages
All in One
No ratings yet
All in One
13 pages

Random Forest

Uploaded by

Random Forest

Uploaded by

import pandas as pd

import seaborn as sns

#Get the Data

print (cancer [DESCR'])

# Standardizing the variables

for i in range (1,40):

You might also like