0% found this document useful (0 votes)

48 views4 pages

Kmeans Clustering

The document outlines various clustering and statistical analysis techniques using the USArrests dataset, including K-means and hierarchical clustering methods. It also covers the computation of variance-covariance and correlation matrices, as well as principal component analysis (PCA) with visualizations. Additionally, it demonstrates the generation of multivariate normal samples and their statistical properties.

Uploaded by

Ankush Kumar Yede

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

48 views4 pages

Kmeans Clustering

Uploaded by

Ankush Kumar Yede

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

#kmeans clustering

set.seed(100)

data=USArrests

f<-kmeans(data, 3, iter.max = 100, nstart = 2)

t<-f$cluster

table(t)

#Hierarchical clustering

data=USArrests

d <- dist(data, method = "euclidean")

fit <- hclust(d, method="single")

fit <- hclust(d, method="complete")

fit <- hclust(d, method="average")

clusters=cutree(fit,3)

table(clusters)

plot(fit)

#sample var-cov matrix and corr matrix

y1=c(35,35,40,10,6,20,35,35,35,30)

y2=c(3.5,4.9,30.0,2.8,2.7,2.8,4.6,10.9,8.0,1.6)

y3=c(2.80,2.70,4.38,3.21,2.73,2.81,2.88,2.90,3.28,3.20)

data1=cbind(y1,y2,y3)

data1

varcov=cov(data1)

varcov
corr=cov2cor(varcov)

corr

Height=c(69,74,68,70,72,67,66,70,76,68,72,79,74,67,66,71,74,75,75,76)

Weight=c(153,175,155,135,172,150,115,137,200,130,140,265,185,112,140,150,165,185,210,220)

sample=data.frame(Height,Weight)

sigma=matrix(c(20,100,100,1000),nrow=2,ncol=2,byrow=T)

mu0=c(70,170)

N=20

#H0:mu=mu0

#Test statistic

X_bar=colMeans(sample)

(chi_cal=N*(X_bar-mu0)%*%solve(sigma)%*%cbind(X_bar-mu0))

(chi_tab=qchisq(0.95,2))

#principal component analysis

model<-prcomp(USArrests,scale. = TRUE)

summary(model)

plot(model,main="Scree Plots with bars")

plot(model,type="l",main="Scree Plots with line")

y1=c(191,195,181,183,176,208,189,197,188,192,179,183,174,190,188,163,195,186,181,175,192,174,17
6,197,190)
y2=c(155,149,148,153,144,157,150,159,152,150,158,147,150,159,151,137,155,153,145,140,154,143,13
9,167,163)

x1=c(179,201,185,188,171,192,190,189,197,187,186,174,185,195,187,161,183,173,182,165,185,178,17
6,200,187)

x2=c(145,152,149,149,142,152,149,152,159,151,148,147,152,157,158,130,158,148,146,137,152,147,14
3,158,150)

matrix=matrix(c(y1,y2,x1,x2),ncol=4,nrow=25,byrow=FALSE)

colnames(matrix)=c("y1","y2","x1","x2")

matrix

round(colMeans(matrix),digit=4)

round(cov(matrix),digit=4)

set.seed(100)

u=c(3,1,4)

sigma1=matrix(c(6,1,-2,1,13,4,-2,4,4),nrow=3)

library("MASS")

sample=round(mvrnorm(n=50,mu=u,Sigma=sigma1),digits = 4);sample[c(1,2),]

sample_mean=round(cbind(colMeans(sample)),digits = 0)

sample_varcov=round(cbind(cov(sample)),digits = 0)

mu2=c(-2,3,-1,5)

sigma2=matrix(c(11,-8,3,9,-8,9,-3,-6,3,-3,2,3,9,-6,3,9),nrow=4)

y1=mvrnorm(n=50,mu=mu2,Sigma = sigma2)

y_mu=y1-matrix(rep(mu2,50),ncol=4,byrow=TRUE)

T=chol(sigma2)
round(T,4)

t(T)%*%T

T_t_inv=solve(t(T))

z=t(T_t_inv%*%t(y_mu));dim(z)

round(head(z),4)

round(colMeans(z),0)

round(cov(z,z),0)

c1=eigen(sigma2)$vectors

D1=diag(sqrt(eigen(sigma2)$values))

sigma3=c1%*%D1%*%t(c1);sigma3

sigma3inv=solve(sigma3)

z2=round(crossprod(sigma3inv,t(1)),digits = 4);t(z2[,c(1,2)])

Da 06-10
No ratings yet
Da 06-10
14 pages
Experiment 6
No ratings yet
Experiment 6
7 pages
Mla - 2 (Cia - 3) - 20221013
No ratings yet
Mla - 2 (Cia - 3) - 20221013
21 pages
DATAMINING
No ratings yet
DATAMINING
24 pages
Health & Economic Clustering Report
91% (11)
Health & Economic Clustering Report
18 pages
Inter Cluster Inertia Gains: Slim Kammoun
No ratings yet
Inter Cluster Inertia Gains: Slim Kammoun
13 pages
Clustering R Codes
No ratings yet
Clustering R Codes
2 pages
Toc ch1
No ratings yet
Toc ch1
9 pages
Clustering 2
No ratings yet
Clustering 2
11 pages
Department Of: Computer Science & Engineering
No ratings yet
Department Of: Computer Science & Engineering
4 pages
Final Group 1
No ratings yet
Final Group 1
31 pages
R Lab Program
No ratings yet
R Lab Program
20 pages
Cluster
No ratings yet
Cluster
3 pages
Aiml Assignment 10
No ratings yet
Aiml Assignment 10
6 pages
Data Mining Business Report 2
No ratings yet
Data Mining Business Report 2
18 pages
06K Means Clustering
No ratings yet
06K Means Clustering
4 pages
Da Thoery
No ratings yet
Da Thoery
24 pages
Aman DA 111
No ratings yet
Aman DA 111
14 pages
Agenda: 1. Introduction To Clustering
No ratings yet
Agenda: 1. Introduction To Clustering
47 pages
WGCNA
No ratings yet
WGCNA
15 pages
Data Mining Solve
No ratings yet
Data Mining Solve
5 pages
Unsupervised Methods Overview
No ratings yet
Unsupervised Methods Overview
26 pages
Rlab SS
No ratings yet
Rlab SS
25 pages
Segmentation:Clustering: Krissie 2024-11-21
No ratings yet
Segmentation:Clustering: Krissie 2024-11-21
26 pages
Datamininganddataware
No ratings yet
Datamininganddataware
25 pages
DATA-51000-ClusteringAssignmentTemplateNew Maternal Health Risk
No ratings yet
DATA-51000-ClusteringAssignmentTemplateNew Maternal Health Risk
12 pages
Heart Disease Prediction
No ratings yet
Heart Disease Prediction
2 pages
06 - K Means Clustering
No ratings yet
06 - K Means Clustering
36 pages
Clustering Mall Data Students
No ratings yet
Clustering Mall Data Students
11 pages
Rstudio Cours
No ratings yet
Rstudio Cours
11 pages
Data Method Nonorm CCC Pseudo RMSSTD Rsquare RSQ Id Var: Proc Cluster
No ratings yet
Data Method Nonorm CCC Pseudo RMSSTD Rsquare RSQ Id Var: Proc Cluster
4 pages
Control Charts & Cluster Analysis
No ratings yet
Control Charts & Cluster Analysis
8 pages
Design 1
No ratings yet
Design 1
2 pages
2 Ye UTPMmltmx JD 3 y
No ratings yet
2 Ye UTPMmltmx JD 3 y
7 pages
AAM 7th Prac
No ratings yet
AAM 7th Prac
4 pages
Cluster Analysis in R TML
No ratings yet
Cluster Analysis in R TML
5 pages
K Means
No ratings yet
K Means
3 pages
Ds
No ratings yet
Ds
2 pages
STAT452 Project1
No ratings yet
STAT452 Project1
13 pages
Data Science
No ratings yet
Data Science
15 pages
EXXAM
No ratings yet
EXXAM
3 pages
MicroArray Analysis - 201
No ratings yet
MicroArray Analysis - 201
13 pages
Bone Suplement Market Segmentation
No ratings yet
Bone Suplement Market Segmentation
20 pages
21STA024 Md. Toufik Umar Assignment On STAT 309 1
No ratings yet
21STA024 Md. Toufik Umar Assignment On STAT 309 1
12 pages
K-Means Clustering Using Matlab: December 2015
No ratings yet
K-Means Clustering Using Matlab: December 2015
6 pages
Bi 5to 8
No ratings yet
Bi 5to 8
6 pages
Clustering
No ratings yet
Clustering
8 pages
ML Minors Exp7
No ratings yet
ML Minors Exp7
6 pages
Final Code
No ratings yet
Final Code
3 pages
Lecture 11 K Means Clustering
No ratings yet
Lecture 11 K Means Clustering
8 pages
R Record-1
No ratings yet
R Record-1
53 pages
R Code For Discriminant and Cluster Analysis
No ratings yet
R Code For Discriminant and Cluster Analysis
23 pages
Variation With Respect To The Cluster Centroid While They Maximize
No ratings yet
Variation With Respect To The Cluster Centroid While They Maximize
1 page
Assignment No 5
No ratings yet
Assignment No 5
5 pages
DataScience All 1to8
No ratings yet
DataScience All 1to8
6 pages
K-Means Cluster Analysis UC Business Analytics R Programming Guide
No ratings yet
K-Means Cluster Analysis UC Business Analytics R Programming Guide
19 pages
K Means Clustering
No ratings yet
K Means Clustering
11 pages
2023midterm Code
No ratings yet
2023midterm Code
3 pages
Questions Bank-Theory Qs Papers: K U B e
No ratings yet
Questions Bank-Theory Qs Papers: K U B e
3 pages
Queuing Theory Chapter
No ratings yet
Queuing Theory Chapter
22 pages
L-9 - AOD Inequalities
No ratings yet
L-9 - AOD Inequalities
28 pages
A Course On Statistics For Finance: Journal of Applied Statistics April 2014
No ratings yet
A Course On Statistics For Finance: Journal of Applied Statistics April 2014
4 pages
Solutions To IIT JAM For Mathematical Statistics: December 2018
No ratings yet
Solutions To IIT JAM For Mathematical Statistics: December 2018
21 pages
Sem-Iv Class-1: The R Environment
No ratings yet
Sem-Iv Class-1: The R Environment
32 pages
Enhancing Security of One Time Passwords in Online Banking Systems
No ratings yet
Enhancing Security of One Time Passwords in Online Banking Systems
6 pages
Cyber Laws and Ethics, Digital Signature and E-Records
No ratings yet
Cyber Laws and Ethics, Digital Signature and E-Records
29 pages
10 Case Study Digital Signature
No ratings yet
10 Case Study Digital Signature
7 pages
Collocation and Types (Semantics Assinment)
No ratings yet
Collocation and Types (Semantics Assinment)
5 pages
Dgca Module Preparation Strategy by Aviator-Arif-3
100% (1)
Dgca Module Preparation Strategy by Aviator-Arif-3
28 pages
Overthinking Project Anjusha 20221bdf0002
No ratings yet
Overthinking Project Anjusha 20221bdf0002
10 pages
HRM412-New (1) New 2
No ratings yet
HRM412-New (1) New 2
10 pages
Empathy Map Template Guide
No ratings yet
Empathy Map Template Guide
1 page
HMI User Guide
No ratings yet
HMI User Guide
34 pages
Rich Habits Poor Habits PDF
50% (2)
Rich Habits Poor Habits PDF
3 pages
Frederick Jackson Turner and His Frontier Thesis
100% (1)
Frederick Jackson Turner and His Frontier Thesis
7 pages
MapObjects & Visual Basic for GIS Devs
No ratings yet
MapObjects & Visual Basic for GIS Devs
9 pages
CBDRRM: TRAINING of Trainers
No ratings yet
CBDRRM: TRAINING of Trainers
67 pages
Visual Literacy
No ratings yet
Visual Literacy
12 pages
Itp For Fabrication Steel Structure of Warehouse and Workshop
100% (3)
Itp For Fabrication Steel Structure of Warehouse and Workshop
6 pages
Q2KDocv2 07
100% (1)
Q2KDocv2 07
102 pages
Palmistry For All - Amostra
No ratings yet
Palmistry For All - Amostra
15 pages
Problems On Geometric Mean
No ratings yet
Problems On Geometric Mean
2 pages
Treasure Hunting
No ratings yet
Treasure Hunting
3 pages
She Is A Born Leader (Autosaved)
No ratings yet
She Is A Born Leader (Autosaved)
54 pages
24VAC Filter Backwash Valves
No ratings yet
24VAC Filter Backwash Valves
1 page
Design and Analysis of Low Speed Water Tunnel For Flow Visualization of Bluff Body
No ratings yet
Design and Analysis of Low Speed Water Tunnel For Flow Visualization of Bluff Body
9 pages
Social Engineering
No ratings yet
Social Engineering
4 pages
ISO/IEC 17025:2005 Lab Accreditation
No ratings yet
ISO/IEC 17025:2005 Lab Accreditation
11 pages
Terapi Psikologi Individu: /theory of Individual Psychology
No ratings yet
Terapi Psikologi Individu: /theory of Individual Psychology
27 pages
Wetting of Real Surfaces: October 2017
No ratings yet
Wetting of Real Surfaces: October 2017
8 pages
Understanding How Interfaces Affect Users
0% (2)
Understanding How Interfaces Affect Users
6 pages
HND in Civil Engineering Code Title Assessor / Examiner: Assignment
No ratings yet
HND in Civil Engineering Code Title Assessor / Examiner: Assignment
5 pages
The Silva Mind Control Method For Business Managers (Stone, Robert B. Silva, Jose)
No ratings yet
The Silva Mind Control Method For Business Managers (Stone, Robert B. Silva, Jose)
215 pages
Effective Business Letter Writing
No ratings yet
Effective Business Letter Writing
110 pages
P0751 Shift Solenoid A
No ratings yet
P0751 Shift Solenoid A
5 pages
F10 E1 Solution
No ratings yet
F10 E1 Solution
5 pages
Computer Components Overview
No ratings yet
Computer Components Overview
2 pages