Unit 4

The document discusses dimensionality reduction techniques in machine learning, emphasizing their importance in simplifying models, improving computational efficiency, and enhancing data visualization. Key techniques include Feature Selection, Principal Component Analysis (PCA), Linear Discriminant Analysis (LDA), and Independent Component Analysis (ICA), each with specific applications in fields like public health, genomics, and image processing. Additionally, it introduces Evolutionary Learning, an optimization method inspired by biological evolution, detailing its process and applications in various domains.

Uploaded by

soukyapulimamidi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views33 pages

Unit 4

Uploaded by

soukyapulimamidi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 33

UNIT-4

PART-1
Dimensionality Reduction
Dimensionality reduction is a technique in machine learning used to reduce the
number of input features (dimensions) while preserving as much information as
possible. It simplifies models, speeds up training, reduces overfitting, and makes
data visualization easier.
Why Dimensionality Reduction?
1. Curse of Dimensionality – As dimensions increase, data becomes sparse,
making models less effective.
2. Overfitting – Too many features can lead to models that fit noise instead of
patterns.
3. Computational Efficiency – Fewer features mean faster computation and
training.
4. Visualization – Reducing data to 2D or 3D allows for better visualization of
patterns and clusters.
Techniques for Dimensionality Reduction:
1. Feature Selection (Subset Selection)
 Selects a subset of the most important features.
 Methods:
o Filter Methods – Correlation, Chi-square, Mutual Information
o Wrapper Methods – Recursive Feature Elimination (RFE)
o Embedded Methods – Lasso Regression (L1 regularization)
2. Feature Extraction (Projection-based)
 Transforms existing features into a lower-dimensional space.
 Key Methods:
o Principal Component Analysis (PCA)
 Projects data onto orthogonal axes capturing maximum
variance.
o Linear Discriminant Analysis (LDA)
 Focuses on maximizing class separability.
Applications:
 Public Health – Analyzing large-scale epidemiological datasets.
 Genomics – Reducing the number of gene expressions for classification.
 Image Processing – Compressing image data while preserving critical
information.
 Natural Language Processing (NLP) – Reducing sparse word embeddings.

Linear Discriminant Analysis:

Linear Discriminant Analysis (LDA) is a dimensionality reduction technique used
for classification tasks. Unlike PCA, which focuses on maximizing variance, LDA
seeks to find a feature space that maximizes class separability.
How LDA Works
LDA projects data onto a lower-dimensional space where the classes are as
distinguishable as possible by maximizing the between-class variance while
minimizing the within-class variance.
Steps in LDA
1. Compute the Mean Vectors – Calculate the mean for each class.
2. Scatter Matrices –
o Within-Class Scatter – Measures how spread out data is within each
class.
o Between-Class Scatter – Measures how far the means of different
classes are from each other.
3. Solve the Eigenvalue Problem – Calculate eigenvectors and eigenvalues to
find the optimal projection directions.
4. Select the Top K Eigenvectors – Choose the eigenvectors corresponding to
the largest eigenvalues to reduce dimensionality.
5. Transform the Data – Project data onto the new lower-dimensional space.
Applications
 Public Health – Classifying patient outcomes (e.g., disease vs. no disease).
 Image Recognition – Facial recognition systems.
 Bioinformatics – Classifying gene expressions by disease.

Principal Component Analysis:

Principal Component Analysis (PCA) is an unsupervised dimensionality
reduction technique that transforms data into a new coordinate system where
the greatest variance lies along the first principal component, the second
greatest variance along the second component, and so on.
Why Use PCA?
 Reduce Dimensionality – Simplifies datasets by reducing the number of
features.
 Visualization – Allows high-dimensional data to be visualized in 2D or 3D.
 Remove Noise and Redundancy – Focuses on the most informative
features.
 Speed Up Algorithms – Reduces computational complexity for large
datasets.
How PCA Works
1. Standardize the Data – Scale the data to have zero mean and unit variance.
2. Compute the Covariance Matrix – Understand feature relationships.
3. Calculate Eigenvectors and Eigenvalues – Derive principal components
from the covariance matrix.
4. Rank Components – Sort eigenvectors by descending eigenvalues.
5. Select Top K Components – Choose the top K components to retain most of
the variance.
6. Transform the Data – Project original data onto the selected principal
components.
Applications of PCA
 Public Health – Epidemiological data analysis to identify risk factors.
 Genomics – Reducing high-dimensional gene expression data.
 Image Compression – Extracting essential features from image data.
 Finance – Identifying principal factors in stock market data.
Problem Solve:
Factor Analysis:
Factor Analysis (FA) is a dimensionality reduction technique used to identify
latent variables (factors) that explain the observed correlations among
features. Unlike PCA, which focuses on maximizing variance, Factor Analysis
models the underlying structure in the data by assuming that the observed
variables are influenced by fewer unobserved factors.
Why Use Factor Analysis?
 Identify Hidden Patterns – Reveals latent constructs that drive observed
data.
 Reduce Noise – Separates noise from shared variance.
 Simplify Interpretation – Groups correlated features into fewer factors.
 Handle Multicollinearity – Useful for datasets with correlated features.

2. Estimate Factor Loadings – Calculate how much each observed variable

loads onto each factor.
3. Extract Factors – Identify the smallest number of factors that explain the
majority of variance.
4. Rotate Factors – Apply rotation (Varimax, Promax) to improve
interpretability by simplifying loadings.
5. Interpret Results – Examine factor loadings to determine which features
contribute to each factor.
Types of Factor Analysis
1. Exploratory Factor Analysis (EFA):
o Unsupervised, used to discover latent factors without prior
assumptions.
o Suitable when the factor structure is unknown.
2. Confirmatory Factor Analysis (CFA):
o Tests a predefined factor model to confirm hypothesized
relationships between variables.
o Used in hypothesis-driven research.
Applications of Factor Analysis
 Public Health – Identify latent factors influencing health outcomes (e.g.,
socioeconomic status, lifestyle).
 Psychology – Develop and validate psychological scales.
 Market Research – Group customer preferences into underlying segments.
 Finance – Identify factors driving stock market returns.

Independent Component Analysis:

Independent Component Analysis (ICA) is a dimensionality reduction
technique used to separate a multivariate signal into independent, non-
Gaussian components. Unlike PCA, which focuses on maximizing variance, ICA
aims to identify hidden sources that generate the observed data by
minimizing statistical dependence between components.
Why Use ICA?
 Blind Source Separation (BSS) – Separates mixed signals (e.g., separating
different audio sources from a single recording).
 Noise Reduction – Identifies and removes noise as an independent source.
 Feature Extraction – Useful for finding hidden patterns in data.
How ICA Works:

3. Assumptions in ICA:
o The source signals S are statistically independent.
o The source signals have non-Gaussian distributions.
o The mixing process is linear.
Applications of ICA
 Biomedical Signal Processing – EEG and fMRI data analysis (separating
brain activity signals).
 Audio Processing – "Cocktail Party Problem" – Separating multiple
overlapping audio signals.
 Image Processing – Facial recognition and feature extraction.
 Finance – Identifying independent factors driving market data.
Example Use Case in Public Health
 EEG Data Analysis – ICA is used to analyze brain activity in public health
research to detect abnormal patterns associated with neurological
conditions.
 Epidemiological Data – Identify independent factors contributing to disease
spread.
Locally linear Embedding:
Locally Linear Embedding (LLE) is a non-linear dimensionality reduction
technique that preserves the local structure of high-dimensional data by
mapping it to a lower-dimensional space. Unlike PCA or LDA, LLE focuses on
maintaining local relationships between neighboring data points rather than
global variance or class separability.
Why Use LLE?
 Non-Linear Data – Suitable for data lying on a non-linear manifold (e.g.,
curved surfaces).
 Preserves Local Geometry – Captures the local neighborhood structure of
data points.
 High-Dimensional Data – Effective for reducing dimensions in data with
complex, non-linear distributions.
Key Parameters in LLE
 Number of Neighbors (k): Controls the locality by specifying how many
neighbors to consider.
 Dimensionality (d): The target dimensionality of the embedded space.
Applications of LLE
 Public Health – Dimensionality reduction in epidemiological data to identify
hidden patterns.
 Genomics – Visualizing non-linear gene expression patterns.
 Image Processing – Uncovering low-dimensional representations of high-
dimensional image data.
 Finance – Modeling non-linear relationships in financial time series.
Example Use Case in Public Health
 Patient Clustering – LLE can group patients with similar symptoms or
conditions based on complex non-linear patterns in health data.
 Disease Spread Modeling – Visualizing the spread of diseases over regions
where data relationships are non-linear.

Isomap (Isometric Mapping):

Isomap is a non-linear dimensionality reduction technique that extends
classical Multidimensional Scaling (MDS) by incorporating geodesic distances
to capture the intrinsic geometry of high-dimensional data. It is particularly
effective for data that lies on a non-linear manifold.
Why Use Isomap?
 Non-Linear Dimensionality Reduction – Suitable for complex, curved data
structures.
 Preserves Global Geometry – Maintains the global structure by
approximating geodesic distances.
 High-Dimensional Visualization – Helps project data onto lower
dimensions for visualization while retaining meaningful relationships.
How Isomap Works
1. Construct Neighborhood Graph
o Connect each data point to its k-nearest neighbors or points within a
certain radius.
o Form a weighted graph where edges represent Euclidean distances
between neighboring points.
2. Compute Geodesic Distances
o Use Dijkstra's or Floyd-Warshall algorithm to compute the shortest
path (geodesic) between all pairs of points in the graph.
o This approximates the true manifold distance.
3. Apply Classical MDS
o Perform classical Multidimensional Scaling (MDS) on the geodesic
distance matrix to find a lower-dimensional embedding that
preserves the pairwise geodesic distances.
Key Parameters in Isomap
 Number of Neighbors (k): Controls locality by defining how many neighbors
to connect to each point.
 Output Dimensions (d): The target dimensionality for embedding.
Applications of Isomap
 Public Health – Reducing dimensionality in large epidemiological datasets
to detect non-linear patterns.
 Genomics – Uncovering the intrinsic structure of gene expression data.
 Image Analysis – Dimensionality reduction in face recognition and object
classification tasks.
 Natural Language Processing (NLP) – Visualizing word embeddings in
reduced space.
Example in Public Health
 Disease Progression Modeling – Isomap can help visualize how diseases
evolve over time by embedding patient data into a 2D space.
 Patient Clustering – Grouping patients with similar conditions while
capturing non-linear health indicators.
Least squares optimization:
Least Squares Optimization is a fundamental technique used to minimize the
sum of squared differences between predicted and actual values. It is widely
applied in regression models, curve fitting, and parameter estimation.
Why Use Least Squares?
 Simplicity and Efficiency – Computationally efficient and easy to
implement.
 Closed-Form Solution – In many cases, least squares provides an analytical
solution without iterative optimization.
 Interpretable Models – Produces interpretable coefficients in linear
regression.
 Optimal for Gaussian Noise – Minimizes error effectively when data is
affected by Gaussian noise.
Applications of Least Squares
 Public Health – Predicting patient outcomes based on health indicators.
 Epidemiology – Modeling disease spread using regression techniques.
 Genomics – Fitting models to gene expression data.
 Finance – Estimating risk models and portfolio optimization.
 Engineering – Curve fitting and system identification.
Example in Public Health
 Disease Prediction – Use least squares to build a regression model
predicting disease severity based on biomarkers.
 Risk Factor Analysis – Fit linear models to identify key health risk factors
affecting patient outcomes.
UNIT-4
PART-2
Evolutionary Learning
Evolutionary Learning:
Evolutionary Learning is an optimization technique inspired by biological
evolution. It involves simulating processes like natural selection, mutation,
and recombination to iteratively improve candidate solutions for complex
problems. This approach is often used when traditional optimization
techniques (like gradient descent) are insufficient for non-differentiable, highly
non-linear, or multimodal functions.
How Evolutionary Learning Works
1. Initialization
o Generate an initial population of candidate solutions randomly.
2. Evaluation
o Assess each candidate using a fitness function that quantifies how
well the solution solves the problem.
3. Selection
o Select candidates based on fitness (e.g., the fittest survive and pass
on their "genes").
4. Crossover (Recombination)
o Combine features from pairs of candidates to create offspring.
5. Mutation
o Apply random changes to some solutions to introduce diversity.
6. Replacement
o Replace the least fit candidates with offspring.
7. Iteration
o Repeat the process until convergence (e.g., fitness no longer
improves or a maximum number of iterations is reached).
Types of Evolutionary Algorithms
1. Genetic Algorithms (GA):
o Mimics the process of natural selection using crossover, mutation,
and selection.
o Useful for combinatorial optimization and feature selection.
2. Evolution Strategies (ES):
o Focuses on evolving populations through mutation and selection,
without crossover.
o Good for continuous optimization problems.
3. Genetic Programming (GP):
o Evolves programs or symbolic expressions to solve problems, often
applied in automated feature generation.
4. Differential Evolution (DE):
o Optimizes real-valued functions by evolving difference vectors
between candidates.
o Effective for continuous optimization tasks.
5. Neuroevolution:
o Evolves neural network architectures or weights, often used for
reinforcement learning tasks.
Mathematical Representation

Applications of Evolutionary Learning

 Public Health – Optimize healthcare resource allocation, disease modeling,
and epidemiological predictions.
 Bioinformatics – Design gene regulatory networks and optimize drug
discovery pipelines.
 Robotics – Evolve control algorithms for autonomous robots.
 Finance – Optimize trading strategies and portfolio allocations.
 Image Processing – Evolve filters for feature extraction and object
recognition.
Example in Public Health
 Vaccine Distribution Optimization – Use evolutionary learning to optimize
vaccine distribution plans across regions to minimize disease spread.
 Medical Imaging – Evolve algorithms to detect anomalies in medical scans
automatically.

Genetic Algorithms:
Genetic Programming:

Dimensionality Reduction: Key Concepts
No ratings yet
Dimensionality Reduction: Key Concepts
13 pages
Module 4
No ratings yet
Module 4
48 pages
UNIT-4 Machine Learning
No ratings yet
UNIT-4 Machine Learning
20 pages
Unit-4 ML
No ratings yet
Unit-4 ML
17 pages
Unit-4 ML
No ratings yet
Unit-4 ML
19 pages
ML Unit 4
No ratings yet
ML Unit 4
10 pages
ML Mod 4 Part 2
No ratings yet
ML Mod 4 Part 2
32 pages
Unit 4
No ratings yet
Unit 4
17 pages
It ML Unit 4 Notes Final
No ratings yet
It ML Unit 4 Notes Final
21 pages
ML Mod 6
No ratings yet
ML Mod 6
5 pages
Unit 5
No ratings yet
Unit 5
13 pages
ML Unit 3
No ratings yet
ML Unit 3
29 pages
ML 4
No ratings yet
ML 4
14 pages
PCA & LDA for Engineering Students
No ratings yet
PCA & LDA for Engineering Students
5 pages
ML Chapter 4
No ratings yet
ML Chapter 4
38 pages
Feature Selection and Dimensionality Reduction
No ratings yet
Feature Selection and Dimensionality Reduction
4 pages
Unit 3
No ratings yet
Unit 3
102 pages
Dimensionality Reduction Guide
No ratings yet
Dimensionality Reduction Guide
79 pages
ML 6
No ratings yet
ML 6
7 pages
Implementation of Dimensionality Reduction Techniques in Hospital Management
No ratings yet
Implementation of Dimensionality Reduction Techniques in Hospital Management
4 pages
Unit - 4
No ratings yet
Unit - 4
76 pages
1.variable Reduction 2.principal Component Analysis: Topic UNIT-4
No ratings yet
1.variable Reduction 2.principal Component Analysis: Topic UNIT-4
19 pages
ML RUSA Module 5 Dim Red
No ratings yet
ML RUSA Module 5 Dim Red
85 pages
ML Unit-4
0% (1)
ML Unit-4
17 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
19 pages
Pca Lda Lobo
No ratings yet
Pca Lda Lobo
20 pages
Deep Learning Notes III To IV
No ratings yet
Deep Learning Notes III To IV
22 pages
Dimensionality Reduction & Models
No ratings yet
Dimensionality Reduction & Models
59 pages
MRA - Session 15 - PCA
No ratings yet
MRA - Session 15 - PCA
26 pages
PCA in Machine Learning Explained
No ratings yet
PCA in Machine Learning Explained
33 pages
Dimension Reduction Factor Models
No ratings yet
Dimension Reduction Factor Models
10 pages
Top 11 Dimensionality Reduction Techniques
No ratings yet
Top 11 Dimensionality Reduction Techniques
12 pages
Dimensionality Reduction-PCA FA LDA
No ratings yet
Dimensionality Reduction-PCA FA LDA
12 pages
Mod2 Dimensionality Reduction
No ratings yet
Mod2 Dimensionality Reduction
18 pages
Dimensionality Reduction Methods
No ratings yet
Dimensionality Reduction Methods
3 pages
Dimensionality Reduction Technique
No ratings yet
Dimensionality Reduction Technique
17 pages
Module 3
No ratings yet
Module 3
41 pages
U5@-Data Reduction
No ratings yet
U5@-Data Reduction
22 pages
Dimensionality Reduction Guide
No ratings yet
Dimensionality Reduction Guide
15 pages
ML (Unit 5)
No ratings yet
ML (Unit 5)
34 pages
Feature Extraction: - Saheni Patra
No ratings yet
Feature Extraction: - Saheni Patra
17 pages
Principal Component Analysis (PCA) and Linear Discriminant Analysis For Image Recognition
No ratings yet
Principal Component Analysis (PCA) and Linear Discriminant Analysis For Image Recognition
17 pages
Unit 4 - ML (NEW)
No ratings yet
Unit 4 - ML (NEW)
80 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
2 pages
Day School 03
No ratings yet
Day School 03
32 pages
CHBE413CDS Lecture 12 Unsupervised DimRed
No ratings yet
CHBE413CDS Lecture 12 Unsupervised DimRed
30 pages
Exp9 MLAI2
No ratings yet
Exp9 MLAI2
2 pages
ML Unit 4 at VS
No ratings yet
ML Unit 4 at VS
33 pages
Feature Engineering
No ratings yet
Feature Engineering
5 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
19 pages
Lecture 1
No ratings yet
Lecture 1
13 pages
Clustering and Dimensionality Reduction Techniques PCA T SNE K Means
No ratings yet
Clustering and Dimensionality Reduction Techniques PCA T SNE K Means
15 pages
Unit 3dimentionality Reduction
No ratings yet
Unit 3dimentionality Reduction
13 pages
6 Dimension Reduction Theory
No ratings yet
6 Dimension Reduction Theory
18 pages
Using Linux, 5th Edition
100% (3)
Using Linux, 5th Edition
937 pages
Synapse: Is The Point of Contact Between A Neuron and
No ratings yet
Synapse: Is The Point of Contact Between A Neuron and
31 pages
Cermets: High-Temp Metal-Ceramic Composites
No ratings yet
Cermets: High-Temp Metal-Ceramic Composites
5 pages
Financial Times Handbook - Lawrence Galitz
No ratings yet
Financial Times Handbook - Lawrence Galitz
7 pages
Banking System in C++
80% (5)
Banking System in C++
42 pages
ACERT Tech for C27 Engines
91% (11)
ACERT Tech for C27 Engines
46 pages
Insert CK 07531389001 V1 en
No ratings yet
Insert CK 07531389001 V1 en
4 pages
Tractive Effort
No ratings yet
Tractive Effort
11 pages
WEG CFW 09 24 VDC Control Supply Connections Guide 0899.5628 Installation Guide English
No ratings yet
WEG CFW 09 24 VDC Control Supply Connections Guide 0899.5628 Installation Guide English
2 pages
Goniotable
No ratings yet
Goniotable
5 pages
Eigenvalue Barycentric
No ratings yet
Eigenvalue Barycentric
29 pages
Probability Worksheet
No ratings yet
Probability Worksheet
11 pages
Chapter 4 - Graphs of Trigonometric Functions
No ratings yet
Chapter 4 - Graphs of Trigonometric Functions
6 pages
B.C.A. 5th & 6th Sem Syllabus 2023-24
No ratings yet
B.C.A. 5th & 6th Sem Syllabus 2023-24
36 pages
FAGL Tcodes
100% (2)
FAGL Tcodes
3 pages
03 - Quotient Rule PDF
No ratings yet
03 - Quotient Rule PDF
4 pages
Structural Seismic Design Guide
100% (1)
Structural Seismic Design Guide
58 pages
Rajamohan PPT New
No ratings yet
Rajamohan PPT New
13 pages
Lecture Notes
100% (1)
Lecture Notes
400 pages
Weaving of 3D Fabrics: A Critical Appreciation
0% (1)
Weaving of 3D Fabrics: A Critical Appreciation
59 pages
Drill-String Torque & Drag Model: DEA 44 Phase V
No ratings yet
Drill-String Torque & Drag Model: DEA 44 Phase V
59 pages
CAIE-IGCSE-Physics - Alternative To Practical
No ratings yet
CAIE-IGCSE-Physics - Alternative To Practical
4 pages
International ISO Standard 4249-2: Iteh Standard Preview (Standards - Iteh.ai)
No ratings yet
International ISO Standard 4249-2: Iteh Standard Preview (Standards - Iteh.ai)
8 pages
Install OpenMPI in Linux
No ratings yet
Install OpenMPI in Linux
5 pages
Capital Asset Pricing Model (CAPM)
No ratings yet
Capital Asset Pricing Model (CAPM)
14 pages
FFB33F79 Edit
No ratings yet
FFB33F79 Edit
4 pages
Knex Gears Tguide
No ratings yet
Knex Gears Tguide
42 pages
Lexical Semantics
No ratings yet
Lexical Semantics
32 pages
Acetic Acid Design Project
0% (1)
Acetic Acid Design Project
56 pages
ICSE Class 10 MATHS Previous Year Question Paper 2017
No ratings yet
ICSE Class 10 MATHS Previous Year Question Paper 2017
6 pages

Unit 4

Uploaded by

Unit 4

Uploaded by

UNIT-4

Linear Discriminant Analysis:

Principal Component Analysis:

2. Estimate Factor Loadings – Calculate how much each observed variable

Independent Component Analysis:

Isomap (Isometric Mapping):

Applications of Evolutionary Learning

You might also like