Experiment 11 PML

The document outlines an exploratory data analysis experiment using the Iris dataset with Pandas and Matplotlib. It includes loading the dataset, displaying the first few rows, providing summary statistics, and creating a scatter plot of the first two features colored by species. The analysis reveals key statistics and visualizations that aid in understanding the dataset's characteristics.

Uploaded by

sri117537

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views3 pages

Experiment 11 PML

Uploaded by

sri117537

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

EXPERIMENT-11: Exploratory Data Analysis for Classification using Pandas or Matplotlib.

# Import necessary libraries

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris

# Load the built-in Iris dataset

iris = load_iris()

# Convert the dataset to a pandas DataFrame

data = pd.DataFrame(iris.data, columns=iris.feature_names)
data['species'] = iris.target # Add target column for species

# Display the first few rows of the dataset

print("First 5 rows of the dataset:")
print(data.head())

# Summary statistics
print("\nSummary statistics:")
print(data.describe())

# Scatter plot for the first two features

plt.scatter(data.iloc[:, 0], data.iloc[:, 1], c=data['species'], cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1])
plt.title('Scatter plot of first two features')
plt.show()
OUTPUT:
First 5 rows of the dataset:
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) \
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2

species
0 0
1 0
2 0
3 0
4 0

Summary statistics:
sepal length (cm) sepal width (cm) petal length (cm) \
count 150.000000 150.000000 150.000000
mean 5.843333 3.057333 3.758000
std 0.828066 0.435866 1.765298
min 4.300000 2.000000 1.000000
25% 5.100000 2.800000 1.600000
50% 5.800000 3.000000 4.350000
75% 6.400000 3.300000 5.100000
max 7.900000 4.400000 6.900000

petal width (cm) species

count 150.000000 150.000000
mean 1.199333 1.000000
std 0.762238 0.819232
min 0.100000 0.000000
25% 0.300000 0.000000
50% 1.300000 1.000000
75% 1.800000 2.000000
max 2.500000 2.000000

Ass - 10.ipynb - Colab
No ratings yet
Ass - 10.ipynb - Colab
8 pages
DSBDA3
No ratings yet
DSBDA3
3 pages
Assignment1ML Prem - Ipynb - Colab
No ratings yet
Assignment1ML Prem - Ipynb - Colab
4 pages
Practical 10 Code
No ratings yet
Practical 10 Code
5 pages
Assignment 3 Iris
No ratings yet
Assignment 3 Iris
2 pages
Summary (Iris) #View Statistical Summary of Dataset
No ratings yet
Summary (Iris) #View Statistical Summary of Dataset
1 page
DML About Put
No ratings yet
DML About Put
2 pages
Trần Mạnh Hùng 20192643.Ipynb - Colab
No ratings yet
Trần Mạnh Hùng 20192643.Ipynb - Colab
6 pages
Experiment 3
No ratings yet
Experiment 3
2 pages
RP 3
No ratings yet
RP 3
32 pages
Assignment 10
No ratings yet
Assignment 10
9 pages
137 Vsec 6
No ratings yet
137 Vsec 6
2 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
b21 DSBDA Assignment No 10
No ratings yet
b21 DSBDA Assignment No 10
1 page
Annals of Eugenics - September 1936 - Fisher - The Use of Multiple Measurements in Taxonomic Problems
No ratings yet
Annals of Eugenics - September 1936 - Fisher - The Use of Multiple Measurements in Taxonomic Problems
11 pages
Iris - Ipynb - Colaboratory
No ratings yet
Iris - Ipynb - Colaboratory
8 pages
Data Visualization
No ratings yet
Data Visualization
18 pages
10 (3146)
No ratings yet
10 (3146)
2 pages
Data Visualization With Maplotlib
No ratings yet
Data Visualization With Maplotlib
8 pages
Iris Project Presentation
100% (1)
Iris Project Presentation
13 pages
Ex No4
No ratings yet
Ex No4
3 pages
K Means On IRIS Dataset
No ratings yet
K Means On IRIS Dataset
4 pages
25 - Assignment10.ipynb - Colaboratory
No ratings yet
25 - Assignment10.ipynb - Colaboratory
13 pages
Data Visualization and Matplot
No ratings yet
Data Visualization and Matplot
11 pages
Matplotlib Styles: 1. Test - Generate - Plot - With - Style1
No ratings yet
Matplotlib Styles: 1. Test - Generate - Plot - With - Style1
2 pages
Data Visualizationyuo
No ratings yet
Data Visualizationyuo
28 pages
Kmeansrcode
No ratings yet
Kmeansrcode
2 pages
Dsfasdflalksdflkasdjfasf
No ratings yet
Dsfasdflalksdflkasdjfasf
4 pages
Code
No ratings yet
Code
3 pages
6 Lab
No ratings yet
6 Lab
16 pages
Program1 MLA Lab 2025 250109 144615
No ratings yet
Program1 MLA Lab 2025 250109 144615
17 pages
ML Lab Record
No ratings yet
ML Lab Record
64 pages
Data Analytics Assignment
No ratings yet
Data Analytics Assignment
8 pages
Base de Datos IRIS Codigos R Utilizados para El Analisis
No ratings yet
Base de Datos IRIS Codigos R Utilizados para El Analisis
4 pages
Nandini Matplotlib Ws
No ratings yet
Nandini Matplotlib Ws
10 pages
Vsec PW 7
No ratings yet
Vsec PW 7
3 pages
Cota12 6
No ratings yet
Cota12 6
4 pages
NUMPY-case Study
100% (1)
NUMPY-case Study
4 pages
Experiment 3
No ratings yet
Experiment 3
4 pages
Import As Import As From Import Import As Import As From Import From Import From Import
No ratings yet
Import As Import As From Import Import As Import As From Import From Import From Import
6 pages
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
No ratings yet
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
7 pages
Name:-Nisha Ambike: Roll No: - 02
No ratings yet
Name:-Nisha Ambike: Roll No: - 02
2 pages
Ficus
No ratings yet
Ficus
8 pages
Assignment 5'
No ratings yet
Assignment 5'
4 pages
Assign10.Ipynb - Colab
No ratings yet
Assign10.Ipynb - Colab
8 pages
Vansh 3089 CA2
No ratings yet
Vansh 3089 CA2
13 pages
SVM and KNN
No ratings yet
SVM and KNN
3 pages
The Use of Multiple Measurements in Taxonomic Problems-A R Fisher
No ratings yet
The Use of Multiple Measurements in Taxonomic Problems-A R Fisher
11 pages
Business Analytics Assignment NAME: Divyansh: Bisht
No ratings yet
Business Analytics Assignment NAME: Divyansh: Bisht
7 pages
Experiment No - 5 R
No ratings yet
Experiment No - 5 R
3 pages
Tarea - 1.ipynb - Colab Jose
No ratings yet
Tarea - 1.ipynb - Colab Jose
12 pages
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
No ratings yet
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
20 pages
Varad Aiml 3.3
No ratings yet
Varad Aiml 3.3
4 pages
Iris Dataset Analysis & Visualization
No ratings yet
Iris Dataset Analysis & Visualization
4 pages
4.5 Raw Dataset For Sepal Length and Sepal Width Setosa Versicolour Virginica
No ratings yet
4.5 Raw Dataset For Sepal Length and Sepal Width Setosa Versicolour Virginica
8 pages
Ahmed 226005
No ratings yet
Ahmed 226005
3 pages
Notes DV
No ratings yet
Notes DV
19 pages
A Complete Guide To The Iris Dataset in R
No ratings yet
A Complete Guide To The Iris Dataset in R
3 pages

Experiment 11 PML

Uploaded by

Experiment 11 PML

Uploaded by

EXPERIMENT-11: Exploratory Data Analysis for Classification using Pandas or Matplotlib.

# Import necessary libraries

# Load the built-in Iris dataset

# Convert the dataset to a pandas DataFrame

# Display the first few rows of the dataset

# Scatter plot for the first two features

petal width (cm) species

You might also like