Mohy - Jupyter Notebook

This document shows code for analyzing car data using pandas, seaborn, and scikit-learn. It loads car data from a CSV file, cleans the data by dropping null rows and columns, encodes categorical variables, splits the data into train and test sets, and fits a random forest regressor model to predict car prices, achieving a test score of 0.955.

Uploaded by

zzselimahmed

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views3 pages

Mohy - Jupyter Notebook

Uploaded by

zzselimahmed

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

In [1]: import pandas as pd

import numpy as np
import seaborn as sb
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split

In [2]: data=pd.read_csv("cars .csv")

data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 404 entries, 0 to 403
Data columns (total 26 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 car_ID 404 non-null int64
1 symboling 404 non-null int64
2 CarName 404 non-null object
3 fueltype 403 non-null object
4 aspiration 403 non-null object
5 doornumber 403 non-null object
6 carbody 403 non-null object
7 drivewheel 404 non-null object
8 enginelocation 404 non-null object
9 wheelbase 404 non-null float64
10 carlength 404 non-null float64
11 carwidth 404 non-null float64
12 carheight 404 non-null float64
13 curbweight 404 non-null int64
14 enginetype 404 non-null object
15 cylindernumber 404 non-null object
16 enginesize 404 non-null int64
17 fuelsystem 404 non-null object
18 boreratio 404 non-null float64
19 stroke 404 non-null float64
20 compressionratio 404 non-null float64
21 horsepower 404 non-null int64
22 peakrpm 404 non-null int64
23 citympg 404 non-null int64
24 highwaympg 404 non-null int64
25 price 404 non-null float64
dtypes: float64(8), int64(8), object(10)
memory usage: 82.2+ KB

In [3]: data=data.dropna()

In [4]: data.describe(include=['object'])

Out[4]: CarName fueltype aspiration doornumber carbody drivewheel enginelocation enginetype cylindernumber fuelsyste

count 400 400 400 400 400 400 400 400 400 4

unique 319 2 2 2 5 3 2 7 7

toyota
top gas std four sedan fwd front ohc four m
corolla

freq 10 363 353 215 173 228 397 305 315 1

 

In [5]: data=data.drop(columns=["CarName"],axis=1)
In [6]: object=data.select_dtypes(include=['object']).columns.tolist()
dummeis=pd.get_dummies(data,columns=object)

In [7]: corr_matrix = dummeis.corr()

plt.figure(figsize=(50, 40))
sb.heatmap(corr_matrix, annot=True, cmap='coolwarm', fmt='.2f',
xticklabels=corr_matrix.columns,
yticklabels=corr_matrix.columns)
plt.title('Correlation Heatmap of DataFrame')
plt.show()
In [8]: dummeis.columns

Out[8]: Index(['car_ID', 'symboling', 'wheelbase', 'carlength', 'carwidth',

'carheight', 'curbweight', 'enginesize', 'boreratio', 'stroke',
'compressionratio', 'horsepower', 'peakrpm', 'citympg', 'highwaympg',
'price', 'fueltype_diesel', 'fueltype_gas', 'aspiration_std',
'aspiration_turbo', 'doornumber_four', 'doornumber_two',
'carbody_convertible', 'carbody_hardtop', 'carbody_hatchback',
'carbody_sedan', 'carbody_wagon', 'drivewheel_4wd', 'drivewheel_fwd',
'drivewheel_rwd', 'enginelocation_front', 'enginelocation_rear',
'enginetype_dohc', 'enginetype_dohcv', 'enginetype_l', 'enginetype_ohc',
'enginetype_ohcf', 'enginetype_ohcv', 'enginetype_rotor',
'cylindernumber_eight', 'cylindernumber_five', 'cylindernumber_four',
'cylindernumber_six', 'cylindernumber_three', 'cylindernumber_twelve',
'cylindernumber_two', 'fuelsystem_1bbl', 'fuelsystem_2bbl',
'fuelsystem_4bbl', 'fuelsystem_idi', 'fuelsystem_mfi',
'fuelsystem_mpfi', 'fuelsystem_spdi', 'fuelsystem_spfi'],
dtype='object')

In [9]: remove_col=['car_ID', 'symboling','carheight','stroke','peakrpm','fueltype','aspiration','doornumber',

In [10]: data=data.drop(columns=remove_col,axis=1)

In [11]: object=data.select_dtypes(include=['object']).columns.tolist()
dum=pd.get_dummies(data,columns=object)

In [12]: x=dum.drop("price",axis=1)
y=dum["price"]

In [13]: x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2)

In [14]: model1=RandomForestRegressor()
model1.fit(x_train,y_train)
model1.score(x_test,y_test)

Out[14]: 0.9554863631762747

Lab Assignment 6
No ratings yet
Lab Assignment 6
5 pages
Car Price Prediction Oasis Infobyte Task3
No ratings yet
Car Price Prediction Oasis Infobyte Task3
7 pages
Car Price Prediction 1
No ratings yet
Car Price Prediction 1
24 pages
Car Data Analysis for Data Scientists
No ratings yet
Car Data Analysis for Data Scientists
11 pages
Elite Sports Cars Eda
No ratings yet
Elite Sports Cars Eda
9 pages
Advance EDA & Predictive Analytics
No ratings yet
Advance EDA & Predictive Analytics
38 pages
Car Price Prediction
No ratings yet
Car Price Prediction
35 pages
Import As Import As: Numpy NP Pandas PD
No ratings yet
Import As Import As: Numpy NP Pandas PD
22 pages
Import As Import As
No ratings yet
Import As Import As
18 pages
Exp 5 Exploratory Data Analysis SDK Ok
No ratings yet
Exp 5 Exploratory Data Analysis SDK Ok
13 pages
DV Ca-1
No ratings yet
DV Ca-1
9 pages
SMDM-Business Report
No ratings yet
SMDM-Business Report
11 pages
Untitled 0
No ratings yet
Untitled 0
3 pages
Data Analysis for Car Sales Insights
No ratings yet
Data Analysis for Car Sales Insights
19 pages
GmPrac1 - Jupyter Notebook
No ratings yet
GmPrac1 - Jupyter Notebook
11 pages
Car Price Prediction
No ratings yet
Car Price Prediction
72 pages
Numpy,,Pandas (24.4.25)
No ratings yet
Numpy,,Pandas (24.4.25)
1 page
9587 - 9638 - 9563 - ADS - Exp1.ipynb - Colab
No ratings yet
9587 - 9638 - 9563 - ADS - Exp1.ipynb - Colab
8 pages
22eg107a11 DWV
No ratings yet
22eg107a11 DWV
15 pages
Untitled 21
No ratings yet
Untitled 21
6 pages
Practical 2 .Ipynb - Colab
No ratings yet
Practical 2 .Ipynb - Colab
9 pages
Machine Learning Project 1690186790
No ratings yet
Machine Learning Project 1690186790
18 pages
SMDM Business+Report
No ratings yet
SMDM Business+Report
11 pages
Practical Example Full Notes
No ratings yet
Practical Example Full Notes
48 pages
SMDM-Business Report
No ratings yet
SMDM-Business Report
11 pages
Untitled - Ipynb - (5) - JupyterLab
No ratings yet
Untitled - Ipynb - (5) - JupyterLab
4 pages
SMDM-Business Report
No ratings yet
SMDM-Business Report
11 pages
SMDM Business+Report
No ratings yet
SMDM Business+Report
11 pages
Finalll - Ipynb - Colab
No ratings yet
Finalll - Ipynb - Colab
11 pages
Eda 1
No ratings yet
Eda 1
29 pages
DMPA RECORD-3-checkpoint - Removed
No ratings yet
DMPA RECORD-3-checkpoint - Removed
19 pages
Se Python - Merged
No ratings yet
Se Python - Merged
77 pages
Belarus Car Price Prediction
No ratings yet
Belarus Car Price Prediction
18 pages
Data Analysis Report
No ratings yet
Data Analysis Report
74 pages
Week 3 Lec Pandas 1-5
No ratings yet
Week 3 Lec Pandas 1-5
1 page
Data Analysis for Auto Enthusiasts
No ratings yet
Data Analysis for Auto Enthusiasts
8 pages
Mtcars - Ipynb - Colab
No ratings yet
Mtcars - Ipynb - Colab
2 pages
Internship
No ratings yet
Internship
23 pages
Car Price Prediction - Summaiyah Project
No ratings yet
Car Price Prediction - Summaiyah Project
16 pages
DSBDA1
No ratings yet
DSBDA1
5 pages
Cars Sales Dashboard
No ratings yet
Cars Sales Dashboard
19 pages
TA - Uas Kelompok
No ratings yet
TA - Uas Kelompok
9 pages
City Cycle Fuel Consumption 2024
No ratings yet
City Cycle Fuel Consumption 2024
23 pages
Task 3 Car Price Prediction Using Machine Learning
No ratings yet
Task 3 Car Price Prediction Using Machine Learning
30 pages
Car Price Prediction
No ratings yet
Car Price Prediction
480 pages
Nalysis Manipulation and Cleaning
No ratings yet
Nalysis Manipulation and Cleaning
15 pages
Drop The Columns - Id - and - Unnamed - 0 - From Axis...
No ratings yet
Drop The Columns - Id - and - Unnamed - 0 - From Axis...
3 pages
Super Car Data Analysis
100% (1)
Super Car Data Analysis
15 pages
3 Exp-3
No ratings yet
3 Exp-3
3 pages
Linear Regression
No ratings yet
Linear Regression
4 pages
Quikr Car Price Prediction Using Linear Regression 1717999953
No ratings yet
Quikr Car Price Prediction Using Linear Regression 1717999953
12 pages
EDA Withoutcode
No ratings yet
EDA Withoutcode
36 pages
Numpy NP Pandas PD Matplotlib - Pyplot PLT Seaborn SNS: Import As Import As Import As Import As
No ratings yet
Numpy NP Pandas PD Matplotlib - Pyplot PLT Seaborn SNS: Import As Import As Import As Import As
18 pages
Python Codes
No ratings yet
Python Codes
17 pages
Car Price
No ratings yet
Car Price
6 pages
Xii Project PDF
No ratings yet
Xii Project PDF
19 pages
Day09 DataWrangling
No ratings yet
Day09 DataWrangling
27 pages
Lec1,2,3,4 Biostatistics
No ratings yet
Lec1,2,3,4 Biostatistics
14 pages
Section 1
No ratings yet
Section 1
5 pages
Questions
No ratings yet
Questions
9 pages
Time Series Analysis Quiz
100% (1)
Time Series Analysis Quiz
10 pages
OS
No ratings yet
OS
30 pages
Time Series Questions Not Sol
No ratings yet
Time Series Questions Not Sol
8 pages
L6&7 - 2022
No ratings yet
L6&7 - 2022
31 pages