0% found this document useful (0 votes)

52 views2 pages

Assignment

The document contains code to create a dataframe with columns for name, age, and percentage. It adds 10 rows of sample data and displays the dataframe. It then prints various properties and statistics of the dataframe, including the shape, data types, feature names, descriptions, and handling duplicate and missing values.

Uploaded by

Komal Kale

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

52 views2 pages

Assignment

Uploaded by

Komal Kale

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

In [1]: #_________FDS(Assignment No-1)

# Q-1) Write a Python program to create a dataframe containing columns name,

# age and percentage. Add 10 rows to the dataframe. View the dataframe.

Out[1]: Name Age Percentage

0 Rohit 20 74

1 Rohan 20 84

2 Ram 21 94

3 Rakesh 21 77

4 om 20 66

5 yash 20 70

6 saurabh 21 84

7 akash 20 94

8 Ronney 20 84

9 Rahul 20 94

In [4]: # Q-2) Write a Python program to print the shape, number of rows-columns,
# data types, feature names and the description of the data

import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Percentage'])
df.loc[0]=['Rohit',20,74]
df.loc[1]=['Rohan',20,84]
df.loc[2]=['Ram',21,94]
df.loc[3]=['Rakesh',21,77]
df.loc[4]=['om',20,66]
df.loc[5]=['yash',20,70]
df.loc[6]=['saurabh',21,84]
df.loc[7]=['akash',20,94]
df.loc[8]=['Ronney',20,84]
df.loc[9]=['Rahul',20,94]
df
s=df.shape
print("shape: ",s)
c=len(df.columns)
print("No.of columns: ",c)
r=len(df)
print("No.of rows: ",r)
df.dtypes
fname=pd.get_dummies(df)
print(fname)
df.describe()

shape: (10, 3)
No.of columns: 3
No.of rows: 10
Age Percentage Name_Rahul Name_Rakesh Name_Ram Name_Rohan Name_Rohit
0 20 74 False False False False True \
1 20 84 False False False True False
2 21 94 False False True False False
3 21 77 False True False False False
4 20 66 False False False False False
5 20 70 False False False False False
6 21 84 False False False False False
7 20 94 False False False False False
8 20 84 False False False False False
9 20 94 True False False False False

Name_Ronney Name_akash Name_om Name_saurabh Name_yash

0 False False False False False
1 False False False False False
2 False False False False False
3 False False False False False
4 False False True False False
5 False False False False True
6 False False False True False
7 False True False False False
8 True False False False False
9 False False False False False
Out[4]: Age Percentage

count 10.000000 10.000000

mean 20.300000 82.100000

std 0.483046 10.181137

min 20.000000 66.000000

25% 20.000000 74.750000

50% 20.000000 84.000000

75% 20.750000 91.500000

max 21.000000 94.000000

In [5]: # Q-3) Write a Python program to view basic statistical details of the data.

import pandas as pd
import numpy as np
dict={"rno":['1','2','3','4'],"marks":['80','90','60','70']}
df=pd.DataFrame(dict)
df.astype(float).describe()

Out[5]: rno marks

count 4.000000 4.000000

mean 2.500000 75.000000

std 1.290994 12.909944

min 1.000000 60.000000

25% 1.750000 67.500000

50% 2.500000 75.000000

75% 3.250000 82.500000

max 4.000000 90.000000

In [1]: # Q-4) Write a Python program to Add 5 rows with duplicate values and
# missing values. Add a column ‘remarks’ with empty values.
# Display the data.

import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Percentage'])
df.loc[0]=['Rohit',20,74]
df.loc[1]=['Rohan',20,84]
df.loc[2]=['Ram',21,94]
df.loc[3]=['Rakesh',21,77]
df.loc[4]=['om',20,66]
df.loc[5]=['yash',20,70]
df.loc[6]=['saurabh',21,84]
df.loc[7]=['akash',20,94]
df.loc[8]=['Ronney',20,84]
df.loc[9]=['Rahul',20,94]
df.loc[10]=[None,None,None]
df.loc[11]=['saurabh',21,84]
df.loc[12]=[None,None,None]
df.loc[13]=['Ronney',20,84]
df.loc[14]=['Rahul',20,94]
df.loc[15]=[None,None,None]
df["remarks"]=None
df

Out[1]: Name Age Percentage remarks

0 Rohit 20 74 None

1 Rohan 20 84 None

2 Ram 21 94 None

3 Rakesh 21 77 None

4 om 20 66 None

5 yash 20 70 None

6 saurabh 21 84 None

7 akash 20 94 None

8 Ronney 20 84 None

9 Rahul 20 94 None

10 None None None None

11 saurabh 21 84 None

12 None None None None

13 Ronney 20 84 None

14 Rahul 20 94 None

15 None None None None

In [2]: # Q-5) Write a Python program to get the number of observations, missing values
# and duplicate values.

import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Percentage'])
df.loc[0]=['Rohit',20,74]
df.loc[1]=['Rohan',20,84]
df.loc[2]=['Ram',21,94]
df.loc[3]=['Rakesh',21,77]
df.loc[4]=['om',20,66]
df.loc[5]=['yash',20,70]
df.loc[6]=['saurabh',21,84]
df.loc[7]=['akash',20,94]
df.loc[8]=['Ronney',20,84]
df.loc[9]=['Rahul',20,94]
df.loc[10]=[None,None,None]
df.loc[11]=['saurabh',21,84]
df.loc[12]=[None,None,None]
df.loc[13]=['Ronney',20,84]
df.loc[14]=['Rahul',20,94]
df.loc[15]=[None,None,None]
obs=df.info()
print("No.of observations: ",obs)
duplicate=df.duplicated()
print("Duplicated Values: ",duplicate)
miss=df[df.isnull()]
print("Missing values: ",miss)

<class 'pandas.core.frame.DataFrame'>
Index: 16 entries, 0 to 15
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Name 13 non-null object
1 Age 13 non-null object
2 Percentage 13 non-null object
dtypes: object(3)
memory usage: 512.0+ bytes
No.of observations: None
Duplicated Values: 0 False
1 False
2 False
3 False
4 False
5 False
6 False
7 False
8 False
9 False
10 False
11 True
12 True
13 True
14 True
15 True
dtype: bool
Missing values: Name Age Percentage
0 NaN NaN NaN
1 NaN NaN NaN
2 NaN NaN NaN
3 NaN NaN NaN
4 NaN NaN NaN
5 NaN NaN NaN
6 NaN NaN NaN
7 NaN NaN NaN
8 NaN NaN NaN
9 NaN NaN NaN
10 None None None
11 NaN NaN NaN
12 None None None
13 NaN NaN NaN
14 NaN NaN NaN
15 None None None

In [6]: # Q-6) Write a Python program to drop ‘remarks’ column from the dataframe.
# Also drop all null and empty values.
# Print the modified data.

import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Percentage'])
df.loc[0]=['Rohit',20,74]
df.loc[1]=['Rohan',20,84]
df.loc[2]=['Ram',21,94]
df.loc[3]=['Rakesh',21,77]
df.loc[4]=['om',20,66]
df.loc[5]=['yash',20,70]
df.loc[6]=['saurabh',21,84]
df.loc[7]=['akash',20,94]
df.loc[8]=['Ronney',20,84]
df.loc[9]=['Rahul',20,94]
df.loc[10]=[None,None,None]
df.loc[11]=['saurabh',21,84]
df.loc[12]=[None,None,None]
df.loc[13]=['Ronney',20,84]
df.loc[14]=['Rahul',20,94]
df.loc[15]=[None,None,None]
df["remarks"]=None
df
df.drop(columns='remarks',axis=1,inplace=True)
df

Out[6]: Name Age Percentage

0 Rohit 20 74

1 Rohan 20 84

2 Ram 21 94

3 Rakesh 21 77

4 om 20 66

5 yash 20 70

6 saurabh 21 84

7 akash 20 94

8 Ronney 20 84

9 Rahul 20 94

10 None None None

11 saurabh 21 84

12 None None None

13 Ronney 20 84

14 Rahul 20 94

15 None None None

In [7]: # Q-7) Write a Python program to generate a line plot of name vs percentage.

import matplotlib.pyplot as plt

name=['Rohit','Rahul','Rohan','Rakesh','Ram']
percentage=[80,78,89,79,88]
plt.plot(name,percentage)
plt.title("Line Graph")
plt.xlabel("Name")
plt.ylabel("Pecentage")
plt.show()

In [8]: # Q-8) Write a Python program to generate a scatter plot of name vs percentage

import matplotlib.pyplot as plt

name=['Rohit','Rohan','Rahul','Ram','Rakesh']
percentage=[78,80,90,67,88]
plt.scatter(name,percentage)
plt.title("Scatter Graph")
plt.xlabel("Name")
plt.ylabel("Percentage")
plt.show()
In [ ]:

Data Sci
No ratings yet
Data Sci
29 pages
DAV Previous Year
No ratings yet
DAV Previous Year
7 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
No ratings yet
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
16 pages
AI Practical 2025
No ratings yet
AI Practical 2025
14 pages
Dataframe in Pandas
No ratings yet
Dataframe in Pandas
23 pages
Pandas & Vis 2
No ratings yet
Pandas & Vis 2
11 pages
Project Prog
No ratings yet
Project Prog
6 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Assignment 1 (Set A)
No ratings yet
Assignment 1 (Set A)
4 pages
Ip Project Work 2
No ratings yet
Ip Project Work 2
52 pages
14-06-2025 Cbse Ip Term-1 Scheme of Valution
No ratings yet
14-06-2025 Cbse Ip Term-1 Scheme of Valution
5 pages
Class XII PT1 Informatics Python Pandas
No ratings yet
Class XII PT1 Informatics Python Pandas
4 pages
Advance Operations On Dataframes: Create A Dataframe With Following Values
No ratings yet
Advance Operations On Dataframes: Create A Dataframe With Following Values
3 pages
Series 1
No ratings yet
Series 1
408 pages
Dataframe Practical
No ratings yet
Dataframe Practical
14 pages
Cs Sem V Dav Upc 32347507 Sl. No. Qp. 4432 Dec '23
No ratings yet
Cs Sem V Dav Upc 32347507 Sl. No. Qp. 4432 Dec '23
16 pages
Sakina Assign1 Batch3
No ratings yet
Sakina Assign1 Batch3
8 pages
Python Data Handling with Pandas
No ratings yet
Python Data Handling with Pandas
12 pages
Practical File ANKIT RAJ CLASS 12-F
No ratings yet
Practical File ANKIT RAJ CLASS 12-F
48 pages
Term 1 IP AK
No ratings yet
Term 1 IP AK
6 pages
2023 Data Analysis and Visualization Using Python
100% (2)
2023 Data Analysis and Visualization Using Python
9 pages
MCQ On Dataframe
No ratings yet
MCQ On Dataframe
11 pages
Assignment 2 (Set B)
No ratings yet
Assignment 2 (Set B)
5 pages
Dav Obe 2021
No ratings yet
Dav Obe 2021
4 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
Info Practical
No ratings yet
Info Practical
56 pages
Ip Practical
No ratings yet
Ip Practical
23 pages
Ip Worksheet 3 - Q'S
No ratings yet
Ip Worksheet 3 - Q'S
6 pages
Even Students
No ratings yet
Even Students
36 pages
Ds&bda 1-14
No ratings yet
Ds&bda 1-14
95 pages
Lab Programmes Adwaith
No ratings yet
Lab Programmes Adwaith
18 pages
Easiest Lab Programs
No ratings yet
Easiest Lab Programs
5 pages
I.P Practical Solution
No ratings yet
I.P Practical Solution
20 pages
QP - Info - Gr.12 - June Test - 2021 - MS
No ratings yet
QP - Info - Gr.12 - June Test - 2021 - MS
9 pages
Dav Pyq 2023
No ratings yet
Dav Pyq 2023
15 pages
Cs Sem III Dav Upc 2343012002 Sl. No. Qp. 1673 Dec '23
No ratings yet
Cs Sem III Dav Upc 2343012002 Sl. No. Qp. 1673 Dec '23
12 pages
Vantika Kamra's Practical File 12 Diamond (26600872)
No ratings yet
Vantika Kamra's Practical File 12 Diamond (26600872)
46 pages
DAV Practical
No ratings yet
DAV Practical
12 pages
DataFrame Revision
No ratings yet
DataFrame Revision
5 pages
Document (4) - 1
No ratings yet
Document (4) - 1
15 pages
Ayush IP
No ratings yet
Ayush IP
24 pages
12 IP Dataframe and Pyplot Notes
No ratings yet
12 IP Dataframe and Pyplot Notes
14 pages
Dav 2024 Pyq
No ratings yet
Dav 2024 Pyq
7 pages
Kartik Sir Assignmenthbzbdbbsbsbsbhshshdhdhd
No ratings yet
Kartik Sir Assignmenthbzbdbbsbsbsbhshshdhdhd
7 pages
DataFrame Assignment2024
No ratings yet
DataFrame Assignment2024
10 pages
Pandas Series & DataFrame Guide
No ratings yet
Pandas Series & DataFrame Guide
60 pages
Wa0012.
No ratings yet
Wa0012.
30 pages
Data Analysis Exam for CS Majors
No ratings yet
Data Analysis Exam for CS Majors
12 pages
PYQ Data Analysis and Visualisation Using Python GE May 2024
No ratings yet
PYQ Data Analysis and Visualisation Using Python GE May 2024
6 pages
Ip Practice Test (14in)
No ratings yet
Ip Practice Test (14in)
9 pages
GE Python Visualization 2023
No ratings yet
GE Python Visualization 2023
16 pages
12 Pandas
100% (1)
12 Pandas
21 pages
IP - Record 2023-24
No ratings yet
IP - Record 2023-24
79 pages
Xii Ip Practical List 2022-23-1
No ratings yet
Xii Ip Practical List 2022-23-1
23 pages
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
No ratings yet
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
10 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
Revision - Data Frames
No ratings yet
Revision - Data Frames
6 pages
Ai in Entrepreneurship
No ratings yet
Ai in Entrepreneurship
11 pages
Assembly Nad Detail Drawings
No ratings yet
Assembly Nad Detail Drawings
10 pages
Study of Tesseract OCR
No ratings yet
Study of Tesseract OCR
12 pages
Systems Architectures: System Integration & Architecture
No ratings yet
Systems Architectures: System Integration & Architecture
34 pages
Tax Invoice/bill of Supply/Cash Memo: This Is A Computer Generated Invoice and Does Not Require A Physical Signature
No ratings yet
Tax Invoice/bill of Supply/Cash Memo: This Is A Computer Generated Invoice and Does Not Require A Physical Signature
1 page
Compilation Forms Using Mobaxterm
No ratings yet
Compilation Forms Using Mobaxterm
5 pages
Reevan Resume
No ratings yet
Reevan Resume
2 pages
Introduction To C++ - Day 1
100% (1)
Introduction To C++ - Day 1
43 pages
FILO - An Instant Tutor App, Founded by Biharis, Has Raised $260K
No ratings yet
FILO - An Instant Tutor App, Founded by Biharis, Has Raised $260K
2 pages
Office Assistant - V3.0 - ENG - FG - MEP-Q0202 - PMKVY
No ratings yet
Office Assistant - V3.0 - ENG - FG - MEP-Q0202 - PMKVY
96 pages
EQP Safety Manual
No ratings yet
EQP Safety Manual
29 pages
Sepm Unit 1 and Unit 2
No ratings yet
Sepm Unit 1 and Unit 2
139 pages
Course Detail Summary: Widyatama University Faculty of Engineering Information System - S1
No ratings yet
Course Detail Summary: Widyatama University Faculty of Engineering Information System - S1
8 pages
Magic Quadrant For Content Services Platforms, 2021
No ratings yet
Magic Quadrant For Content Services Platforms, 2021
43 pages
Steps To Write JAVA Program: Java Programming Environment (An Introduction)
No ratings yet
Steps To Write JAVA Program: Java Programming Environment (An Introduction)
55 pages
Prolog PPT Updated
No ratings yet
Prolog PPT Updated
45 pages
OPRMS
No ratings yet
OPRMS
29 pages
Proper Boolean Strings by Keywords & Job Title
0% (1)
Proper Boolean Strings by Keywords & Job Title
5 pages
Log
No ratings yet
Log
56 pages
Azhar Resume 2024
No ratings yet
Azhar Resume 2024
2 pages
Yozolog
No ratings yet
Yozolog
1 page
LMAX API Specification
100% (1)
LMAX API Specification
56 pages
CreateAccounting - Create Accounting Report
No ratings yet
CreateAccounting - Create Accounting Report
7 pages
New IR Structure Guidelines - 2311 Intake
No ratings yet
New IR Structure Guidelines - 2311 Intake
14 pages
How To Activate Your Licenses
No ratings yet
How To Activate Your Licenses
8 pages
2 BHEL Rapping Controller PDF
No ratings yet
2 BHEL Rapping Controller PDF
31 pages
React Course Syllabus Overview
No ratings yet
React Course Syllabus Overview
6 pages
T32MZ Software Update: Stick Modes & Audio
No ratings yet
T32MZ Software Update: Stick Modes & Audio
1 page
Adobe Illustrator 3D Logo Tutorials
No ratings yet
Adobe Illustrator 3D Logo Tutorials
9 pages
HTML & Form Basics for Students
No ratings yet
HTML & Form Basics for Students
9 pages

Assignment

Uploaded by

Assignment

Uploaded by

In [1]: #_______________________________________FDS(Assignment No-1)______________________________

# Q-1) Write a Python program to create a dataframe containing columns name,

Out[1]: Name Age Percentage

Name_Ronney Name_akash Name_om Name_saurabh Name_yash

count 10.000000 10.000000

mean 20.300000 82.100000

std 0.483046 10.181137

min 20.000000 66.000000

25% 20.000000 74.750000

50% 20.000000 84.000000

75% 20.750000 91.500000

max 21.000000 94.000000

Out[5]: rno marks

count 4.000000 4.000000

mean 2.500000 75.000000

std 1.290994 12.909944

min 1.000000 60.000000

25% 1.750000 67.500000

50% 2.500000 75.000000

75% 3.250000 82.500000

max 4.000000 90.000000

Out[1]: Name Age Percentage remarks

10 None None None None

12 None None None None

15 None None None None

Out[6]: Name Age Percentage

10 None None None

12 None None None

15 None None None

import matplotlib.pyplot as plt

import matplotlib.pyplot as plt

You might also like

In [1]: #_________FDS(Assignment No-1)