Question Bank

The document outlines a comprehensive curriculum for an Exploratory Data Analysis course, covering key topics in Python, NumPy, Pandas, data visualization with Matplotlib, and machine learning. Each module includes specific questions and programming tasks designed to assess understanding and application of data analysis techniques. The course emphasizes practical skills through coding exercises and theoretical concepts essential for data manipulation and analysis.

Uploaded by

parvithac31

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views2 pages

Question Bank

Uploaded by

parvithac31

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

IMPORTANT QUESTION

Exploratory Data Analysis(BDS613B)

Module 1: Introduction to Python and NumPy:

1. Explain the role of IPython and Jupyter in data analysis. (5 Marks)

2. Describe the enhanced interactive features of IPython. (5 Marks)
3. What are NumPy arrays? Explain their importance in scientific computing. (10 Marks)
4. Write a Python program to demonstrate the creation and manipulation of a NumPy array. (10
Marks)
5. Explain how NumPy handles structured data with examples. (10 Marks)
6. Compare NumPy arrays with Python lists in terms of performance and functionality. (5 Marks)
7. How are sorted arrays utilized in data analysis tasks? (5 Marks)
8. What is the significance of NumPy’s structured arrays in handling complex datasets? (10 Marks)
9. Illustrate the process of indexing and slicing in NumPy arrays with examples. (10 Marks)
10. Explain the key differences between 1D, 2D, and multi-dimensional arrays in NumPy. (10 Marks)

Module 2: Data Manipulation with Pandas – I:

1. Explain the concept of Pandas objects and their types. (5 Marks)

2. How can missing data be handled in Pandas? Provide examples. (10 Marks)
3. Write a Python program to demonstrate hierarchical indexing in Pandas. (10 Marks)
4. What are pivot tables in Pandas, and how are they useful in data analysis? (10 Marks)
5. Discuss the significance of DataFrame and Series in Pandas. (5 Marks)
6. Compare Pandas with NumPy for data manipulation tasks. (5 Marks)
7. Explain the use of .groupby() in Pandas for aggregating data. (10 Marks)
8. How do you load and save data using Pandas? Illustrate with examples. (10 Marks)
9. Discuss the advantages of using Pandas for handling time-series data. (10 Marks)
10. Write a Python program to demonstrate basic data manipulation using Pandas. (10 Marks)

Module 3: Data Manipulation with Pandas – II:

1. Explain vectorized string operations in Pandas with examples. (10 Marks)

2. How does Pandas handle time-series data? Provide examples. (10 Marks)
3. What are the benefits of using the eval and query methods in Pandas? (5 Marks)
4. Write a Python program to demonstrate the use of eval in Pandas for high-performance operations.
(10 Marks)
5. Discuss the challenges and solutions in working with large datasets in Pandas. (10 Marks)
6. Illustrate the use of .merge() and .concat() for data combination in Pandas. (10 Marks)
7. How can you perform indexing and selection in Pandas DataFrames? (5 Marks)
8. Explain the process of reshaping and pivoting data in Pandas. (10 Marks)
9. Compare vectorized operations with iterative approaches in Pandas. (5 Marks)
10. Write a Python script to demonstrate handling and analyzing time-series data. (10 Marks)

Module 4: Data Visualization with Matplotlib:

1. Explain the general tips for creating visualizations with Matplotlib. (5 Marks)
2. Write a Python program to create a simple line plot using Matplotlib. (10 Marks)
3. How can scatter plots be created and customized in Matplotlib? (10 Marks)
4. Discuss the role of Seaborn in enhancing data visualizations. (5 Marks)
5. Compare Matplotlib with Seaborn in terms of functionality and ease of use. (10 Marks)
6. Illustrate how to create a histogram using Matplotlib. (5 Marks)
7. Explain the use of color maps in visualizing data with Matplotlib. (10 Marks)
8. Write a Python script to create multiple subplots in a single figure. (10 Marks)
9. How can Seaborn be used for correlation heatmaps? Provide an example. (10 Marks)
10. Discuss the best practices for designing effective visualizations. (10 Marks)

Module 5: Introduction to Machine Learning:

1. Define machine learning and explain its significance in data analysis. (5 Marks)
2. Write a Python program to demonstrate the use of Scikit-Learn for simple linear regression. (10
Marks)
3. What are hyperparameters in machine learning models? Explain their importance. (10 Marks)
4. How is model validation performed in Scikit-Learn? (5 Marks)
5. Compare supervised and unsupervised learning with examples. (10 Marks)
6. Explain the process of splitting datasets into training and testing sets. (5 Marks)
7. Discuss the steps involved in building a machine learning pipeline in Scikit-Learn. (10 Marks)
8. How is cross-validation used for model evaluation? Provide an example. (10 Marks)
9. Write a Python script to demonstrate classification using decision trees in Scikit-Learn. (10 Marks)
10. Explain the challenges faced in machine learning projects and how they can be addressed. (10
Marks)

Revision Questions
No ratings yet
Revision Questions
19 pages
Question Bank
No ratings yet
Question Bank
4 pages
IDS Syllabus
No ratings yet
IDS Syllabus
5 pages
Python Data Science Certificate Course
No ratings yet
Python Data Science Certificate Course
5 pages
Data Analysis and Visualization LAB
No ratings yet
Data Analysis and Visualization LAB
2 pages
CS101 Syllabus
No ratings yet
CS101 Syllabus
2 pages
Python Basics by A K Singh
No ratings yet
Python Basics by A K Singh
3 pages
Python Programming For Data Analysis
No ratings yet
Python Programming For Data Analysis
6 pages
Syllabus AIML
No ratings yet
Syllabus AIML
14 pages
Data Analysis and Visualization-Theory - R22A
No ratings yet
Data Analysis and Visualization-Theory - R22A
2 pages
Ocs353 Data Science Fundamentals
No ratings yet
Ocs353 Data Science Fundamentals
2 pages
Functional Programming in Python Syllabus
No ratings yet
Functional Programming in Python Syllabus
3 pages
Exam Questions Based On DSI436 Module Outline
No ratings yet
Exam Questions Based On DSI436 Module Outline
3 pages
22am901 Data Science Using Python Unit 2
No ratings yet
22am901 Data Science Using Python Unit 2
116 pages
Assignment DS EC11 3
No ratings yet
Assignment DS EC11 3
1 page
Data Science for Engineers Course
No ratings yet
Data Science for Engineers Course
8 pages
Python Course Outline
No ratings yet
Python Course Outline
24 pages
Business Analytics QB
No ratings yet
Business Analytics QB
8 pages
Analytics or Computing With Python
No ratings yet
Analytics or Computing With Python
2 pages
Ocs353 DCF
No ratings yet
Ocs353 DCF
4 pages
Ocs353 DSF Syllabus
No ratings yet
Ocs353 DSF Syllabus
3 pages
DAL EXT 1 and 2
No ratings yet
DAL EXT 1 and 2
125 pages
Problem Set 4
No ratings yet
Problem Set 4
2 pages
CS352 - Lab Syllabus
No ratings yet
CS352 - Lab Syllabus
2 pages
Data Science and Machine Learning Using Python
No ratings yet
Data Science and Machine Learning Using Python
4 pages
DS-DS Lab-1
No ratings yet
DS-DS Lab-1
4 pages
Data Analysis Lab with Python
No ratings yet
Data Analysis Lab with Python
11 pages
Python & Pandas Statistical Analysis Q&A
No ratings yet
Python & Pandas Statistical Analysis Q&A
2 pages
LTI1
No ratings yet
LTI1
20 pages
Python Data Science Intro To ML - Course 01
No ratings yet
Python Data Science Intro To ML - Course 01
3 pages
Python For Data Science
No ratings yet
Python For Data Science
4 pages
Syllabus Programming For Data Science - AIML
No ratings yet
Syllabus Programming For Data Science - AIML
2 pages
Data Analytics with Python Course
No ratings yet
Data Analytics with Python Course
2 pages
Gujarat Technological University: Overview of Python and Data Structures
No ratings yet
Gujarat Technological University: Overview of Python and Data Structures
4 pages
Data Science
No ratings yet
Data Science
7 pages
Data Sceince Lab Manual
No ratings yet
Data Sceince Lab Manual
64 pages
Unit 5
No ratings yet
Unit 5
20 pages
Roadmap Data Science Track
No ratings yet
Roadmap Data Science Track
3 pages
Learninng Plan
No ratings yet
Learninng Plan
6 pages
Pandas Training Plan
No ratings yet
Pandas Training Plan
5 pages
3rd Sem Syllabus
No ratings yet
3rd Sem Syllabus
5 pages
Artificial Intelligence and Python
No ratings yet
Artificial Intelligence and Python
4 pages
Data Analysis
No ratings yet
Data Analysis
8 pages
PDS Merged New
No ratings yet
PDS Merged New
19 pages
Python Exam for EEE Students
No ratings yet
Python Exam for EEE Students
3 pages
TBC 603 Fundamentals of Machine Learning
No ratings yet
TBC 603 Fundamentals of Machine Learning
2 pages
Foundations of Data Science
No ratings yet
Foundations of Data Science
3 pages
Final Coursework - 24.2 Ad Cert Python
No ratings yet
Final Coursework - 24.2 Ad Cert Python
2 pages
Ocs353 Data Science Fundamentals Laboratory-Eee
No ratings yet
Ocs353 Data Science Fundamentals Laboratory-Eee
52 pages
Fds Merged
No ratings yet
Fds Merged
102 pages
Fdsa Lab Manual Final
No ratings yet
Fdsa Lab Manual Final
70 pages
Data Analysis - Python Based
No ratings yet
Data Analysis - Python Based
3 pages
Assignment 01
No ratings yet
Assignment 01
7 pages
Computational
No ratings yet
Computational
7 pages
Data Sciencewith Python
No ratings yet
Data Sciencewith Python
3 pages
Syllabus Analyzing, Visualizing, Data Science Minor
No ratings yet
Syllabus Analyzing, Visualizing, Data Science Minor
3 pages
PDS Question Bank
No ratings yet
PDS Question Bank
1 page
Alchemyst Data Science and Machine Learning Program
No ratings yet
Alchemyst Data Science and Machine Learning Program
4 pages
Module 4 & 5 Question Bank
No ratings yet
Module 4 & 5 Question Bank
1 page
M4 Q&a
No ratings yet
M4 Q&a
22 pages
Hive Commands Cheat Sheet
No ratings yet
Hive Commands Cheat Sheet
2 pages
IA1
No ratings yet
IA1
3 pages
M1 Q&a
No ratings yet
M1 Q&a
26 pages
Module 5
No ratings yet
Module 5
1 page
REPP Module 4 - Tidal Power and OTEC
No ratings yet
REPP Module 4 - Tidal Power and OTEC
10 pages
Dataframe
No ratings yet
Dataframe
19 pages
Python Libraries: NumPy, Pandas, Matplotlib
No ratings yet
Python Libraries: NumPy, Pandas, Matplotlib
68 pages
Batch-59 - Analysis On Cyber Attacks
No ratings yet
Batch-59 - Analysis On Cyber Attacks
13 pages
Iot Da1
No ratings yet
Iot Da1
16 pages
Python Important
No ratings yet
Python Important
35 pages
Indian Literacy Analysis Project
No ratings yet
Indian Literacy Analysis Project
33 pages
Po, Pso, Co M.SC CS
No ratings yet
Po, Pso, Co M.SC CS
78 pages
SSI Syllabus 2025
No ratings yet
SSI Syllabus 2025
17 pages
Eda Important Two Marks & 16 Marks
0% (1)
Eda Important Two Marks & 16 Marks
17 pages
Data Sceince and AI Training Curriculum - V4.0
No ratings yet
Data Sceince and AI Training Curriculum - V4.0
19 pages
Machine Learning Record VR19
No ratings yet
Machine Learning Record VR19
46 pages
Data Analyst
No ratings yet
Data Analyst
4 pages
Series
No ratings yet
Series
2 pages
Class 12th QuestionBank InformaticsPractices
No ratings yet
Class 12th QuestionBank InformaticsPractices
148 pages
Agentic AI
No ratings yet
Agentic AI
26 pages
CS3362 - Data Science Laboratory - Manual - Final-1
No ratings yet
CS3362 - Data Science Laboratory - Manual - Final-1
76 pages
Nasreen F Resume SP
No ratings yet
Nasreen F Resume SP
1 page
Data Analysis With Python, SQL &
No ratings yet
Data Analysis With Python, SQL &
18 pages
Data Science Lab Record2025
No ratings yet
Data Science Lab Record2025
64 pages
IPL Auction Analysis For Player Selection Based
No ratings yet
IPL Auction Analysis For Player Selection Based
9 pages
FDS Notes Unit-4
No ratings yet
FDS Notes Unit-4
30 pages
Machine Learning Course Handbook - RMA
No ratings yet
Machine Learning Course Handbook - RMA
12 pages
Simple Load Disaggregation Library Based On NILMTK
No ratings yet
Simple Load Disaggregation Library Based On NILMTK
4 pages
Data Science Road Map
No ratings yet
Data Science Road Map
47 pages
Pandas 1 Series
No ratings yet
Pandas 1 Series
14 pages
Stress Detection via Sleep Analysis
No ratings yet
Stress Detection via Sleep Analysis
5 pages
Python Data Analytics: With Pandas, NumPy, and Matplotlib, 3rd Edition Fabio Nelli No Waiting Time
100% (4)
Python Data Analytics: With Pandas, NumPy, and Matplotlib, 3rd Edition Fabio Nelli No Waiting Time
106 pages
Pandas Complete Notes
No ratings yet
Pandas Complete Notes
105 pages
Data Science Learning Guide
No ratings yet
Data Science Learning Guide
1 page
227C4A Data Science
No ratings yet
227C4A Data Science
2 pages

Question Bank

Uploaded by

Question Bank

Uploaded by

IMPORTANT QUESTION

Exploratory Data Analysis(BDS613B)

Module 1: Introduction to Python and NumPy:

1. Explain the role of IPython and Jupyter in data analysis. (5 Marks)

Module 2: Data Manipulation with Pandas – I:

1. Explain the concept of Pandas objects and their types. (5 Marks)

Module 3: Data Manipulation with Pandas – II:

1. Explain vectorized string operations in Pandas with examples. (10 Marks)

Module 4: Data Visualization with Matplotlib:

Module 5: Introduction to Machine Learning:

You might also like