0% found this document useful (0 votes)

148 views3 pages

CS3352 FDS Solved 2024

Foundation of data science nov/dec 2024

Uploaded by

dharni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

148 views3 pages

CS3352 FDS Solved 2024

Foundation of data science nov/dec 2024

Uploaded by

dharni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

CS3352 – Foundations of Data Science

(Nov/Dec 2024)
Solved Question Paper with Answers

Part A (10 × 2 = 20 marks)

 Q: Define Data Science.

A: Data Science is an interdisciplinary field that uses scientific methods, statistics,

algorithms, and systems to extract knowledge and insights from structured and
unstructured data.

 Q: What is the difference between Data, Information, and Knowledge?

A: Data: Raw facts (e.g., 25, 30).

Information: Processed data with context (e.g., Average age = 27.5).
Knowledge: Actionable insight (e.g., Most students are in their 20s → target group for a
course).

 Q: Define Overfitting.

A: Overfitting occurs when a model learns the training data—including noise—too well,
performing excellently on training but poorly on unseen data.

 Q: List any two Python libraries used in Data Science.

A: NumPy, Pandas, Matplotlib, Scikit-learn (any two).

 Q: State Bayes’ Theorem.

A: P(H|E) = [P(E|H) * P(H)] / P(E). Used for probabilistic inference and classification (e.g.,
Naïve Bayes).

 Q: What is Normalization in Data Preprocessing?

A: Technique to scale numerical values into a standard range (e.g., [0,1]) to avoid bias from
larger-valued features.

 Q: Differentiate between Supervised and Unsupervised learning.

A: Supervised: Uses labeled data (e.g., classification).

Unsupervised: Uses unlabeled data (e.g., clustering).

 Q: Define Feature Engineering.

A: The process of selecting, creating, or transforming input variables (features) to improve
model performance.

 Q: What is Data Visualization? Give an example.

A: The graphical representation of data for easier interpretation. Example: Bar charts for
sales data, Heatmaps for correlations.

 Q: What is the significance of p-value in hypothesis testing?

A: The probability of observing the data if the null hypothesis is true. Small p-value (<0.05)
→ reject H0.

Part B (5 × 13 = 65 marks)

11(a). Explain the Data Science Lifecycle with neat diagram.

Steps: Business Understanding → Data Collection → Data Cleaning & Preprocessing →
Exploratory Data Analysis → Modeling → Evaluation → Deployment → Feedback.

Diagram: Represented as a circular flow, emphasizing iteration.

11(b). Explain the different types of Data with examples.

• Structured (tables in DB).
• Semi-structured (JSON, XML).
• Unstructured (text, images, video).
Examples provided for each.

12(a). What are the steps involved in Data Preprocessing? Explain.

Data cleaning (missing values, outliers), Integration, Transformation, Reduction,
Discretization.

12(b). Compare Descriptive, Predictive, and Prescriptive Analytics.

• Descriptive: What happened? (reports, dashboards).
• Predictive: What will happen? (forecasting, ML).
• Prescriptive: What should we do? (optimization, recommendations).

13(a). Explain different statistical measures used in Data Science.

• Central tendency: mean, median, mode.
• Dispersion: variance, std dev, IQR.
• Correlation & covariance.

13(b). Compute Mean, Median, Mode, Variance for data [2, 4, 4, 4, 5, 5, 7, 9].
Mean = 5
Median = 4.5
Mode = 4
Variance = 4
Std Dev = 2
14(a). Explain various data visualization techniques with examples.
Bar chart, Pie chart, Histogram, Scatter plot, Box plot, Heatmap. Each has different use cases.

14(b). With Python code, demonstrate data visualization.

import pandas as pd
import matplotlib.pyplot as plt

data = {'Month':['Jan','Feb','Mar','Apr'], 'Sales':[220,330,150,400]}

df = pd.DataFrame(data)

plt.plot(df['Month'], df['Sales'], marker='o')

plt.title('Monthly Sales')
plt.xlabel('Month')
plt.ylabel('Sales')
plt.show()

15(a). Explain different Machine Learning algorithms used in Data Science.

Supervised: Regression, Decision Trees, SVM.
Unsupervised: K-means, Hierarchical clustering.
Reinforcement: Q-learning.

15(b). Compare Linear Regression and Logistic Regression.

Linear Regression → Predicts continuous values.
Logistic Regression → Predicts class probabilities.

Part C (1 × 15 = 15 marks)

16. Case Study: Bank Loan Default Prediction

Business understanding: Classification problem.
Data collection: Past loan records.
Preprocessing: Handle missing values, normalize, encode.
Feature selection: Age, income, credit score.
Apply ML algorithms: Logistic Regression, Decision Tree.
Evaluation: Accuracy, precision, recall, F1, ROC.
Deployment: Integrated into loan approval system.

Data Science Set - B
No ratings yet
Data Science Set - B
5 pages
Cs3352 - Foundation of Data Science
No ratings yet
Cs3352 - Foundation of Data Science
56 pages
PDS Question Bank
No ratings yet
PDS Question Bank
19 pages
DS With Answer
No ratings yet
DS With Answer
10 pages
DS
No ratings yet
DS
7 pages
Data Science and Analytics-23pcscc34
No ratings yet
Data Science and Analytics-23pcscc34
2 pages
Data Science Assignment
No ratings yet
Data Science Assignment
9 pages
DS 3-Marks Semeseter Suggestion
No ratings yet
DS 3-Marks Semeseter Suggestion
54 pages
Fds Model
No ratings yet
Fds Model
2 pages
II CSE - A&B (96) DS-int 1 QP ANS-set1
No ratings yet
II CSE - A&B (96) DS-int 1 QP ANS-set1
7 pages
Set. No - 2 P18pecs021-Data Science QP - Ph.d.
No ratings yet
Set. No - 2 P18pecs021-Data Science QP - Ph.d.
20 pages
Sfds Aat
No ratings yet
Sfds Aat
8 pages
Ixs8h l8mgc
No ratings yet
Ixs8h l8mgc
40 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
2 pages
DS MCQ Semester Suggesstion
No ratings yet
DS MCQ Semester Suggesstion
26 pages
JanuaryFebruary 2023
No ratings yet
JanuaryFebruary 2023
2 pages
Data Science QB
No ratings yet
Data Science QB
2 pages
Data Sciences Class 10 Notes
100% (2)
Data Sciences Class 10 Notes
3 pages
Data Science
No ratings yet
Data Science
10 pages
DS Final 3 Marks
No ratings yet
DS Final 3 Marks
10 pages
Introduction To Data Science - 23CSH-283
100% (1)
Introduction To Data Science - 23CSH-283
48 pages
II MSC Cs - Data Science and Analytics
No ratings yet
II MSC Cs - Data Science and Analytics
2 pages
Data Science Interview Qna
No ratings yet
Data Science Interview Qna
5 pages
Scanned 20241018-1707 Page2 Image2
No ratings yet
Scanned 20241018-1707 Page2 Image2
7 pages
Capstone Project Data Science Methodology Class12 AI
No ratings yet
Capstone Project Data Science Methodology Class12 AI
3 pages
Xii - Ai - Notes - U 2
No ratings yet
Xii - Ai - Notes - U 2
8 pages
PDS PP
No ratings yet
PDS PP
2 pages
Data Science CS481 - Course Outline Spring 2020
No ratings yet
Data Science CS481 - Course Outline Spring 2020
3 pages
12 2marks With Ans
No ratings yet
12 2marks With Ans
21 pages
Data Science
No ratings yet
Data Science
10 pages
Data Science (2023 - 2024) Questions Papers
No ratings yet
Data Science (2023 - 2024) Questions Papers
6 pages
12 2marks With Ans
No ratings yet
12 2marks With Ans
21 pages
FDS - 1 Solved
No ratings yet
FDS - 1 Solved
17 pages
Data Science (Quick Guide) For College Exams
No ratings yet
Data Science (Quick Guide) For College Exams
34 pages
FDS Unit 1 QB
No ratings yet
FDS Unit 1 QB
7 pages
BSC - Computer Science Cs - Semester 5 - 2023 - April - Foundations of Data Science 2019 Pattern
No ratings yet
BSC - Computer Science Cs - Semester 5 - 2023 - April - Foundations of Data Science 2019 Pattern
2 pages
Fods Model Set B
No ratings yet
Fods Model Set B
2 pages
Cd363ia - Dav Model QP
No ratings yet
Cd363ia - Dav Model QP
3 pages
Fds QB
No ratings yet
Fds QB
21 pages
DATASCIENCE (Unit-1) Question Bank
No ratings yet
DATASCIENCE (Unit-1) Question Bank
6 pages
FDSA SEM Answer Key
No ratings yet
FDSA SEM Answer Key
11 pages
TYCS Data Science Questions Bank
No ratings yet
TYCS Data Science Questions Bank
3 pages
01.ad3491 Fdsa QB
No ratings yet
01.ad3491 Fdsa QB
16 pages
Q1. Explain Data Science Process Along With Detailed Diagram
No ratings yet
Q1. Explain Data Science Process Along With Detailed Diagram
7 pages
Data Science and ML-KTU
No ratings yet
Data Science and ML-KTU
11 pages
0.extracted Pages 20MCA201 From 2020 MCA S3 S4
No ratings yet
0.extracted Pages 20MCA201 From 2020 MCA S3 S4
18 pages
AD3491 - Unit 1 - Introduction To Data Science Important Questions 2 Marks With Answer - 3-8
No ratings yet
AD3491 - Unit 1 - Introduction To Data Science Important Questions 2 Marks With Answer - 3-8
6 pages
Ch.4.Data Science X-1
No ratings yet
Ch.4.Data Science X-1
3 pages
Question Bank With Answers
No ratings yet
Question Bank With Answers
103 pages
Data Science Ai Important Questions Answers - 250322 - 101649
No ratings yet
Data Science Ai Important Questions Answers - 250322 - 101649
31 pages
Introduction Data Science Edited
No ratings yet
Introduction Data Science Edited
33 pages
Exam - HND
No ratings yet
Exam - HND
3 pages
DSV Notes
No ratings yet
DSV Notes
13 pages
Big Data (Imp-Questions)
No ratings yet
Big Data (Imp-Questions)
17 pages
Unit 2 MCQ 12th Class
No ratings yet
Unit 2 MCQ 12th Class
11 pages
FDS Question Paper-01
No ratings yet
FDS Question Paper-01
13 pages
2023 May 18ECE271T
No ratings yet
2023 May 18ECE271T
2 pages
Ds Paper Question
No ratings yet
Ds Paper Question
6 pages
Assignment DS EC11 3
No ratings yet
Assignment DS EC11 3
1 page
Pranav Mistry
No ratings yet
Pranav Mistry
1 page
UDP and TCP Socket Programming Guide
No ratings yet
UDP and TCP Socket Programming Guide
3 pages
Introduction To Phonetics and Phonology
No ratings yet
Introduction To Phonetics and Phonology
17 pages
Elementary Logic
No ratings yet
Elementary Logic
6 pages
Anne Boyer - A Form of Sabotage
No ratings yet
Anne Boyer - A Form of Sabotage
3 pages
Research Proposal - Seah Jia Chen
No ratings yet
Research Proposal - Seah Jia Chen
16 pages
Wetting of Real Surfaces: October 2017
No ratings yet
Wetting of Real Surfaces: October 2017
8 pages
Math 154:: Elementary Algebra: Chapter 5 - Systems of Linear Equations in Two-Variables
No ratings yet
Math 154:: Elementary Algebra: Chapter 5 - Systems of Linear Equations in Two-Variables
11 pages
Earth's Place in The Solar System Assessment
No ratings yet
Earth's Place in The Solar System Assessment
3 pages
National Exam Should Be Abolished
No ratings yet
National Exam Should Be Abolished
4 pages
C Decimal Numbers Multiplication
No ratings yet
C Decimal Numbers Multiplication
2 pages
Turbidity Standards
No ratings yet
Turbidity Standards
18 pages
Balance & Hsing-I: Health & Martial Arts
67% (3)
Balance & Hsing-I: Health & Martial Arts
8 pages
2-Scrambling Code PlannScrambling Code Planning Guidelinesing Guidelines PDF
No ratings yet
2-Scrambling Code PlannScrambling Code Planning Guidelinesing Guidelines PDF
5 pages
Blender 2.5 Ocean Sim Tutorial
No ratings yet
Blender 2.5 Ocean Sim Tutorial
23 pages
Human Value by Tushar Tayal PDF
100% (1)
Human Value by Tushar Tayal PDF
314 pages
How Does Destination Social Responsibility Impact Residents' Quality of Life? The Mechanisms of Disclosure Entity, Communal Relationship, and Perceived Warmth
No ratings yet
How Does Destination Social Responsibility Impact Residents' Quality of Life? The Mechanisms of Disclosure Entity, Communal Relationship, and Perceived Warmth
21 pages
Variables
No ratings yet
Variables
39 pages
Ashley Beals: Public Health Resume
No ratings yet
Ashley Beals: Public Health Resume
2 pages
Management Information Systems
No ratings yet
Management Information Systems
17 pages
Cobol
No ratings yet
Cobol
39 pages
Advanced C Programming Course
No ratings yet
Advanced C Programming Course
39 pages
Cloudera Quickstart VM
No ratings yet
Cloudera Quickstart VM
11 pages
Resume Preusse November 2016
No ratings yet
Resume Preusse November 2016
2 pages
Universal Serial Bus (USB) : Device Class Definition For Human Interface Devices (HID)
No ratings yet
Universal Serial Bus (USB) : Device Class Definition For Human Interface Devices (HID)
98 pages
The Silva Mind Control Method For Business Managers (Stone, Robert B. Silva, Jose)
No ratings yet
The Silva Mind Control Method For Business Managers (Stone, Robert B. Silva, Jose)
215 pages
(Clemente, 2011) Empirical Analysis of Trends
No ratings yet
(Clemente, 2011) Empirical Analysis of Trends
33 pages
2016 - s1 - LD - Week 9 - Kryptonite - Character Integrity
No ratings yet
2016 - s1 - LD - Week 9 - Kryptonite - Character Integrity
22 pages
List of Students 2022 B.Tech Batch
No ratings yet
List of Students 2022 B.Tech Batch
7 pages
Detailed Lesson Plan Geometry 2
No ratings yet
Detailed Lesson Plan Geometry 2
9 pages

CS3352 FDS Solved 2024

Uploaded by

CS3352 FDS Solved 2024

Uploaded by

CS3352 – Foundations of Data Science

Part A (10 × 2 = 20 marks)

A: Data Science is an interdisciplinary field that uses scientific methods, statistics,

 Q: What is the difference between Data, Information, and Knowledge?

A: Data: Raw facts (e.g., 25, 30).

 Q: List any two Python libraries used in Data Science.

A: NumPy, Pandas, Matplotlib, Scikit-learn (any two).

 Q: State Bayes’ Theorem.

 Q: What is Normalization in Data Preprocessing?

 Q: Differentiate between Supervised and Unsupervised learning.

A: Supervised: Uses labeled data (e.g., classification).

 Q: Define Feature Engineering.

 Q: What is Data Visualization? Give an example.

 Q: What is the significance of p-value in hypothesis testing?

11(a). Explain the Data Science Lifecycle with neat diagram.

Diagram: Represented as a circular flow, emphasizing iteration.

11(b). Explain the different types of Data with examples.

12(a). What are the steps involved in Data Preprocessing? Explain.

12(b). Compare Descriptive, Predictive, and Prescriptive Analytics.

13(a). Explain different statistical measures used in Data Science.

14(b). With Python code, demonstrate data visualization.

data = {'Month':['Jan','Feb','Mar','Apr'], 'Sales':[220,330,150,400]}

plt.plot(df['Month'], df['Sales'], marker='o')

15(a). Explain different Machine Learning algorithms used in Data Science.

15(b). Compare Linear Regression and Logistic Regression.

16. Case Study: Bank Loan Default Prediction

You might also like