0% found this document useful (0 votes)

75 views7 pages

DA Unit-2

Data analytics and cybersecurity notes

Uploaded by

KaataRanjithkumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

75 views7 pages

DA Unit-2

Data analytics and cybersecurity notes

Uploaded by

KaataRanjithkumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

Introduction to Analytics

 Predictive Analytics is an art of predicting future on the basis of past trend.

 It is a branch of Statistics which comprises of Modeling Techniques, Machine Learning
& Data Mining.
 Predictive Analytics is primarily used in Decision Making.

What and Why analytics:

 Analytics is a journey that involves a combination of potential skills, advanced

technologies, applications, and processes used by firm to gain business insights from data
and statistics.
 This is done to perform business planning.

Places where Analytics is used:

Reporting Vs Analytics:

 Reporting is presenting result of data analysis

 Analytics is process or systems involved in analysis of data to obtain a desired output.
Introduction to tools and Environment:

Analytics is now days used in all the fields ranging from Medical Science to Aero science to
Government Activities.

 Data Science and Analytics are used by Manufacturing companies as well as Real
Estate firms to develop their business and solve various issues by the help of historical
data base.
 Tools are the software that can be used for Analytics like SAS or R.
 While techniques are the procedures to be followed to reach up to a solution.
 Various steps involved in Analytics:

1. Access
2. Manage
3. Analyze
4. Report

Various Analytics techniques are:

1.Data Preparation
2. Reporting, Dashboards & Visualization
3. Segmentation Icon
4. Forecasting
5. Descriptive Modeling
6. Predictive Modeling
7. Optimization
Application of Modeling in Business

 A statistical model embodies a set of assumptions concerning the generation of the

observed data, and similar data from a larger population.

 A model represents, often in considerably idealized form, the data-generating process.

 Signal processing is an enabling technology that encompasses the fundamental theory,

applications, algorithms, and implementations of processing or transferring information
contained in many different physical, symbolic, or abstract formats broadly designated as
signals.

 It uses mathematical, statistical, computational, heuristic, and linguistic representations,

formalisms, and techniques for representation, modeling, analysis, synthesis, discovery,
recovery, sensing, acquisition, extraction, learning, security, or forensics.

 In manufacturing statistical models are used to define Warranty policies, solving various
conveyor related issues, Statistical Process Control etc.
Databases & Type of data and variables

 Data dictionary, or metadata repository

 "centralized repository of information about data such as meaning, relationships
to other data, origin, usage, and format” as defined in the IBM Dictionary of
Computing
 A document describing a database or collection of databases
 An integral component of a DBMS that is required to determine its structure
 A piece of middleware that extends or supplants the native data dictionary of a
DBMS

 Category of Data
 Data can be categorized on various parameters like Categorical, Type etc.
 Types of Data
 Basic 2 types
 Numeric
 Character.
 Numeric data can be further divided into sub group of
 Discrete
 Continuous.
 Again, Data can be divided into 2 categories
 Nominal
 Ordinal.
 Also based on usage data, divided into 2 categories
 Quantitative
 Qualitative

 Manufacturing industry also has their data divided in the groups discussed above.
 Like production quantity is a discrete quantity
 While production rate is a continuous data.
 Similarly quality parameter can be given ratings which ordinal data.
Data Modeling Techniques Overview

 Regression analysis mainly focuses on finding a relationship between a dependent

variable and one or more independent variables.
 Predict the value of a dependent variable based on the value of at least one independent
variable.
 It explains the impact of changes in an independent variable on the dependent variable.
 Y = f(X, β) where Y is the dependent variable X is the independent variable β is the
unknown coefficient.
 Widely used in prediction and forecasting.


Missing Imputations

 In R, missing values are represented by the symbol NA (not available).

 Impossible values (e.g., dividing by zero) are represented by the symbol NaN (not a
number). Unlike SAS, R uses the same symbol for character and numeric data.
 To test if there is any missing in the dataset we use is.na () function.
 For Example, We have defined “y” and then checked if there is any missing value.
 T or True means that there is a missing value. y <- c(1,2,3,NA) is.na(y) # returns a vector
(F FF T)
 Arithmetic functions on missing values yield missing values.
 For Example, x <- c(1,2,NA,3) mean(x) # returns NA To remove missing values from
our dataset we use na.omit() function.
 For Example, We can create new dataset without missing data as below: -

newdata<- na.omit(mydata)

 we can also use “na.rm=TRUE” in argument of the operator.

 From above example we use na.rm and get desired result. x <- c(1,2,NA,3) mean(x,
na.rm=TRUE)
 # returns 2
 MICE Package -> Multiple Imputation by Chained Equations MICE uses PMM to
impute missing values in a dataset.
 PMM-> Predictive Mean Matching (PMM) is a semi-parametric imputation approach.
 It is similar to the regression method except that for each missing value, it fills in a value
randomly from among the observed donor values from an observation whose regression-
predicted values are closest to the regression-predicted value for the missing value from
the simulated regression model.

Predictive Analytics
No ratings yet
Predictive Analytics
40 pages
Video Report
No ratings yet
Video Report
13 pages
Accounting Analytics 2
No ratings yet
Accounting Analytics 2
41 pages
Unit-5 Bda
No ratings yet
Unit-5 Bda
21 pages
Data Analysis & Regression Guide
No ratings yet
Data Analysis & Regression Guide
136 pages
Big Data Chapter 2
No ratings yet
Big Data Chapter 2
62 pages
Datascience Sum.23sol
No ratings yet
Datascience Sum.23sol
22 pages
IV Ai-Ds Ad3491 Fdsa QB Unit5
No ratings yet
IV Ai-Ds Ad3491 Fdsa QB Unit5
4 pages
Dr. Gaurav Dixit: Department of Management Studies
No ratings yet
Dr. Gaurav Dixit: Department of Management Studies
26 pages
Unit - 4
No ratings yet
Unit - 4
21 pages
Unit-II (Data Analytics)
100% (1)
Unit-II (Data Analytics)
17 pages
Data Mining Reviewer
No ratings yet
Data Mining Reviewer
4 pages
Predictive Analytics in Operations
No ratings yet
Predictive Analytics in Operations
12 pages
Predective Analytics
No ratings yet
Predective Analytics
11 pages
File 1704445511 0009750 Unit-1 PPT 01
No ratings yet
File 1704445511 0009750 Unit-1 PPT 01
41 pages
Ivy - Data Science and Data Visualization Certification Course
100% (1)
Ivy - Data Science and Data Visualization Certification Course
10 pages
Data Analytics & Visualization Guide
No ratings yet
Data Analytics & Visualization Guide
77 pages
Chapter 6 Introduction To Predictive Analytics
100% (1)
Chapter 6 Introduction To Predictive Analytics
46 pages
Fullest Ads Ppts
No ratings yet
Fullest Ads Ppts
431 pages
Module - 03
No ratings yet
Module - 03
28 pages
DA Unit 2 Trio 1
No ratings yet
DA Unit 2 Trio 1
26 pages
The Predictive Analytics Model
No ratings yet
The Predictive Analytics Model
6 pages
Big - Data Unit-2
100% (2)
Big - Data Unit-2
64 pages
Group 11 Data Analytics
No ratings yet
Group 11 Data Analytics
8 pages
Da Unit 2
No ratings yet
Da Unit 2
18 pages
Chapter 1: Introduction To Business Analytics
No ratings yet
Chapter 1: Introduction To Business Analytics
14 pages
Unit - III - PREDICTIVE ANALYTICS
No ratings yet
Unit - III - PREDICTIVE ANALYTICS
28 pages
Module 1 - Introduction To Data Analytics
No ratings yet
Module 1 - Introduction To Data Analytics
21 pages
Unit Iv
No ratings yet
Unit Iv
11 pages
Descriptive Analytics I: Nature of Data,: Statistical Modeling, and Visualization
No ratings yet
Descriptive Analytics I: Nature of Data,: Statistical Modeling, and Visualization
76 pages
BA TH Exam
No ratings yet
BA TH Exam
38 pages
Unit - Iii - Ba
No ratings yet
Unit - Iii - Ba
36 pages
Finals-Predictive-Time-Series-Analysis - Module
No ratings yet
Finals-Predictive-Time-Series-Analysis - Module
14 pages
Pa Digital Notes
No ratings yet
Pa Digital Notes
112 pages
Module 2-b Prediction Methods and Models-Data Preperation
No ratings yet
Module 2-b Prediction Methods and Models-Data Preperation
26 pages
HIT391-week 3-New
No ratings yet
HIT391-week 3-New
43 pages
Sia2206 Data Analytics Notes
No ratings yet
Sia2206 Data Analytics Notes
42 pages
REVIEWER
No ratings yet
REVIEWER
9 pages
Data Analytics Unit 1
No ratings yet
Data Analytics Unit 1
25 pages
Certified Business Analytics Professional Course Curriculum: Topic What Does It Mean? Introduction To Business Analytics
No ratings yet
Certified Business Analytics Professional Course Curriculum: Topic What Does It Mean? Introduction To Business Analytics
3 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
62 pages
Unit Iii QB
No ratings yet
Unit Iii QB
6 pages
Data Analytics Chapter - 1
No ratings yet
Data Analytics Chapter - 1
42 pages
Data Science Slides
No ratings yet
Data Science Slides
57 pages
Business Analytics: Aviral Apurva Anureet Bansal Devansh Agarwaal Dhwani Dhingra Chirag Verma
No ratings yet
Business Analytics: Aviral Apurva Anureet Bansal Devansh Agarwaal Dhwani Dhingra Chirag Verma
49 pages
Predictive Analytics
No ratings yet
Predictive Analytics
3 pages
Data Mining Tasks
No ratings yet
Data Mining Tasks
20 pages
Business Analytics
No ratings yet
Business Analytics
21 pages
Predictive Analys
No ratings yet
Predictive Analys
34 pages
Bda Unit 5
No ratings yet
Bda Unit 5
14 pages
BigData QB (C.format)
No ratings yet
BigData QB (C.format)
6 pages
Predictive Analytics - Wikipedia
No ratings yet
Predictive Analytics - Wikipedia
11 pages
Predictive Analytics - Wikipedia
No ratings yet
Predictive Analytics - Wikipedia
10 pages
Unit 2
No ratings yet
Unit 2
76 pages
Dav Sem 6
No ratings yet
Dav Sem 6
25 pages
Session 2
100% (1)
Session 2
35 pages
Chapter 01 2
No ratings yet
Chapter 01 2
19 pages
DA Unit-5
No ratings yet
DA Unit-5
6 pages
Retail Banking - Icicibank
No ratings yet
Retail Banking - Icicibank
69 pages
Cloud Based Online Blood Bank
100% (1)
Cloud Based Online Blood Bank
16 pages
3level Password Authentication System
100% (2)
3level Password Authentication System
4 pages
Bug Tracking for Developers
No ratings yet
Bug Tracking for Developers
28 pages
Android Vehicle Tracking & Speed Control
100% (1)
Android Vehicle Tracking & Speed Control
20 pages
Employee Work Management System
No ratings yet
Employee Work Management System
25 pages
E-Ration Card Management System Using RFID
No ratings yet
E-Ration Card Management System Using RFID
18 pages
RSA for E-commerce Security
100% (1)
RSA for E-commerce Security
23 pages
Vehicle Management System
No ratings yet
Vehicle Management System
27 pages
Ecommerce Management System
100% (1)
Ecommerce Management System
20 pages
Card Payment Security Using RSA
100% (2)
Card Payment Security Using RSA
23 pages
PVTC Chapter 11 - Working With Cases A4
No ratings yet
PVTC Chapter 11 - Working With Cases A4
14 pages
EtherCAT Training PDF
No ratings yet
EtherCAT Training PDF
68 pages
GPS Tracker with Temp Control
No ratings yet
GPS Tracker with Temp Control
8 pages
Game Enemy and Player Stats Guide
No ratings yet
Game Enemy and Player Stats Guide
25 pages
Artikel TEKNIK ELEKTRO
No ratings yet
Artikel TEKNIK ELEKTRO
6 pages
Fiat Runbook PDF
No ratings yet
Fiat Runbook PDF
9 pages
Netapp NS0 004@
No ratings yet
Netapp NS0 004@
9 pages
SBP Governance Framework
No ratings yet
SBP Governance Framework
27 pages
ASR9000 Feature Navigator
No ratings yet
ASR9000 Feature Navigator
9 pages
Speech To Text Conversion
No ratings yet
Speech To Text Conversion
6 pages
Hyperion Planning Manual (Template For Reference)
100% (1)
Hyperion Planning Manual (Template For Reference)
43 pages
Best Practices in Exception Handling
No ratings yet
Best Practices in Exception Handling
4 pages
IBM System Storage Product Guide: IBM Systems and Technology
No ratings yet
IBM System Storage Product Guide: IBM Systems and Technology
24 pages
Software Modeling Essentials
No ratings yet
Software Modeling Essentials
10 pages
Aspiring for MS in Computer Science
No ratings yet
Aspiring for MS in Computer Science
2 pages
Riphah International University Faculty of Computing Programming Fundamentals Lab 06 Conditional Operator and Switch Statements
No ratings yet
Riphah International University Faculty of Computing Programming Fundamentals Lab 06 Conditional Operator and Switch Statements
4 pages
IBM 6400 Phasing Adjust
No ratings yet
IBM 6400 Phasing Adjust
2 pages
Job Description - NOC Engineer
No ratings yet
Job Description - NOC Engineer
2 pages
Android App Components
No ratings yet
Android App Components
32 pages
Cyber Crime
81% (27)
Cyber Crime
26 pages
Stamp Mate 2019: User's Guide
No ratings yet
Stamp Mate 2019: User's Guide
67 pages
Britannica School Guided Tour
No ratings yet
Britannica School Guided Tour
5 pages
Microsoft Dynamics CRM IG Operating
No ratings yet
Microsoft Dynamics CRM IG Operating
59 pages
Training Material Guideline
No ratings yet
Training Material Guideline
2 pages
ST 2 Gr.6 Arts With Tos
No ratings yet
ST 2 Gr.6 Arts With Tos
5 pages
Analytics-Based Investigation & Automated Response With AWS + Splunk Security Solutions
No ratings yet
Analytics-Based Investigation & Automated Response With AWS + Splunk Security Solutions
37 pages
Expansion Joint Internal Corner Detail
100% (1)
Expansion Joint Internal Corner Detail
1 page
Python Project Amit Kumar 150 Pages
No ratings yet
Python Project Amit Kumar 150 Pages
147 pages
08 HUAWEI CLOUD Stack ManageOne OperationCenter Introduction
No ratings yet
08 HUAWEI CLOUD Stack ManageOne OperationCenter Introduction
136 pages
XXX
No ratings yet
XXX
8 pages

DA Unit-2

Uploaded by

DA Unit-2

Uploaded by

Introduction to Analytics

 Predictive Analytics is an art of predicting future on the basis of past trend.

What and Why analytics:

 Analytics is a journey that involves a combination of potential skills, advanced

Places where Analytics is used:

 Reporting is presenting result of data analysis

Various Analytics techniques are:

 A statistical model embodies a set of assumptions concerning the generation of the

 A model represents, often in considerably idealized form, the data-generating process.

 Signal processing is an enabling technology that encompasses the fundamental theory,

 It uses mathematical, statistical, computational, heuristic, and linguistic representations,

 Data dictionary, or metadata repository

 Regression analysis mainly focuses on finding a relationship between a dependent

 In R, missing values are represented by the symbol NA (not available).

 we can also use “na.rm=TRUE” in argument of the operator.

You might also like