Classification and Prediction Techniques

The document discusses classification and prediction in data analysis, highlighting the use of decision trees, Bayesian classifiers, and rule-based classification methods. It explains various algorithms like ID3 for decision tree induction and Naïve Bayes for class membership probabilities. Additionally, it covers advanced methods such as Bayesian Belief Networks and neural network algorithms like backpropagation for classification tasks.

Uploaded by

dge363qfh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views58 pages

Classification and Prediction Techniques

Uploaded by

dge363qfh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Classification

• Classification : is a form of data analysis that

extracts models describing important data
classes
– Models: predict categorical (discrete, unordered)
class labels
• E.g classification model to categorize bank loan
application as either safe or risky
• Marketing manager needs to know if customer would
buy new computer or not
• Medical Researcher may want to know which class of
treatment to be given for the patient
Prediction
• Prediction: marketing manager needs to
predict how much the customer is likely to
spend on items

– Numeric prediction: model constructed predicts a

continuous – valued function as opposed to a
class label
Classification and Prediction
Classification vs Prediction
Decision Tree Induction
• It is the learning of decision trees from
class-labeled training tuples
– Decision tree: is a tree structure where each
internal node (non leaf node) denotes a test on
an attribute
– each branch represents an outcome of the test
– Each leaf node holds a class label
Decision Tree - Example
ID3
• Algorithm
• The core algorithm for building decision trees
called ID3 by J. R. Quinlan which employs a
top-down, greedy search through the space of
possible branches with no backtracking.
• ID3 uses Entropy and Information Gain to
construct a decision tree.
Attribute Selection Measures
• Information Gain

• Gain Ratio

• Gini Index
Information Gain Method
Example
Information Gain Sequence
• IG (Age) = 0.246 bits
• IG (Student)=0.151 bits
• IG (Credit_rating)=0.048 bits
• IG (Income)=0.029 bits
Final Induction Tree based on Age
(Splitting Factor)
Final Decision Tree
Gain Ratio Method
• It splits the training data set D, into v
partitions corresponding to the v outcomes of
a data set for each subset of each attribute
• Constructs the best possible value with
respect to Gain(D) and Split(Attribute) ratio
Gain Ratio Method
Gain Ratio - Example
Gini Index Method
• It measures the impurity of D (transactions)
• It performs the binary split with respect to
each attribute value for all subset of classes
– Based on total number of combinations possible
to be made
• Reduction in impurity
– Constructs the best subset combination among
the attribute that gives best possible higher value
in terms of reduction in impurity
Gini Index Method
Gini Index -Example
• We can clearly see that IG(S, Outlook) has the
highest information gain of 0.246, hence we
chose Outlook attribute as the root node. At
this point, the decision tree looks like.
• Now that we’ve used Outlook,
• we’ve got three of them remaining Humidity,
Temperature, and Wind.

• we had three possible values of Outlook: Sunny,

Overcast, Rain.
• Where the Overcast node already ended up having
leaf node ‘Yes’, so we’re left with two subtrees to
compute: Sunny and Rain.
Bayes’ Classification Methods
• Bayesian Classifiers: are statistical classifiers
– they can predict class membership probabilities such as the
probability that a given tuple belongs to a particular class
– Based on Bayes’ theorem
• Posterior probability
– Checks the class type based on the given predictor
» E.g class yes or no
• Likelihood
– Checks how many times given predictor value yes from total yes class
• Class Prior probability
– Checks how many total times yes out of total tuple D
• Predictor Prior Probability
– Checks how many total times no out of total tuple D
Naïve Bayes Classifier: Training Dataset

Class:
C1:buys_computer = ‘yes’
C2:buys_computer = ‘no’

Data to be classified:
X = (age <=30,
Income = medium,
Student = yes
Credit_rating = Fair)

37
Naïve Bayes Classifier: An Example
• P(Ci): P(buys_computer = “yes”) = 9/14 = 0.643
P(buys_computer = “no”) = 5/14= 0.357
• Compute P(X|Ci) for each class
P(age = “<=30” | buys_computer = “yes”) = 2/9 = 0.222
P(age = “<= 30” | buys_computer = “no”) = 3/5 = 0.6
P(income = “medium” | buys_computer = “yes”) = 4/9 = 0.444
P(income = “medium” | buys_computer = “no”) = 2/5 = 0.4
P(student = “yes” | buys_computer = “yes) = 6/9 = 0.667
P(student = “yes” | buys_computer = “no”) = 1/5 = 0.2
P(credit_rating = “fair” | buys_computer = “yes”) = 6/9 = 0.667
P(credit_rating = “fair” | buys_computer = “no”) = 2/5 = 0.4
• X = (age <= 30 , income = medium, student = yes, credit_rating = fair)
P(X|Ci) : P(X|buys_computer = “yes”) = 0.222 x 0.444 x 0.667 x 0.667 = 0.044
P(X|buys_computer = “no”) = 0.6 x 0.4 x 0.2 x 0.4 = 0.019
P(X|Ci)*P(Ci) : P(X|buys_computer = “yes”) * P(buys_computer = “yes”) = 0.028
P(X|buys_computer = “no”) * P(buys_computer = “no”) = 0.007
Therefore,
38 X belongs to class (“buys_computer = yes”)
Rule-Based Classification
• Using IF-THEN Rules for Classification
– IF condition (antecedent) THEN conclusion
(consequent)
– E.g IF age=youth AND student = yes THEN
buys_computer = yes
– R1: (age=youth)^ (student = yes)=
(buys_computer=yes)
– Coverage: total number of tuples covered by Rule
– Accuracy: out of the covered tuples how many are
correct
Coverage & Accuracy
Coverage & Accuracy - Example
• R1: (age=youth)^ (student = yes)=
(buys_computer=yes)
Rule based Classification to predict
class label
• R1: (age=youth)^ (student = yes)=
(buys_computer=yes)
More than one Rule Situation – more
classes
• Conflict Resolution Strategy: to resolve the conflict
when more than one rules are satisfied by the tuple X
– Size Ordering technique
• Highest priority is given to that rule that has toughest
requirements i.e rule with more antecedent (more attributes
)size
– Rule Ordering
• Class based
– Based on the priority of class
– Rule that gives the priority class is selected
• Rule based
– Based on priority list of rules
– Rule priority is checked based on accuracy, coverage or antecedent
Rule without class satisfying tuple X
• Default Rule: can be set up to specify a
default class
– May be the class in Majority
– Or the majority class of the tuples that were not
covered by any rule
Rule Extraction from a Decision Tree
Classification: Advanced Methods
Bayesian Belief Networks
• Bayesian Belief Network: it specifies joint
conditional probability distributions
– it provides a graphical model of causal
relationships
– It is defined by two components
• A directed acyclic graph
– Each arc represents a probabilistic dependence; if arc is drawn
from a node Y to a node Z, then Y is a parent or immediate
predecessor & Z is a descendant
• A set of conditional probability tables
Bayesian Belief Network -
Example
Bayesian Belief Network - Analysis
• In the diagram it shows that lung cancer
– is influenced by a person’s family history
– smoker or not
Classification by Backpropagation
• Backpropagation: is a neural network learning
algorithm
– Multilayer Feed-Forward Neural Network
• It iteratively learns a set of weights for prediction of the
class label of tuples
• It consists of an input layer, one or more hidden layers,
and an output layer
Multilayer Feed-Forward Neural
Network
Multilayer Feed-Forward Neural
Network with Weights
Net Input & Output Calculation
Error Backpropagation Calculation
Updated Weights & Biases Calculation
Backpropagation – Example (learning
rate is 0.9)
Net Input, Output & Backpropagated
Error Calculation
Updated Weights & Biases Values
Calculation (learning rate is 0.9)

Classification Methods in Data Mining
No ratings yet
Classification Methods in Data Mining
33 pages
CART Decision Trees and Greedy Approach
No ratings yet
CART Decision Trees and Greedy Approach
50 pages
Classification and Clustering Overview
No ratings yet
Classification and Clustering Overview
38 pages
Classification and Prediction Methods
No ratings yet
Classification and Prediction Methods
46 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
73 pages
Data Mining: Classification & Prediction
No ratings yet
Data Mining: Classification & Prediction
43 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
56 pages
Module 3 Classification Study Notes - MD
No ratings yet
Module 3 Classification Study Notes - MD
9 pages
Classification and Prediction Techniques
No ratings yet
Classification and Prediction Techniques
103 pages
Understanding Classification Methods
No ratings yet
Understanding Classification Methods
30 pages
Data Mining: Classification & Prediction Techniques
No ratings yet
Data Mining: Classification & Prediction Techniques
18 pages
Classification Algorithms Overview
No ratings yet
Classification Algorithms Overview
23 pages
Classification Techniques in Machine Learning
No ratings yet
Classification Techniques in Machine Learning
37 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
99 pages
Classification and Prediction Techniques
100% (1)
Classification and Prediction Techniques
37 pages
Data Mining: Classification & Prediction
No ratings yet
Data Mining: Classification & Prediction
16 pages
DWM - CH - 3
No ratings yet
DWM - CH - 3
51 pages
Classification and Prediction Techniques
No ratings yet
Classification and Prediction Techniques
98 pages
Data Mining: Classification Techniques
No ratings yet
Data Mining: Classification Techniques
40 pages
Data Mining Classification Techniques
No ratings yet
Data Mining Classification Techniques
24 pages
Classification Techniques in Data Mining
No ratings yet
Classification Techniques in Data Mining
53 pages
DDMW 2
No ratings yet
DDMW 2
14 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
88 pages
Data Mining: Classification & Prediction
No ratings yet
Data Mining: Classification & Prediction
25 pages
Classification: Key Concepts Overview
No ratings yet
Classification: Key Concepts Overview
35 pages
Classification Techniques in Machine Learning
No ratings yet
Classification Techniques in Machine Learning
78 pages
Classification and Prediction Methods
No ratings yet
Classification and Prediction Methods
28 pages
Decision Tree Induction in Machine Learning
No ratings yet
Decision Tree Induction in Machine Learning
52 pages
Advanced Classification Techniques in Big Data
No ratings yet
Advanced Classification Techniques in Big Data
34 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
80 pages
Data Mining Classification Techniques
No ratings yet
Data Mining Classification Techniques
61 pages
Classification Techniques in Data Mining
No ratings yet
Classification Techniques in Data Mining
41 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
98 pages
Section2 Data Mining
No ratings yet
Section2 Data Mining
47 pages
Understanding Classification Techniques
No ratings yet
Understanding Classification Techniques
86 pages
Data Mining: Classification & Prediction Techniques
No ratings yet
Data Mining: Classification & Prediction Techniques
21 pages
k-NN Label Prediction Sequence
No ratings yet
k-NN Label Prediction Sequence
25 pages
Classification and Prediction Techniques
No ratings yet
Classification and Prediction Techniques
21 pages
Predictive Modelling and Classification Techniques
No ratings yet
Predictive Modelling and Classification Techniques
17 pages
Understanding Classification Techniques
No ratings yet
Understanding Classification Techniques
20 pages
Data Mining: Classification and Prediction
No ratings yet
Data Mining: Classification and Prediction
75 pages
41 j48 Naive Bayes Weka
No ratings yet
41 j48 Naive Bayes Weka
5 pages
Overview of Classification Techniques
No ratings yet
Overview of Classification Techniques
43 pages
Decision Tree Algorithm for Classifying Computer Purchases
No ratings yet
Decision Tree Algorithm for Classifying Computer Purchases
159 pages
Data Mining Classification Techniques
No ratings yet
Data Mining Classification Techniques
12 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
43 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
45 pages
DMW 2
No ratings yet
DMW 2
25 pages
Classification and Prediction Techniques
No ratings yet
Classification and Prediction Techniques
70 pages
Data Mining Classification Techniques
No ratings yet
Data Mining Classification Techniques
44 pages
Classification vs. Prediction in DWM
No ratings yet
Classification vs. Prediction in DWM
12 pages
Unit2 Notes DM
No ratings yet
Unit2 Notes DM
7 pages
Classification Techniques Overview
No ratings yet
Classification Techniques Overview
71 pages
Classification vs. Prediction Explained
No ratings yet
Classification vs. Prediction Explained
41 pages
Classification Techniques in Data Mining
No ratings yet
Classification Techniques in Data Mining
141 pages
Classification (Chapter 8)
No ratings yet
Classification (Chapter 8)
78 pages
Understanding Classification in Machine Learning
No ratings yet
Understanding Classification in Machine Learning
61 pages
Gini Index and Decision Tree Classification
No ratings yet
Gini Index and Decision Tree Classification
55 pages
May June 2016 Paper 21 PDF
No ratings yet
May June 2016 Paper 21 PDF
4 pages
Ambo University Library System Proposal
100% (8)
Ambo University Library System Proposal
12 pages
Social Media Marketing in Gaming Tech
No ratings yet
Social Media Marketing in Gaming Tech
8 pages
Understanding Computer Operating Systems
No ratings yet
Understanding Computer Operating Systems
7 pages
MTA 98-364 Database Fundamentals Exam
No ratings yet
MTA 98-364 Database Fundamentals Exam
16 pages
ArcGIS Pro Basics for Urban Planning
No ratings yet
ArcGIS Pro Basics for Urban Planning
25 pages
SSB Sync
No ratings yet
SSB Sync
29 pages
Case Scenarios Booklet May'26 CA Final Audit Ankush Chirimar Classes
No ratings yet
Case Scenarios Booklet May'26 CA Final Audit Ankush Chirimar Classes
313 pages
Zybio Inc. Product Overview and Vision
100% (1)
Zybio Inc. Product Overview and Vision
30 pages
Qualcomm Snapdragon 662 Mobile Platform Product Brief
No ratings yet
Qualcomm Snapdragon 662 Mobile Platform Product Brief
2 pages
Class10 Computer Internet Basics Complete
No ratings yet
Class10 Computer Internet Basics Complete
10 pages
OCI Foundations Exam 1z0-1085-20 Guide
75% (4)
OCI Foundations Exam 1z0-1085-20 Guide
16 pages
Phaser 7760 Firmware Update Guide
No ratings yet
Phaser 7760 Firmware Update Guide
4 pages
Java Thread Constructor Overview
No ratings yet
Java Thread Constructor Overview
3 pages
Dualband XXpol Antenna Datasheet
No ratings yet
Dualband XXpol Antenna Datasheet
3 pages
NKB800 Network Keyboard Controller Specs
No ratings yet
NKB800 Network Keyboard Controller Specs
1 page
Optimized Adaptive FIR Filter Design
No ratings yet
Optimized Adaptive FIR Filter Design
14 pages
4-DOF Autonomous Robotic Arm Design
No ratings yet
4-DOF Autonomous Robotic Arm Design
7 pages
Material Handling Case Study Overview
No ratings yet
Material Handling Case Study Overview
17 pages
Besant Technologies Placement Guide
100% (1)
Besant Technologies Placement Guide
2 pages
TalentLMS Presentation
No ratings yet
TalentLMS Presentation
12 pages
Automated Vehicle-Activated Street Lights
No ratings yet
Automated Vehicle-Activated Street Lights
9 pages
Final Perspective Plate Submission
No ratings yet
Final Perspective Plate Submission
3 pages
Animiz Software User Guide
No ratings yet
Animiz Software User Guide
42 pages
Raspberry Pi Audio Receiver Setup
No ratings yet
Raspberry Pi Audio Receiver Setup
15 pages
MySQL and MariaDB Error Solutions
No ratings yet
MySQL and MariaDB Error Solutions
15 pages
Ultra-Wideband Technology Overview
No ratings yet
Ultra-Wideband Technology Overview
20 pages
Understanding Atomic Sentences in FOL
No ratings yet
Understanding Atomic Sentences in FOL
22 pages
Peta DAS Kali Cilacap dan Data Sungai
No ratings yet
Peta DAS Kali Cilacap dan Data Sungai
1 page
67477009-V12 Front Office Setup Guide - Feb 2024-Unlocked
No ratings yet
67477009-V12 Front Office Setup Guide - Feb 2024-Unlocked
93 pages

Classification and Prediction Techniques

Uploaded by

Classification and Prediction Techniques

Uploaded by

Classification

• Classification : is a form of data analysis that

– Numeric prediction: model constructed predicts a

• we had three possible values of Outlook: Sunny,

You might also like