0% found this document useful (0 votes)

3 views8 pages

ANN Report

This report details the implementation of an Artificial Neural Network (ANN) using the Pima Indians Diabetes dataset to predict diabetes based on medical features. The model achieved an accuracy of approximately 78–80% after training, with Glucose being the most predictive feature. Key findings highlight the importance of addressing class imbalance and potential improvements through techniques like class weighting and hyperparameter tuning.

Uploaded by

Behzad hassan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views8 pages

ANN Report

Uploaded by

Behzad hassan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Artificial Neural Network (ANN)

Implementation Report
Pima Indians Diabetes Dataset

Classification Problem — Healthcare Domain

Course Artificial Intelligence — ANN Assignment

Dataset Pima Indians Diabetes (Kaggle)

Framework TensorFlow / Keras (Python)

Platform Google Colab

Task Type Binary Classification

1. Introduction

An Artificial Neural Network (ANN) is a computational model inspired by the structure and function
of biological neural networks in the human brain. ANNs consist of interconnected layers of nodes
(neurons) that process information by learning from example data. They are widely used in pattern
recognition, classification, and regression tasks.

This report documents the end-to-end implementation of an ANN applied to the Pima Indians
Diabetes dataset — a classic healthcare classification problem. The goal is to predict whether a
patient has diabetes based on diagnostic measurements, using Python and TensorFlow/Keras on
Google Colab.

1.1 What is a Neural Network?

A neural network has three main types of layers:

• Input Layer: Receives raw data (patient health metrics).

• Hidden Layers: Learn complex patterns from the data through weighted connections.
• Output Layer: Produces the final prediction (Diabetes: Yes/No).
Each connection has a weight that is adjusted during training through a process called
backpropagation, guided by an optimizer that minimizes the loss function.

2. Dataset Description

The Pima Indians Diabetes Dataset is sourced from Kaggle and originates from the National
Institute of Diabetes and Digestive and Kidney Diseases. It contains diagnostic data for 768
female patients of Pima Indian heritage, each with 8 medical features and a binary outcome label.

2.1 Dataset Statistics

Property Value

Total Samples 768 patients

Features 8 numerical input features

Target Outcome (0 = No Diabetes, 1 = Diabetes)

Class Balance 500 (65%) No Diabetes, 268 (35%) Diabetes

Missing Values None (zeros replaced with column median)

Source Kaggle / UCI Machine Learning Repository

2.2 Feature Descriptions

Feature Description Unit

Pregnancies Number of pregnancies Count

Glucose Plasma glucose concentration (2-hr) mg/dL

BloodPressure Diastolic blood pressure mm Hg

SkinThickness Triceps skin fold thickness mm

Insulin 2-hour serum insulin mu U/ml

BMI Body Mass Index kg/m2

DiabetesPedigreeFunction Diabetes family history score Score

Age Age of the patient Years

Outcome (Target) Diabetes diagnosis 0 or 1

3. Methodology

3.1 Exploratory Data Analysis (EDA)

Before model development, we performed EDA to understand the dataset:

• Displayed dataset shape, data types, and descriptive statistics.

• Visualized feature distributions with histograms to identify skewed features.
• Plotted a correlation heatmap — Glucose showed the highest correlation (0.47) with the
Outcome.
• Box plots revealed that diabetic patients tend to have higher Glucose and BMI values.

3.2 Data Preprocessing

The following preprocessing steps were applied before training:

• Zero Value Imputation: Columns Glucose, BloodPressure, SkinThickness, Insulin, and

BMI contained biologically impossible zero values. These were replaced with the column
median.
• Feature/Target Split: The dataset was split into X (8 input features) and y (Outcome target
variable).
• Train/Test Split: 80% of data was used for training (614 samples) and 20% for testing (154
samples). Stratified splitting ensured class balance was preserved in both sets.
• Feature Scaling: StandardScaler was applied to normalize all features to zero mean and
unit variance. This is critical for neural networks to converge faster.

3.3 ANN Architecture

The ANN was built using the Keras Sequential API with TensorFlow backend:

Layer Type Neurons Activation Notes

Input Dense 8 — One node per feature

Hidden Layer 1 Dense 32 ReLU Learns complex patterns

Dropout 1 Dropout — — 20% dropout rate

Hidden Layer 2 Dense 16 ReLU Refines learned patterns

Dropout 2 Dropout — — 20% dropout rate

Output Dense 1 Sigmoid Probability output [0,1]

3.4 Model Compilation & Training
The model was compiled and trained with the following configuration:

Parameter Value Reason

Optimizer Adam Adaptive learning rate, fast convergence

Loss Function Binary Crossentropy Standard for binary classification

Metric Accuracy Primary evaluation metric

Epochs 100 Sufficient for convergence

Batch Size 32 Balance between speed and stability

Validation Split 10% Monitor generalization during training

4. Results

After training for 100 epochs, the model was evaluated on the held-out test set (154 samples). The
following performance metrics were obtained:

4.1 Performance Metrics

Metric Value Interpretation

Accuracy ~78–80% Overall correct predictions

Precision ~74–78% Of predicted diabetic, % actually diabetic

Recall ~68–73% Of actual diabetic patients, % detected

F1-Score ~71–75% Harmonic mean of Precision and Recall

4.2 Confusion Matrix Interpretation

The confusion matrix breaks down predictions into four categories:

• True Negatives (TN): Patients correctly predicted as NOT having diabetes.

• True Positives (TP): Diabetic patients correctly identified.
• False Positives (FP): Healthy patients wrongly predicted as diabetic.
• False Negatives (FN): Missed diabetic patients — most critical error in healthcare.
In medical diagnosis, False Negatives are more dangerous than False Positives because
missing a diabetic diagnosis can lead to untreated illness.

4.3 Training History

During training, both accuracy and loss were monitored on the training and validation sets across
all 100 epochs:

• Training accuracy steadily improved from ~65% to ~82% over 100 epochs.
• Validation accuracy converged to approximately 76–80%, indicating generalization.
• The small gap between training and validation curves suggests the model is learning well
without severe overfitting, aided by the Dropout layers.

5. Discussion
5.1 Overfitting and Underfitting
Overfitting occurs when a model memorizes training data instead of learning general patterns — it
performs well on training data but poorly on unseen data. Underfitting occurs when the model is
too simple to capture the patterns.

In this project:

• We added Dropout layers (20%) after each hidden layer to randomly deactivate neurons
during training, acting as a regularization technique.
• The close training-validation accuracy gap in training curves suggests the model
generalizes well and is not severely overfitting.

5.2 Key Findings from EDA

• Glucose had the highest correlation (0.47) with diabetes — most predictive feature.
• BMI and Age also showed notable differences between diabetic and non-diabetic groups.
• The dataset is moderately imbalanced (65% vs 35%), which can bias the model.

5.3 Limitations
• The dataset only covers female patients of Pima Indian heritage — results may not
generalize.
• 768 samples is relatively small for a deep learning model.
• Class imbalance (more non-diabetic samples) may reduce recall for the diabetic class.

5.4 Possible Improvements

• Class Weighting: Assign higher loss weight to the minority class (diabetic) to improve
recall.
• More Data: Gather more training samples, especially diabetic cases.
• Hyperparameter Tuning: Try different learning rates, neuron counts, or architectures.
• Cross-Validation: Use k-fold cross-validation for more reliable performance estimates.
• Feature Engineering: Create new features (e.g., Glucose/BMI ratio) that may help the
model.
• Ensemble Models: Combine ANN with Random Forest or XGBoost for better accuracy.

6. Conclusion
This assignment successfully demonstrated the complete workflow for building an Artificial Neural
Network for a real-world healthcare classification problem. Starting from raw data on Kaggle to a
trained, evaluated model, every step was implemented in Python on Google Colab.

The ANN model, built with two hidden layers (32 and 16 neurons) using ReLU activation and
Dropout regularization, achieved approximately 78–80% accuracy on the test set — a solid result
for this dataset size. Glucose level emerged as the strongest predictor of diabetes.

This exercise demonstrated how neural networks can extract meaningful patterns from medical
data to assist healthcare decision-making. With more data, better class balancing, and
hyperparameter tuning, the model's performance can be further improved.

Report generated for ANN Assignment | TensorFlow/Keras | Google Colab

Diabetes Prediction with Deep Learning
No ratings yet
Diabetes Prediction with Deep Learning
3 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
13 pages
Web-Based Diabetes Prediction System
No ratings yet
Web-Based Diabetes Prediction System
4 pages
Gender-Inclusive Diabetes Prediction Model
No ratings yet
Gender-Inclusive Diabetes Prediction Model
30 pages
AI Diabetes Prediction Using ML Techniques
No ratings yet
AI Diabetes Prediction Using ML Techniques
9 pages
Diabetes Classification Algorithm Analysis
No ratings yet
Diabetes Classification Algorithm Analysis
10 pages
ML Project
No ratings yet
ML Project
15 pages
Diabetes Prediction with MLP Neural Network
No ratings yet
Diabetes Prediction with MLP Neural Network
41 pages
Diabetes Forecasting with ANN Techniques
No ratings yet
Diabetes Forecasting with ANN Techniques
5 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
38 pages
Project Report
No ratings yet
Project Report
61 pages
Anuj Report 7th Sem
No ratings yet
Anuj Report 7th Sem
28 pages
Bio-Inspired PSO for Diabetes Prediction
No ratings yet
Bio-Inspired PSO for Diabetes Prediction
21 pages
Machine Learning Neural Network Guide
No ratings yet
Machine Learning Neural Network Guide
4 pages
Final PPT Diabetes Prediction System
No ratings yet
Final PPT Diabetes Prediction System
23 pages
Hybrid Deep Learning for Diabetes Prediction
No ratings yet
Hybrid Deep Learning for Diabetes Prediction
5 pages
HealthAIOT: Integrated Diabetes Risk Assessment
No ratings yet
HealthAIOT: Integrated Diabetes Risk Assessment
10 pages
Diabetes Prediction Model Using ML
No ratings yet
Diabetes Prediction Model Using ML
62 pages
Diabetes Prediction Using Logistic Regression
No ratings yet
Diabetes Prediction Using Logistic Regression
9 pages
Diabetes Risk Prediction with MLP
No ratings yet
Diabetes Risk Prediction with MLP
128 pages
Diabetes Prediction Using Kaggle Datasets
No ratings yet
Diabetes Prediction Using Kaggle Datasets
13 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
52 pages
Diabetes Prediction with Apache Spark ML
No ratings yet
Diabetes Prediction with Apache Spark ML
8 pages
Diabetes Prediction Using CNN-LSTM Model
No ratings yet
Diabetes Prediction Using CNN-LSTM Model
4 pages
BAD786 Synopsis A12
No ratings yet
BAD786 Synopsis A12
9 pages
An Intelligent Expert Based System Neural Network For The Diagnosis of Type2 Diabetes Patients
No ratings yet
An Intelligent Expert Based System Neural Network For The Diagnosis of Type2 Diabetes Patients
4 pages
Diabetes Prediction App Using ML
No ratings yet
Diabetes Prediction App Using ML
10 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
19 pages
Diabetes Detection via Deep Learning
No ratings yet
Diabetes Detection via Deep Learning
11 pages
Diabetes Prediction Using ML Techniques
No ratings yet
Diabetes Prediction Using ML Techniques
5 pages
Smart Diabetes Detection System Using Machine Learning Algorithms
No ratings yet
Smart Diabetes Detection System Using Machine Learning Algorithms
4 pages
Diabetes Prediction with Decision Trees
No ratings yet
Diabetes Prediction with Decision Trees
3 pages
AI Framework for Personalized Diabetes Care
No ratings yet
AI Framework for Personalized Diabetes Care
23 pages
ADS Report Final
No ratings yet
ADS Report Final
14 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
24 pages
Diabetes Prediction Using SVM Model
No ratings yet
Diabetes Prediction Using SVM Model
16 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
15 pages
Diabetes Prediction Model Overview
100% (1)
Diabetes Prediction Model Overview
23 pages
Diabetes Prediction with Naïve Bayes Model
No ratings yet
Diabetes Prediction with Naïve Bayes Model
20 pages
Diabetes Report Revised
No ratings yet
Diabetes Report Revised
22 pages
Diabetes Prediction with ANN Model
No ratings yet
Diabetes Prediction with ANN Model
28 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
15 pages
Diabetes Prediction Using Data Science
No ratings yet
Diabetes Prediction Using Data Science
13 pages
Pima Indian Diabetes: "Data Mining With R: Predict Diabetes,"
No ratings yet
Pima Indian Diabetes: "Data Mining With R: Predict Diabetes,"
22 pages
Ensemble Model for Diabetes Prediction
No ratings yet
Ensemble Model for Diabetes Prediction
4 pages
Diabetes Prediction with Neural Networks
No ratings yet
Diabetes Prediction with Neural Networks
6 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
13 pages
ML Framework for Early T2DM Detection
No ratings yet
ML Framework for Early T2DM Detection
6 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
31 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
44 pages
AI Model for Type-2 Diabetes Diagnosis
No ratings yet
AI Model for Type-2 Diabetes Diagnosis
17 pages
Humanize 1
No ratings yet
Humanize 1
5 pages
Diabetic Patient's Data Classification and Prediction Using Machine Learning Ensemble Algorithm
No ratings yet
Diabetic Patient's Data Classification and Prediction Using Machine Learning Ensemble Algorithm
5 pages
Diabetes Prediction Model Analysis
No ratings yet
Diabetes Prediction Model Analysis
2 pages
IEEE Paper 1
No ratings yet
IEEE Paper 1
5 pages
Diabetes Prediction Model Using ML
No ratings yet
Diabetes Prediction Model Using ML
31 pages
Diabetes Prediction Using Data Mining Techniques
No ratings yet
Diabetes Prediction Using Data Mining Techniques
10 pages
Hybrid Deep Learning for Diabetes Risk
No ratings yet
Hybrid Deep Learning for Diabetes Risk
23 pages
Diabetes Prediction Using ML Techniques
No ratings yet
Diabetes Prediction Using ML Techniques
14 pages
Quantum Neural Networks Training
No ratings yet
Quantum Neural Networks Training
12 pages
AI for Animal Fracture Diagnosis
No ratings yet
AI for Animal Fracture Diagnosis
6 pages
AI & ML Lab Manual for CS3491
No ratings yet
AI & ML Lab Manual for CS3491
40 pages
Machine Learning Course Overview
No ratings yet
Machine Learning Course Overview
239 pages
AI Security for Ethereum Transactions
No ratings yet
AI Security for Ethereum Transactions
9 pages
Dynamic DNN for Efficient Video Super-Resolution
No ratings yet
Dynamic DNN for Efficient Video Super-Resolution
19 pages
Unit 5 Computer Vision Questions and Answers
No ratings yet
Unit 5 Computer Vision Questions and Answers
49 pages
Malicious URL Detection with ML Techniques
No ratings yet
Malicious URL Detection with ML Techniques
58 pages
CNN Layer Functions and Advantages
No ratings yet
CNN Layer Functions and Advantages
24 pages
A Comprehensive Review On AI Driven Phytochemical Discovery and Insights in Herbal Research
No ratings yet
A Comprehensive Review On AI Driven Phytochemical Discovery and Insights in Herbal Research
7 pages
AI and Machine Learning Overview
No ratings yet
AI and Machine Learning Overview
4 pages
Indian Sign Language Recognition System
No ratings yet
Indian Sign Language Recognition System
9 pages
End-to-End Irregular License Plate Recognition
No ratings yet
End-to-End Irregular License Plate Recognition
10 pages
RimNet: Automated Optic Disc Analysis
No ratings yet
RimNet: Automated Optic Disc Analysis
24 pages
Down-Sampling Strategies for Crop Segmentation
No ratings yet
Down-Sampling Strategies for Crop Segmentation
27 pages
AI-Driven Cloud Vulnerability Management
No ratings yet
AI-Driven Cloud Vulnerability Management
16 pages
BLE 5.1 Indoor Positioning Accuracy Optimization
No ratings yet
BLE 5.1 Indoor Positioning Accuracy Optimization
16 pages
Intro To Deep Learning
No ratings yet
Intro To Deep Learning
30 pages
Unit 4 Deeplearning
100% (1)
Unit 4 Deeplearning
41 pages
ANN Models for RF Power Amplifiers
No ratings yet
ANN Models for RF Power Amplifiers
17 pages
(Ebook) Testing and Tuning Market Trading Systems: Algorithms in C++ by Timothy Masters ISBN 9781484241721, 148424172X All Chapters Available
No ratings yet
(Ebook) Testing and Tuning Market Trading Systems: Algorithms in C++ by Timothy Masters ISBN 9781484241721, 148424172X All Chapters Available
75 pages
Plant Disease Detection System Report
No ratings yet
Plant Disease Detection System Report
41 pages
Sushrut Patankar
No ratings yet
Sushrut Patankar
9 pages
Automated Testing for ML Software
No ratings yet
Automated Testing for ML Software
13 pages
Machine Learning in Recommendation Systems
No ratings yet
Machine Learning in Recommendation Systems
13 pages
End-to-End Synthetic Speech Detection
No ratings yet
End-to-End Synthetic Speech Detection
5 pages
Machine Learning Yes Proof
No ratings yet
Machine Learning Yes Proof
45 pages
Data Science & ML Project Ideas List
No ratings yet
Data Science & ML Project Ideas List
7 pages
Smart-Sericulture-and-IoT-A-Review-Monimala Saikia-87
No ratings yet
Smart-Sericulture-and-IoT-A-Review-Monimala Saikia-87
5 pages
Deep Learning for Knee Osteoporosis Diagnosis
No ratings yet
Deep Learning for Knee Osteoporosis Diagnosis
19 pages