0% found this document useful (0 votes)

9 views13 pages

Diabetes Prediction with Machine Learning

The document outlines a project aimed at developing a machine learning model to predict diabetes early using non-invasive data inputs, addressing gaps in current diagnostic methods. It details the methodology, including data preprocessing, model training, and evaluation using various algorithms, as well as challenges faced and future scope for improvement. The project utilizes the PIMA Indians Diabetes dataset and employs tools like Python, Scikit-learn, and various machine learning models to achieve its objectives.

Uploaded by

shashwatadatta5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views13 pages

Diabetes Prediction with Machine Learning

Uploaded by

shashwatadatta5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Diabetes Prediction

Using Machine
03

Learning
01
AI-Mini-5
Individual contributions

Shashwata Suraj Munshi

01 02
Datta(LEADER) Project Report , Coder
Coder , Project Report

Tridib Mondal
Ankit Dutta: 04
03 Project Report , Coder
Power Point Designer

05
Sukreet Biswas
Power Point Designer
& Data collection

02
Problem Statement
The Challenge:
01
Diabetes is a chronic illness affecting millions
globally, often remaining undetected until
severe complications arise.

Current Gaps:
02
Traditional diagnostic methods can be time-
consuming and invasive.
Lack of accessible tools for early detection,
especially in underserved areas.

Our Aim:
03
To bridge this gap by developing a machine
learning model that predicts the likelihood of
diabetes early, using non-invasive data inputs.

03
Objectives:
Primary Goal:
01
Develop a machine learning-based model for early and
accurate prediction of diabetes.

Specific Objectives:
02
Utilize available datasets to train and test the model for high
accuracy.
Optimize the model for speed and reliability in predictions.
Create a user-friendly framework for real-world applications.

03
Impact:
Enable proactive healthcare interventions and reduce the burden
of diabetes-related complications.

04
Methodology / System Design
Used the PIMA Indians Diabetes dataset containing features like glucose,
BMI, age, insulin level, etc.

Data Preprocessing: Train-Test Split:

01 02
Standardized the features using Used train_test_split to
StandardScaler to bring them to divide the dataset into
a common scale. training and test sets.
Split the data into features (X)
and labels (Y).

Model Training: Model Evaluation:

03 04
Evaluated using accuracy
Used Support Vector Machine score on both training and
(SVM) classifier from sklearn. test data.

Prediction System:
05
Created a predictive
function to classify new
data points (likely in later
notebook cells).
05
Tools & Technologies Used
01 Programming Environment
Language: Python – Versatile and widely used for machine learning tasks.
Development Tools:
Jupyter Notebook: For interactive coding and data visualization.
Google Colab: For cloud-based development and leveraging GPU/TPU
support.

02 Data Resources
Dataset:
Kaggle’s Diabetes Dataset with 2000 records and 9 features for predicting
diabetic outcomes.
Data Preprocessing:
Feature scaling, normalization, and train-test splitting using Scikit-learn’s
utilities.
Ensemble & Optimization Techniques
Ensemble Methods:
Random Forest and AdaBoost for better generalization and improved
accuracy.
06
03 Libraries & Frameworks

Data Handling & Preprocessing

NumPy: For numerical operations and visualizations like
SVM decision boundaries.
Pandas: Managing datasets and creating DataFrames.
Scikit-learn (StandardScaler): Standardizing and scaling
feature data.
Visualization
Matplotlib: Core plotting library for graphs, ROC curves,
and visualizations.
Seaborn: Statistical plots, including bar charts for
feature importance and accuracy.
Model Training & Implementation
Logistic Regression, SVM, KNN, Naive Bayes, Decision
Tree, Random Forest, AdaBoost: Machine learning
models used for classification tasks.
Evaluation Metrics
Scikit-learn Metrics: Accuracy, classification reports, and
ROC/AUC for performance evaluation.

07
Results or Demo
Model Performance Metrics:

Algorithms Training Accuracy Test Accuracy

Logistic Regression 78.50% 75.97%

K-Nearest Neighours 82.90% 72.08%

SVM 82.90% 72.73%

Navive Bayes 75.57% 77.27%

Decision Tree 100.00% 70.78%

Random Forest 100.00% 75.97%

AdaBoost 80.46% 72.73%

08
Feature Importance:

Features like Glucose Level, BMI, and Age have significant importance
in prediction (based on Random Forest feature importance plot).
09
Visual Representations:

Feature Importance Plot:

Demonstrates the weight of each
feature in prediction.
ROC Curve: Showcases the True
Positive Rate vs. False Positive
Rate across different thresholds.
Confusion Matrix: Highlights the
distribution of true positives, true
negatives, false positives, and
false negatives.

10
Challenges Faced
Data Challenges: Resource Limitations:
01 03
Incomplete or inconsistent data Limited computational power for
in the dataset. training large models.
Imbalanced dataset, leading to Challenges in deploying the
biased predictions. model for real-world usage.

Model Challenges: Interpretability:

02 03
Difficulty in selecting the optimal
Ensuring the model's predictions
algorithm for the problem.
are understandable to non-
Balancing overfitting and
technical stakeholders.
underfitting during training.

11
Future Scope:
Enhancing Model Accuracy:
01
Incorporate larger and more diverse
datasets to improve generalization.
Explore advanced techniques like deep
learning for better prediction
performance.

Real-Time Predictions:
02
Integrate real-time data inputs from
wearable devices or IoT sensors.

Broader Health Insights:

03
Extend the model to predict related
conditions like hypertension or
cardiovascular risks.

Collaboration:
04
Work with healthcare professionals to
refine the system for clinical
applications.

12
References
Debadri Dutta, Debpriyo Paul, Tejas N. Joshi, Prof. Pramila M. Chawan,
01 04 "Diabetes Prediction Using Machine
Parthajeet Ghosh, "Analyzing Feature
Importance’s for Diabetes Prediction Learning Techniques".Int. Journal of
using Machine Learning". IEEE, pp 942- Engineering Research and Application,
928, 2018. Vol. 8, Issue 1, (Part -II) January 2018,
pp.-09-13
[Link], [Link], [Link],
02 Nonso Nnamoko, Abir Hussain, David
[Link] Caroline, "Random Forest 05 England, "Predicting Diabetes Onset: An
Algorithm for the Prediction of
Ensemble Supervised Learning Approach
Diabetes ". Proceeding of International
". IEEE Congress on Evolutionary
Conference on Systems Computation
Computation (CEC), 2018.
Automation and Networking, 2019.

Deeraj Shetty, Kishor Rit, Sohail Shaikh,

Nahla B., Andrew et al, "Intelligible 06
03 Nikita Patil, "Diabetes Disease
support vector machines for diagnosis
Prediction Using Data Mining ".
of diabetes mellitus. Information
International Conference on
Technology in Biomedicine", IEEE
Innovations in Information, Embedded
Transactions. 14, (July. 2010), 1114-20.
and Communication Systems (ICIIECS),
2017.

Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
13 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
15 pages
Diabetes Diagnosis with Machine Learning
No ratings yet
Diabetes Diagnosis with Machine Learning
7 pages
Ultra Professional Diabetes ML Project Report-1
No ratings yet
Ultra Professional Diabetes ML Project Report-1
5 pages
ML Techniques for Diabetes Prediction
No ratings yet
ML Techniques for Diabetes Prediction
10 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
15 pages
Diabetes Prediction System Using ML
No ratings yet
Diabetes Prediction System Using ML
6 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
44 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
19 pages
Diabetes Risk Prediction with AI
No ratings yet
Diabetes Risk Prediction with AI
14 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
9 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
52 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
19 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
11 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
21 pages
Diabetic Risk Estimation Using SVM
No ratings yet
Diabetic Risk Estimation Using SVM
26 pages
Synopsis
No ratings yet
Synopsis
4 pages
Smart Diabetes Prediction with ML Algorithms
No ratings yet
Smart Diabetes Prediction with ML Algorithms
5 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
8 pages
Sample Project Report
No ratings yet
Sample Project Report
70 pages
Diabetes Prediction with ML Techniques
No ratings yet
Diabetes Prediction with ML Techniques
13 pages
AI Diabetes Prediction System Report
No ratings yet
AI Diabetes Prediction System Report
27 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
7 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
13 pages
Diabetes Prediction Using ML Techniques
No ratings yet
Diabetes Prediction Using ML Techniques
18 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
4 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
24 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
4 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
8 pages
BAD786 Synopsis A12
No ratings yet
BAD786 Synopsis A12
9 pages
Diabetes Prediction Model Using ML
No ratings yet
Diabetes Prediction Model Using ML
31 pages
Final PPT Diabetes Prediction System
No ratings yet
Final PPT Diabetes Prediction System
23 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
3 pages
Machine Learning for Diabetes Prediction
No ratings yet
Machine Learning for Diabetes Prediction
13 pages
Diabetes Prediction Model Overview
100% (1)
Diabetes Prediction Model Overview
23 pages
Diabetes Prediction via Machine Learning
No ratings yet
Diabetes Prediction via Machine Learning
82 pages
Machine Learning for Diabetes Detection
No ratings yet
Machine Learning for Diabetes Detection
5 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
10 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
4 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
29 pages
Diabetes Onset Prediction with ML
No ratings yet
Diabetes Onset Prediction with ML
4 pages
Machine Learning for Diabetes Detection
No ratings yet
Machine Learning for Diabetes Detection
45 pages
Machine Learning for Early Diabetes Detection
No ratings yet
Machine Learning for Early Diabetes Detection
26 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
43 pages
Diabetes PPT
100% (1)
Diabetes PPT
9 pages
AI-Driven Diabetes Prediction Project
No ratings yet
AI-Driven Diabetes Prediction Project
15 pages
Ca2 Marketting
No ratings yet
Ca2 Marketting
5 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
13 pages
Diabetes Risk Prediction with MLP
No ratings yet
Diabetes Risk Prediction with MLP
128 pages
Diabetes Report
No ratings yet
Diabetes Report
22 pages
Diabetes Prediction Using ML Techniques
No ratings yet
Diabetes Prediction Using ML Techniques
14 pages
Diabetes Prediction with Naïve Bayes Model
No ratings yet
Diabetes Prediction with Naïve Bayes Model
20 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
17 pages
Diabetes Risk Prediction Using AI
No ratings yet
Diabetes Risk Prediction Using AI
5 pages
Diabetes Prediction Machine Learning 50 Page Report
No ratings yet
Diabetes Prediction Machine Learning 50 Page Report
77 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
33 pages
Diabetes Prediction Model by Esha Babber
No ratings yet
Diabetes Prediction Model by Esha Babber
29 pages
Diabetes Prediction with Machine Learning
No ratings yet
Diabetes Prediction with Machine Learning
5 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
19 pages
Finishing Faults in Garment Production
100% (1)
Finishing Faults in Garment Production
58 pages
Forcible Entry Tools in Fire Emergencies
No ratings yet
Forcible Entry Tools in Fire Emergencies
17 pages
05 1111 02 RP AFP tcm143-654867
0% (2)
05 1111 02 RP AFP tcm143-654867
8 pages
Outdoor Disconnectors for Substations
No ratings yet
Outdoor Disconnectors for Substations
12 pages
Manual de Partes Motor z225
No ratings yet
Manual de Partes Motor z225
16 pages
High-Yield Topics for UPSC EPFO/APFC Exam
No ratings yet
High-Yield Topics for UPSC EPFO/APFC Exam
3 pages
Joint Operations Profit and Settlements
No ratings yet
Joint Operations Profit and Settlements
6 pages
Contractions, Pronouns, and Adverbs Practice
50% (2)
Contractions, Pronouns, and Adverbs Practice
15 pages
DOLE Annual Medical Report Form
No ratings yet
DOLE Annual Medical Report Form
6 pages
Proline T-Mass 65 Operating Instructions
No ratings yet
Proline T-Mass 65 Operating Instructions
20 pages
Iest-Rp-Cc001,5 Hepa and Ulpa Filters PDF
100% (4)
Iest-Rp-Cc001,5 Hepa and Ulpa Filters PDF
33 pages
Wheat Breeding Innovations in South Asia
No ratings yet
Wheat Breeding Innovations in South Asia
18 pages
Culturally Responsive Teaching Strategies
No ratings yet
Culturally Responsive Teaching Strategies
3 pages
Human Reproductive System Overview
No ratings yet
Human Reproductive System Overview
12 pages
Year 1 Phase 4 Spelling List
No ratings yet
Year 1 Phase 4 Spelling List
1 page
Analysis of Animal Farm and Othello
100% (1)
Analysis of Animal Farm and Othello
4 pages
Math Problems for Students: Winter 1993
No ratings yet
Math Problems for Students: Winter 1993
2 pages
Machine Learning vs Deep Learning Explained
No ratings yet
Machine Learning vs Deep Learning Explained
5 pages
Trigonometry Problems and Solutions
No ratings yet
Trigonometry Problems and Solutions
2 pages
ሸገረ የተገኙ የተመዘገቡ ሰዎች
No ratings yet
ሸገረ የተገኙ የተመዘገቡ ሰዎች
8 pages
Business Laws I Exam Paper Guide
No ratings yet
Business Laws I Exam Paper Guide
2 pages
Lintel Beam Design and Details
No ratings yet
Lintel Beam Design and Details
1 page
Simultaneous Equations in Econometrics
No ratings yet
Simultaneous Equations in Econometrics
52 pages
Database Management Systems Syllabus
No ratings yet
Database Management Systems Syllabus
13 pages
Engr 190w
No ratings yet
Engr 190w
2 pages
Electronic Reservation Slip for Train Travel
No ratings yet
Electronic Reservation Slip for Train Travel
3 pages
Accounting Principles and Practices Overview
No ratings yet
Accounting Principles and Practices Overview
20 pages
From Art Nouveau To Surrealism Belgian Modernity in The Making (Nathalie Aubert, Pierre-Philippe Fraiture Etc.) (Z-Library)
100% (1)
From Art Nouveau To Surrealism Belgian Modernity in The Making (Nathalie Aubert, Pierre-Philippe Fraiture Etc.) (Z-Library)
218 pages
Sheltech Ceramics Inventory Structure
No ratings yet
Sheltech Ceramics Inventory Structure
1 page
Enhancing Memory with Mnemonics in Education
No ratings yet
Enhancing Memory with Mnemonics in Education
5 pages

Diabetes Prediction with Machine Learning

Uploaded by

Diabetes Prediction with Machine Learning

Uploaded by

Diabetes Prediction

Shashwata Suraj Munshi

Data Preprocessing: Train-Test Split:

Model Training: Model Evaluation:

Data Handling & Preprocessing

Algorithms Training Accuracy Test Accuracy

Logistic Regression 78.50% 75.97%

K-Nearest Neighours 82.90% 72.08%

SVM 82.90% 72.73%

Navive Bayes 75.57% 77.27%

Decision Tree 100.00% 70.78%

Random Forest 100.00% 75.97%

AdaBoost 80.46% 72.73%

Feature Importance Plot:

Model Challenges: Interpretability:

Broader Health Insights:

Deeraj Shetty, Kishor Rit, Sohail Shaikh,

You might also like