ML-Based Auto-Scaling for Kubernetes

The project focuses on developing an intelligent resource auto-scaling system for Kubernetes using machine learning to predict future resource utilization and dynamically adjust pods. It addresses the limitations of traditional auto-scaling methods by implementing a predictive model integrated with Kubernetes APIs, aiming for improved performance and cost efficiency. The project includes real-time monitoring, a decision engine, and a visualization layer, with potential future enhancements such as reinforcement learning and multi-cloud orchestration.

Uploaded by

ramsai

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views2 pages

ML-Based Auto-Scaling for Kubernetes

Uploaded by

ramsai

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Intelligent Resource Auto-Scaling in Kubernetes

using Machine Learning

[Link] Final Major Project Synopsis

Title: Intelligent Resource Auto-Scaling in Kubernetes using Machine Learning

1. Abstract In modern cloud-native environments, applications experience highly dynamic

workloads that demand efficient resource management. Traditional Kubernetes auto-scaling
methods such as Horizontal Pod Autoscaler (HPA) rely on static threshold-based rules that may
lead to over-provisioning or performance degradation. This project aims to develop an intelligent
auto-scaling system that leverages machine learning (ML) to predict future resource utilization
(CPU, memory, network) and dynamically adjust Kubernetes pods based on real-time and historical
data. By integrating ML models with Kubernetes APIs, this system ensures cost efficiency,
performance optimization, and reliability for containerized applications. The project demonstrates
how AI-driven automation can enhance scalability and operational efficiency in cloud computing
environments.

2. Problem Statement Current Kubernetes auto-scaling mechanisms operate reactively — scaling

resources only after performance metrics cross certain thresholds. This reactive approach often
leads to high latency during traffic surges, wasted resources during idle times, and lack of predictive
intelligence for workload forecasting. Hence, there is a need for a predictive auto-scaling
mechanism that learns workload patterns and proactively scales resources to maintain optimal
system performance.

3. Objectives 1. To design and implement a machine learning-based predictive model for workload
forecasting. 2. To integrate this model with Kubernetes Horizontal Pod Autoscaler (HPA) for
intelligent scaling decisions. 3. To develop a real-time monitoring and data collection system using
Prometheus and Grafana. 4. To compare the proposed ML-based auto-scaler with the default
Kubernetes HPA on performance and cost efficiency. 5. To demonstrate an end-to-end CI/CD
pipeline automating deployment and scaling decisions.

4. Proposed System Architecture Architecture Components: - Data Collector: Gathers live metrics
(CPU, RAM, request rate) from Prometheus. - Predictive Model: Uses ML algorithms (LSTM,
Random Forest, Regression) to predict workload for the next time window. - Decision Engine:
Determines scaling actions based on predictions and current load. - Kubernetes Controller: Applies
scaling decisions via Kubernetes API. - Visualization Layer: Real-time dashboards with Grafana.

5. Methodology Phase 1: Literature study on Kubernetes auto-scaling mechanisms and ML

forecasting models. Phase 2: Setup of Kubernetes cluster (using Minikube or GKE). Phase 3:
Collect real-time workload data using Prometheus. Phase 4: Train ML model (LSTM / Random
Forest) using historical data. Phase 5: Implement Python-based decision engine integrated with
Kubernetes API. Phase 6: Deploy workloads, test under varying loads, and compare with default
HPA. Phase 7: Analyze results, visualize metrics, and document outcomes.

6. Tools and Technologies - Languages: Python, YAML, Bash - ML Frameworks: Scikit-learn /

TensorFlow - Container Platform: Kubernetes - Monitoring Tools: Prometheus, Grafana - DevOps
Tools: Docker, Jenkins / GitHub Actions - Cloud: AWS / GCP / Azure - Database: InfluxDB /
Prometheus TSDB

7. Expected Outcomes - A self-adaptive auto-scaling system that predicts and scales resources
intelligently. - Reduced latency and optimized cost compared to static threshold-based scaling. -
Visual analytics dashboard for live performance monitoring. - Research publication potential in AI +
Cloud Computing domain. - Deployable prototype for academic or enterprise workloads.
8. Future Enhancements - Integrating Reinforcement Learning (RL) for continuous optimization. -
Expanding to multi-cluster or multi-cloud orchestration. - Implementing energy-efficient scaling
policies to reduce power consumption.

9. References 1. Kubernetes Documentation – [Link] 2. Prometheus Documentation

– [Link] 3. Predictive Autoscaling in Cloud Computing – IEEE Transactions on
Cloud Computing, 2023. 4. TensorFlow Documentation – [Link] 5. Grafana
Labs – [Link]

Applsci 11 03835 v2
No ratings yet
Applsci 11 03835 v2
25 pages
Predictive and Corrective Machine Learning For Seamless Auto-Scaling and AutoDeployment in Cloud-Native Microservices
No ratings yet
Predictive and Corrective Machine Learning For Seamless Auto-Scaling and AutoDeployment in Cloud-Native Microservices
6 pages
AI-Driven Scaling for Spring Boot Microservices
No ratings yet
AI-Driven Scaling for Spring Boot Microservices
14 pages
Intelligent Resource Scaling in Kubernetes
No ratings yet
Intelligent Resource Scaling in Kubernetes
20 pages
KIS-S: A GPU-Aware Kubernetes Inference Simulator With RL-Based Auto-Scaling
No ratings yet
KIS-S: A GPU-Aware Kubernetes Inference Simulator With RL-Based Auto-Scaling
8 pages
Adaptive Cloud Container Auto-Scaling
No ratings yet
Adaptive Cloud Container Auto-Scaling
48 pages
Sustainable Computing with Deep Learning
No ratings yet
Sustainable Computing with Deep Learning
20 pages
Avesha Smart Scaler vs Run:ai KPA Comparison
No ratings yet
Avesha Smart Scaler vs Run:ai KPA Comparison
8 pages
Learning Driven Autoscaling Conference Paper
No ratings yet
Learning Driven Autoscaling Conference Paper
3 pages
AI Portfolio Optimization Platform Overview
No ratings yet
AI Portfolio Optimization Platform Overview
5 pages
Research Paper ML Scalable Systems
No ratings yet
Research Paper ML Scalable Systems
5 pages
Machine Learning for Kubernetes Resource Optimization
No ratings yet
Machine Learning for Kubernetes Resource Optimization
7 pages
Real-Time E-Commerce Recommendation Engine
No ratings yet
Real-Time E-Commerce Recommendation Engine
10 pages
ML AutoScaler IEEE Report
No ratings yet
ML AutoScaler IEEE Report
6 pages
Centralized ML Service with KubeFlow
No ratings yet
Centralized ML Service with KubeFlow
29 pages
Deep Reinforcement Learning for Blockchain Task Assignment
No ratings yet
Deep Reinforcement Learning for Blockchain Task Assignment
12 pages
Predictive Auto Scaling and Cost Optimization Using Machine Learning in AWS Cloud Environments
No ratings yet
Predictive Auto Scaling and Cost Optimization Using Machine Learning in AWS Cloud Environments
7 pages
AI for Auto-scaling in Serverless Systems
No ratings yet
AI for Auto-scaling in Serverless Systems
8 pages
Log-Driven Auto-Scaling with LSTM
No ratings yet
Log-Driven Auto-Scaling with LSTM
2 pages
Containerized House Price Predictor
No ratings yet
Containerized House Price Predictor
4 pages
Optimizing AI Workloads on EKS
No ratings yet
Optimizing AI Workloads on EKS
15 pages
Optimizing Cloud Autoscaling with ML
No ratings yet
Optimizing Cloud Autoscaling with ML
31 pages
Optimizing Serverless Environments with AI
No ratings yet
Optimizing Serverless Environments with AI
8 pages
Optimizing Cloud Computing Resources For Operational Cost
No ratings yet
Optimizing Cloud Computing Resources For Operational Cost
124 pages
IOMP Final Document (6610)
No ratings yet
IOMP Final Document (6610)
40 pages
Internship at Curaxo Healthcare LLP
No ratings yet
Internship at Curaxo Healthcare LLP
19 pages
Austin Housing ML Project Report
No ratings yet
Austin Housing ML Project Report
48 pages
Scaling UPF Instances with DRL in 5G/6G
No ratings yet
Scaling UPF Instances with DRL in 5G/6G
15 pages
Kubernetes Pod Performance Analysis
No ratings yet
Kubernetes Pod Performance Analysis
7 pages
Nifty Stock Price Prediction with ML
No ratings yet
Nifty Stock Price Prediction with ML
13 pages
Optimizing Multi-Cloud Resource Allocation
No ratings yet
Optimizing Multi-Cloud Resource Allocation
40 pages
Power Machine Learning at Scale: Mapping Parallelized Modeling-to-HPC Infrastructure On AWS
No ratings yet
Power Machine Learning at Scale: Mapping Parallelized Modeling-to-HPC Infrastructure On AWS
20 pages
Kubernetes for MLOps: Scaling ML & AI
No ratings yet
Kubernetes for MLOps: Scaling ML & AI
31 pages
Predictive Maintenance Using Machine Learning: AWS Implementation Guide
No ratings yet
Predictive Maintenance Using Machine Learning: AWS Implementation Guide
11 pages
Optimizing Cloud Costs With Machine Learning Predictive Resource Scaling Strategies
No ratings yet
Optimizing Cloud Costs With Machine Learning Predictive Resource Scaling Strategies
8 pages
OptiKube Humanized IEEE Paper
No ratings yet
OptiKube Humanized IEEE Paper
5 pages
Tuning A Kubernetes Horizontal Pod Autoscaler For Meeting Performance and Load Demands in Cloud Deployments
No ratings yet
Tuning A Kubernetes Horizontal Pod Autoscaler For Meeting Performance and Load Demands in Cloud Deployments
20 pages
Loan Approval Prediction System Analysis
No ratings yet
Loan Approval Prediction System Analysis
4 pages
HPC Resource Optimization Model
No ratings yet
HPC Resource Optimization Model
2 pages
Deep Learning for Power System Stability
No ratings yet
Deep Learning for Power System Stability
21 pages
Hybrid Kubernetes Autoscaling with LSTM
No ratings yet
Hybrid Kubernetes Autoscaling with LSTM
12 pages
XGBoost for Cloud Task Prioritization
No ratings yet
XGBoost for Cloud Task Prioritization
30 pages
Updated ML Project
No ratings yet
Updated ML Project
4 pages
AIOPS
No ratings yet
AIOPS
17 pages
Scalable Machine Learning Pipelines Guide
No ratings yet
Scalable Machine Learning Pipelines Guide
25 pages
Simplifying Machine Learning Model Comparison
No ratings yet
Simplifying Machine Learning Model Comparison
11 pages
Machine Learning for Cloud Autoscaling
No ratings yet
Machine Learning for Cloud Autoscaling
34 pages
Austin Housing ML Analysis Report
No ratings yet
Austin Housing ML Analysis Report
47 pages
ML Strategies for Cloud VM Migration
No ratings yet
ML Strategies for Cloud VM Migration
8 pages
Scaling Node.js and AI/ML Backends
No ratings yet
Scaling Node.js and AI/ML Backends
5 pages
Smart Cloud Cost Optimization
No ratings yet
Smart Cloud Cost Optimization
12 pages
Artigo Original Base
No ratings yet
Artigo Original Base
32 pages
AWS Cost Optimization with Machine Learning
No ratings yet
AWS Cost Optimization with Machine Learning
2 pages
Machine Learning for Cloud Cost Optimization
No ratings yet
Machine Learning for Cloud Cost Optimization
4 pages
Case Study - 2 (RTS)
No ratings yet
Case Study - 2 (RTS)
3 pages
C Arrays and Strings Guide
No ratings yet
C Arrays and Strings Guide
20 pages
Understanding Database Management Systems
No ratings yet
Understanding Database Management Systems
11 pages
Deploy Web App with Jenkins on Tomcat
No ratings yet
Deploy Web App with Jenkins on Tomcat
4 pages
Understanding Cloud Computing Basics
No ratings yet
Understanding Cloud Computing Basics
32 pages
Git Branching and Merging Commands
No ratings yet
Git Branching and Merging Commands
2 pages
Introduction to Linux Operating System
No ratings yet
Introduction to Linux Operating System
5 pages
Doubly Linked List Implementation in C
No ratings yet
Doubly Linked List Implementation in C
13 pages
CIFAR-10 CNN Model Training Guide
No ratings yet
CIFAR-10 CNN Model Training Guide
2 pages
Impact of Work Stress on Employee Effectiveness
No ratings yet
Impact of Work Stress on Employee Effectiveness
2 pages
Properties of the Gastrointestinal Tract
No ratings yet
Properties of the Gastrointestinal Tract
9 pages
Text Processing and Classification Techniques
No ratings yet
Text Processing and Classification Techniques
1 page
Sai Gudla - Claims Investigator Resume
No ratings yet
Sai Gudla - Claims Investigator Resume
2 pages
Understanding Views in DBMS
No ratings yet
Understanding Views in DBMS
2 pages
Essential DevOps Tools for 2025
No ratings yet
Essential DevOps Tools for 2025
3 pages
Cooking Rush: Cooking Instruction App
No ratings yet
Cooking Rush: Cooking Instruction App
67 pages
Building Stateful Services with Akka
No ratings yet
Building Stateful Services with Akka
18 pages
Introduction to Apache Cassandra Key-Value Databases
No ratings yet
Introduction to Apache Cassandra Key-Value Databases
6 pages
AWS EC2 Essentials: Instance Types & Pricing
No ratings yet
AWS EC2 Essentials: Instance Types & Pricing
63 pages
AI-Cloud Integration Benefits for Businesses
No ratings yet
AI-Cloud Integration Benefits for Businesses
2 pages
Nextcloud Enterprise Deployment Guide
No ratings yet
Nextcloud Enterprise Deployment Guide
15 pages
Cray XC 30 Brochure
No ratings yet
Cray XC 30 Brochure
6 pages
AWS Cloud Computing Concepts Explained
No ratings yet
AWS Cloud Computing Concepts Explained
11 pages
Online Shopping Chatbot Project Report
No ratings yet
Online Shopping Chatbot Project Report
35 pages
DS-VD22D-C HW2 Datasheet 20240329
No ratings yet
DS-VD22D-C HW2 Datasheet 20240329
4 pages
Overview of Platform Technology
No ratings yet
Overview of Platform Technology
21 pages
NPTEL Cloud Computing Answers 2025
No ratings yet
NPTEL Cloud Computing Answers 2025
119 pages
Understanding Big Data and NoSQL Basics
No ratings yet
Understanding Big Data and NoSQL Basics
153 pages
AWS Developer Associate Overview Guide
No ratings yet
AWS Developer Associate Overview Guide
50 pages
22 Successful SaaS Products Explained
No ratings yet
22 Successful SaaS Products Explained
16 pages
ACMR in Warehouse Automation Analysis
No ratings yet
ACMR in Warehouse Automation Analysis
94 pages
Brocade vEPC: The First Full-Function, Cloud-Based Virtual Evolved Packet Core
No ratings yet
Brocade vEPC: The First Full-Function, Cloud-Based Virtual Evolved Packet Core
8 pages
ASA Clustering in VMDC Architecture
No ratings yet
ASA Clustering in VMDC Architecture
22 pages
Patient Records Management System Report
No ratings yet
Patient Records Management System Report
16 pages
Sagar Kumar - Tech Lead Resume
No ratings yet
Sagar Kumar - Tech Lead Resume
5 pages
Big Data Processing with MATLAB Techniques
No ratings yet
Big Data Processing with MATLAB Techniques
11 pages
HPE ProLiant DL380 Gen11-DataSheet
No ratings yet
HPE ProLiant DL380 Gen11-DataSheet
5 pages
Kcna
No ratings yet
Kcna
15 pages
Ericsson CSU 0201 Compute Sled Unit
No ratings yet
Ericsson CSU 0201 Compute Sled Unit
5 pages
MySQL Database for Inventory Management
No ratings yet
MySQL Database for Inventory Management
8 pages
System Design Handbook Overview
No ratings yet
System Design Handbook Overview
5 pages
Key-Value Database Overview and Use Cases
No ratings yet
Key-Value Database Overview and Use Cases
5 pages
Overview of Distributed Computing Systems
No ratings yet
Overview of Distributed Computing Systems
37 pages
10 Key Features of Effective SOAR Solutions
No ratings yet
10 Key Features of Effective SOAR Solutions
6 pages
Cloud-Based Scientific Workflow Scheduling
No ratings yet
Cloud-Based Scientific Workflow Scheduling
35 pages

ML-Based Auto-Scaling for Kubernetes

Uploaded by

ML-Based Auto-Scaling for Kubernetes

Uploaded by

Intelligent Resource Auto-Scaling in Kubernetes

using Machine Learning

Title: Intelligent Resource Auto-Scaling in Kubernetes using Machine Learning

1. Abstract In modern cloud-native environments, applications experience highly dynamic

2. Problem Statement Current Kubernetes auto-scaling mechanisms operate reactively — scaling

5. Methodology Phase 1: Literature study on Kubernetes auto-scaling mechanisms and ML

6. Tools and Technologies - Languages: Python, YAML, Bash - ML Frameworks: Scikit-learn /

9. References 1. Kubernetes Documentation – [Link] 2. Prometheus Documentation

You might also like