0% found this document useful (0 votes)

9 views21 pages

ARIMA Time Series Analysis in Python

The document contains various Python programs demonstrating time series analysis using ARIMA, visualization techniques for data representation, descriptive analytics on synthetic healthcare data, predictive analysis on product sales and weather forecasting. Each section includes code snippets for generating synthetic data, visualizing it, and applying statistical or machine learning models to analyze trends and make predictions. Outputs from the analyses include summary statistics, visual plots, and evaluation metrics like Mean Squared Error and R-squared.

Uploaded by

rayadurgamkaarthik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views21 pages

ARIMA Time Series Analysis in Python

Uploaded by

rayadurgamkaarthik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

7) Implement ARIMA on time series data

PROGRAM:

import numpy as np

import pandas as pd

import [Link] as plt

from [Link] import ARIMA

from [Link] import plot_acf, plot_pacf

# Generate synthetic time series data

[Link](42)

n = 100

time = [Link](n)

data = 10 + 0.5 * time + [Link](size=n) # Linear trend with noise

# Create a DataFrame

ts_data = [Link](data, columns=['Value'])

ts_data['Time'] = pd.date_range(start='2020-01-01', periods=n, freq='D')

ts_data.set_index('Time', inplace=True)

# Plot the time series

[Link](figsize=(10, 6))

[Link](ts_data, label='Time Series Data')

[Link]('Synthetic Time Series Data')

[Link]('Date')

[Link]('Value')

[Link]()

# Check for stationarity (optional, can use Augmented Dickey-Fuller test)

from [Link] import adfuller

result = adfuller(ts_data['Value'])
print(f'ADF Statistic: {result[0]}')

print(f'p-value: {result[1]}')

# Plot ACF and PACF

plot_acf(ts_data['Value'], lags=20)

[Link]('Autocorrelation Function (ACF)')

[Link]()

plot_pacf(ts_data['Value'], lags=20)

[Link]('Partial Autocorrelation Function (PACF)')

[Link]()

# Fit the ARIMA model

# For this example, let's assume we choose parameters (p=1, d=1, q=1)

model = ARIMA(ts_data['Value'], order=(1, 1, 1))

model_fit = [Link]()

# Print the summary of the model

print(model_fit.summary())

# Make forecasts

forecast = model_fit.forecast(steps=10)

forecast_index = pd.date_range(start=ts_data.index[-1] + [Link](days=1), periods=10,

freq='D')

# Plot the original data and the forecast

[Link](figsize=(10, 6))

[Link](ts_data, label='Historical Data', color='blue')

[Link](forecast_index, forecast, label='Forecast', color='orange')

[Link]('ARIMA Forecast')

[Link]('Date')

[Link]('Value')

[Link]()
[Link]()

Output:

ADF Statistic: 0.2480785554660348

p-value: 0.9748328625999818
8) Perform visualization techniques (types of maps -Bar, Column, Scatter,
3D, Cubes etc) in python
Bar Chart

Column Chart (Vertical Bar Chart)

Scatter Plot

3D Cube Plot (using mpl_toolkits.mplot3d)

PROGRAM:

import numpy as np

import [Link] as plt

import seaborn as sns

from mpl_toolkits.mplot3d import Axes3D

# Sample Data

[Link](0)

categories = ['A', 'B', 'C', 'D', 'E']

values = [Link](1, 10, size=len(categories))

x = [Link](100)

y = [Link](100)

z = [Link](100) * 100 # for 3D plot

# 1. Bar Chart

[Link](figsize=(12, 8))

[Link](2, 2, 1)

[Link](categories, values, color='skyblue')

[Link]('Bar Chart')

[Link]('Categories')

[Link]('Values')

# 2. Column Chart (Vertical Bar Chart)

[Link](2, 2, 2)

[Link](categories, values, color='salmon')

[Link]('Column Chart')

[Link]('Values')

[Link]('Categories')

# 3. Scatter Plot

[Link](2, 2, 3)

[Link](x, y, color='green', alpha=0.6)

[Link]('Scatter Plot')

[Link]('X-axis')

[Link]('Y-axis')

# 4. 3D Cube Plot

ax = [Link](2, 2, 4, projection='3d')

[Link](x, y, z, color='purple')

ax.set_title('3D Cube Plot')

ax.set_xlabel('X-axis')

ax.set_ylabel('Y-axis')

ax.set_zlabel('Z-axis')

plt.tight_layout()

[Link]()
Output:
9) Perform descriptive analytics on healthcare data
PROGRAM:

import pandas as pd

import numpy as np

import [Link] as plt

import seaborn as sns

# Create a synthetic healthcare dataset

data = {

'PatientID': range(1, 101),

'Age': [Link](20, 80, size=100),

'Gender': [Link](['Male', 'Female'], size=100),

'BMI': [Link](18.5, 40.0, size=100), # Body Mass Index

'BloodPressure': [Link](90, 180, size=100),

'Cholesterol': [Link](['Normal', 'High'], size=100),

'Diabetes': [Link](['Yes', 'No'], size=100)

df = [Link](data)

# 1. Summary Statistics

print("Summary Statistics:")

print([Link](include='all'))

# 2. Count of Gender

gender_count = df['Gender'].value_counts()

print("\nGender Distribution:")

print(gender_count)
# 3. Age Distribution

[Link](figsize=(12, 6))

[Link](df['Age'], bins=10, kde=True)

[Link]('Age Distribution')

[Link]('Age')

[Link]('Frequency')

[Link]()

# 4. BMI Boxplot

[Link](figsize=(12, 6))

[Link](x='Gender', y='BMI', data=df)

[Link]('BMI by Gender')

[Link]('Gender')

[Link]('BMI')

[Link]()

# 5. Blood Pressure vs. BMI

[Link](figsize=(12, 6))

[Link](x='BMI', y='BloodPressure', hue='Diabetes', style='Cholesterol', data=df)

[Link]('Blood Pressure vs. BMI')

[Link]('BMI')

[Link]('Blood Pressure')

[Link](title='Diabetes/Cholesterol')

[Link]()
# 6. Correlation Matrix

correlation_matrix = df[['Age', 'BMI', 'BloodPressure']].corr()

[Link](figsize=(8, 6))

[Link](correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f")

[Link]('Correlation Matrix')

[Link]()

Output:

Summary Statistics:

PatientID Age Gender ... BloodPressure Cholesterol Diabetes

count 100.000000 100.000000 100 ... 100.000000 100 100

unique NaN NaN 2 ... NaN 2 2

top NaN NaN Female ... NaN Normal Yes

freq NaN NaN 53 ... NaN 51 63

mean 50.500000 45.500000 NaN ... 135.530000 NaN NaN

std 29.011492 17.584141 NaN ... 25.007253 NaN NaN

min 1.000000 20.000000 NaN ... 91.000000 NaN NaN

25% 25.750000 28.750000 NaN ... 118.000000 NaN NaN

50% 50.500000 46.000000 NaN ... 136.000000 NaN NaN

75% 75.250000 60.250000 NaN ... 158.250000 NaN NaN

max 100.000000 79.000000 NaN ... 178.000000 NaN NaN

[11 rows x 7 columns]

Gender Distribution:

Gender

Female 53

Male 47

Name: count, dtype: int64

10) Perform predictive analysis on product sales data
PROGRAM:

import pandas as pd

import numpy as np

import [Link] as plt

import seaborn as sns

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from [Link] import mean_squared_error, r2_score

# Create a synthetic product sales dataset

[Link](0)

months = pd.date_range(start='2020-01-01', periods=24, freq='M')

sales = [Link](1000, 5000, size=24) + [Link](0, 1000, 24) # Increasing

trend

data = [Link]({'Month': months, 'Sales': sales})

# 1. Visualize the Sales Data

[Link](figsize=(10, 6))

[Link](data['Month'], data['Sales'], marker='o')

[Link]('Monthly Product Sales')

[Link]('Month')

[Link]('Sales')

[Link](rotation=45)

[Link]()

# 2. Prepare the data for predictive analysis

data['Month_ordinal'] = data['Month'].map([Link]) # Convert dates to
ordinal

X = data[['Month_ordinal']] # Feature

y = data['Sales'] # Target

# 3. Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 4. Create and train the linear regression model

model = LinearRegression()

[Link](X_train, y_train)

# 5. Make predictions

y_pred = [Link](X_test)

# 6. Evaluate the model

mse = mean_squared_error(y_test, y_pred)

r2 = r2_score(y_test, y_pred)

print(f'Mean Squared Error: {mse:.2f}')

print(f'R-squared: {r2:.2f}')

# 7. Visualize the predictions

[Link](figsize=(10, 6))

[Link](data['Month'], data['Sales'], marker='o', label='Actual Sales')

[Link](X_test['Month_ordinal'].map([Link]), y_pred, color='red',

label='Predicted Sales')

[Link]('Sales Prediction')

[Link]('Month')
[Link]('Sales')

[Link](rotation=45)

[Link]()

# 8. Forecast future sales (next 6 months)

future_months = pd.date_range(start=data['Month'].iloc[-1] + [Link](months=1),

periods=6, freq='M')

future_months_ordinal = future_months.map([Link]).[Link](-1, 1)

future_sales = [Link](future_months_ordinal)

# 9. Visualize future predictions

[Link](figsize=(10, 6))

[Link](data['Month'], data['Sales'], marker='o', label='Actual Sales')

[Link](future_months, future_sales, marker='o', color='orange', label='Forecasted Sales')

[Link]('Sales Prediction and Forecast')

[Link]('Month')

[Link]('Sales')

[Link](rotation=45)

[Link]()

[Link]()
Output:

months = pd.date_range(start='2020-01-01', periods=24, freq='M')

Mean Squared Error: 1276134.25

R-squared: 0.23
11) Apply predective analytics for weather forecasting
PROGRAM:

import pandas as pd

import numpy as np

import [Link] as plt

import seaborn as sns

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from [Link] import mean_squared_error, r2_score

# Create a synthetic weather dataset

[Link](0)

days = pd.date_range(start='2020-01-01', periods=365, freq='D')

temperature = [Link](15, 30, size=365) # Random temperatures

humidity = [Link](30, 90, size=365) # Random humidity

pressure = [Link](980, 1030, size=365) # Random atmospheric pressure

data = [Link]({'Date': days, 'Temperature': temperature, 'Humidity': humidity,

'Pressure': pressure})

# 1. Visualize the Temperature Data

[Link](figsize=(10, 6))

[Link](data['Date'], data['Temperature'], label='Temperature', color='orange')

[Link]('Daily Temperature')

[Link]('Date')

[Link]('Temperature (°C)')

[Link](rotation=45)

[Link]()

[Link]()
# 2. Prepare the data for predictive analysis

X = data[['Humidity', 'Pressure']] # Features

y = data['Temperature'] # Target

# 3. Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 4. Create and train the linear regression model

model = LinearRegression()

[Link](X_train, y_train)

# 5. Make predictions

y_pred = [Link](X_test)

# 6. Evaluate the model

mse = mean_squared_error(y_test, y_pred)

r2 = r2_score(y_test, y_pred)

print(f'Mean Squared Error: {mse:.2f}')

print(f'R-squared: {r2:.2f}')

# 7. Visualize the predictions vs actual temperatures

[Link](figsize=(10, 6))

[Link](y_test, y_pred, color='blue')

[Link]([min(y_test), max(y_test)], [min(y_test), max(y_test)], color='red', linestyle='--')

[Link]('Actual vs Predicted Temperatures')

[Link]('Actual Temperature (°C)')

[Link]('Predicted Temperature (°C)')

[Link]()

# 8. Forecasting future temperatures (for the next 7 days)

future_days = pd.date_range(start=data['Date'].iloc[-1] + [Link](days=1), periods=7,

freq='D')

future_humidity = [Link](30, 90, size=7) # Random future humidity

future_pressure = [Link](980, 1030, size=7) # Random future pressure

future_X = [Link]({'Humidity': future_humidity, 'Pressure': future_pressure})

# Make future predictions

future_temperatures = [Link](future_X)

# 9. Visualize future predictions

[Link](figsize=(10, 6))

[Link](data['Date'], data['Temperature'], label='Historical Temperature', color='orange')

[Link](future_days, future_temperatures, marker='o', label='Forecasted Temperature',

color='blue')

[Link]('Temperature Forecasting')

[Link]('Date')

[Link]('Temperature (°C)')

[Link](rotation=45)

[Link]()

[Link] ()
Output:
Mean Squared Error: 20.41

R-squared: -0.00

Detecting Outliers and Missing Values
No ratings yet
Detecting Outliers and Missing Values
35 pages
Time Series and Data Analysis Techniques
No ratings yet
Time Series and Data Analysis Techniques
16 pages
NumPy, Pandas, and Matplotlib Basics
No ratings yet
NumPy, Pandas, and Matplotlib Basics
30 pages
Data Processing and Visualization Guide
No ratings yet
Data Processing and Visualization Guide
5 pages
Cheat Sheet Modeldeploy
No ratings yet
Cheat Sheet Modeldeploy
2 pages
Python Cheat Sheet For Data Analysis
No ratings yet
Python Cheat Sheet For Data Analysis
2 pages
Data Manipulation and Visualization with Pandas
No ratings yet
Data Manipulation and Visualization with Pandas
46 pages
AI Data Science Lab Manual
No ratings yet
AI Data Science Lab Manual
28 pages
Data Science with Python: Key Techniques
No ratings yet
Data Science with Python: Key Techniques
21 pages
Handling NaN Values in DataFrames
No ratings yet
Handling NaN Values in DataFrames
16 pages
Data Cleaning and Visualization Techniques
No ratings yet
Data Cleaning and Visualization Techniques
33 pages
Assignment 1: "Autodata - CSV"
No ratings yet
Assignment 1: "Autodata - CSV"
49 pages
EDA for Classification with Pandas
No ratings yet
EDA for Classification with Pandas
4 pages
Python Data Visualization Experiments
No ratings yet
Python Data Visualization Experiments
17 pages
NumPy and Pandas Data Manipulation Guide
No ratings yet
NumPy and Pandas Data Manipulation Guide
11 pages
Customizing Pandas Plot Labels
No ratings yet
Customizing Pandas Plot Labels
32 pages
AD3411 Data Science Lab Manual
No ratings yet
AD3411 Data Science Lab Manual
27 pages
Python Data Frame Operations Guide
No ratings yet
Python Data Frame Operations Guide
13 pages
FDSA Lab Manual: Python Operations
No ratings yet
FDSA Lab Manual: Python Operations
31 pages
Python Randomness and Data Analysis Guide
No ratings yet
Python Randomness and Data Analysis Guide
24 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
Python Data Science Comprehensive Cheat Sheet
No ratings yet
Python Data Science Comprehensive Cheat Sheet
19 pages
Dave
No ratings yet
Dave
26 pages
Data Science Lab Manual: Python Experiments
No ratings yet
Data Science Lab Manual: Python Experiments
32 pages
Fds Lab Manual
No ratings yet
Fds Lab Manual
33 pages
Kedar Dsbda Codes
No ratings yet
Kedar Dsbda Codes
18 pages
DS Lab Manual
No ratings yet
DS Lab Manual
32 pages
Data Analysis with Pandas and NumPy
No ratings yet
Data Analysis with Pandas and NumPy
10 pages
Python Data Analysis with Numpy and Pandas
No ratings yet
Python Data Analysis with Numpy and Pandas
34 pages
Pandas, Matplotlib, and Statistics in Python
No ratings yet
Pandas, Matplotlib, and Statistics in Python
28 pages
Generate and Analyze Synthetic Sales Data
No ratings yet
Generate and Analyze Synthetic Sales Data
11 pages
Python Machine Learning Guide
No ratings yet
Python Machine Learning Guide
66 pages
Dsa Program
No ratings yet
Dsa Program
53 pages
Frequency Distribution and Analysis
No ratings yet
Frequency Distribution and Analysis
13 pages
Data Visualization Tools in Python
No ratings yet
Data Visualization Tools in Python
33 pages
Data Science Libraries Lab Report
No ratings yet
Data Science Libraries Lab Report
7 pages
Bivariate Analysis of Diabetes Data
No ratings yet
Bivariate Analysis of Diabetes Data
24 pages
Naïve Bayes & Linear Regression Analysis
No ratings yet
Naïve Bayes & Linear Regression Analysis
6 pages
Data Clustering and Analysis in R/Python
No ratings yet
Data Clustering and Analysis in R/Python
15 pages
Deep Learning with Keras and TensorFlow
No ratings yet
Deep Learning with Keras and TensorFlow
22 pages
Sec4 Data Visualization
No ratings yet
Sec4 Data Visualization
15 pages
DSUP Lab
No ratings yet
DSUP Lab
42 pages
Lab Programs (Ad3411 Dsa)
No ratings yet
Lab Programs (Ad3411 Dsa)
22 pages
Data Visualization with Matplotlib
No ratings yet
Data Visualization with Matplotlib
3 pages
Ex 8 To Ex 12
No ratings yet
Ex 8 To Ex 12
8 pages
Time Series Forecasting and Evaluation
No ratings yet
Time Series Forecasting and Evaluation
20 pages
Data Science and Analytics Programs
No ratings yet
Data Science and Analytics Programs
21 pages
FDS Record
No ratings yet
FDS Record
63 pages
AD3411 Data Science Lab Manual
No ratings yet
AD3411 Data Science Lab Manual
34 pages
Python Data Analysis with Libraries
No ratings yet
Python Data Analysis with Libraries
27 pages
Python Probability and Statistics Analysis
No ratings yet
Python Probability and Statistics Analysis
11 pages
Z-Test Implementation with Pandas
No ratings yet
Z-Test Implementation with Pandas
39 pages
Python Data Analysis with NumPy & Pandas
No ratings yet
Python Data Analysis with NumPy & Pandas
24 pages
Data Analysis with Python and Streamlit
No ratings yet
Data Analysis with Python and Streamlit
10 pages
NumPy and Pandas Data Analysis Tasks
No ratings yet
NumPy and Pandas Data Analysis Tasks
11 pages
Python Data Visualization Guide
No ratings yet
Python Data Visualization Guide
22 pages
Introduction to Matplotlib in Python
100% (1)
Introduction to Matplotlib in Python
43 pages
Working with Pandas and NumPy in Python
No ratings yet
Working with Pandas and NumPy in Python
34 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
45 pages
Fire Escape Tips and Procedures
No ratings yet
Fire Escape Tips and Procedures
4 pages
Emotional Labor Strategies of Thai Lecturers
No ratings yet
Emotional Labor Strategies of Thai Lecturers
10 pages
General Knowledge Quiz Questions
No ratings yet
General Knowledge Quiz Questions
26 pages
Mercedes Parts Clearance List
No ratings yet
Mercedes Parts Clearance List
14 pages
Marias Employer of 19 Years Offers A Pension Plan That Is The Product of The Three Year Average of Her Most Current Salariesthe Number of Ye
No ratings yet
Marias Employer of 19 Years Offers A Pension Plan That Is The Product of The Three Year Average of Her Most Current Salariesthe Number of Ye
9 pages
Biomarker Screening Test Form
No ratings yet
Biomarker Screening Test Form
1 page
Health and Safety Study Material
No ratings yet
Health and Safety Study Material
121 pages
Class 10 Science: Asexual Reproduction Guide
No ratings yet
Class 10 Science: Asexual Reproduction Guide
4 pages
Placental Abruption Overview and Management
100% (1)
Placental Abruption Overview and Management
6 pages
Mass Spectrometry Mark Scheme Answers
No ratings yet
Mass Spectrometry Mark Scheme Answers
3 pages
Understanding Insolation and Its Effects
100% (2)
Understanding Insolation and Its Effects
22 pages
Advanced GDB Debugging Techniques
No ratings yet
Advanced GDB Debugging Techniques
2 pages
Understanding Salmonellosis and Its Pathogenesis
No ratings yet
Understanding Salmonellosis and Its Pathogenesis
8 pages
Mining Engineering MCQ Sample Questions
100% (3)
Mining Engineering MCQ Sample Questions
4 pages
Unfair Labor Practices in Union Strikes
100% (1)
Unfair Labor Practices in Union Strikes
2 pages
Unemployment Challenges in Bangladesh
No ratings yet
Unemployment Challenges in Bangladesh
11 pages
Home Sperm Testing Device for Men
No ratings yet
Home Sperm Testing Device for Men
2 pages
Deep Well Dewatering System Overview
100% (3)
Deep Well Dewatering System Overview
36 pages
Indian & Sri Lankan Chef Resume
No ratings yet
Indian & Sri Lankan Chef Resume
4 pages
IndiGo Flight Booking Confirmation
No ratings yet
IndiGo Flight Booking Confirmation
2 pages
Military Medical Complex at The Premises of King Khalid International Airpor2
No ratings yet
Military Medical Complex at The Premises of King Khalid International Airpor2
4 pages
Consumer Behavior in Service Marketing
No ratings yet
Consumer Behavior in Service Marketing
5 pages
Architectural Design Exam: Family Home
No ratings yet
Architectural Design Exam: Family Home
2 pages
ISO 9001:2015 Compliance Checklist
No ratings yet
ISO 9001:2015 Compliance Checklist
6 pages
Cagayan Learning Service Continuity Plan
100% (1)
Cagayan Learning Service Continuity Plan
19 pages
Social Value and Distance in Welfare Judgments
No ratings yet
Social Value and Distance in Welfare Judgments
16 pages
Pharmacist Resume of Hanin Dimal Mustapha
No ratings yet
Pharmacist Resume of Hanin Dimal Mustapha
3 pages
APQC Process Classification Framework Excel
No ratings yet
APQC Process Classification Framework Excel
2 pages
Overview of San Juan, Batangas Barangays
0% (1)
Overview of San Juan, Batangas Barangays
17 pages
Designing Child-Friendly Spaces in Zaatari
No ratings yet
Designing Child-Friendly Spaces in Zaatari
4 pages