0% found this document useful (0 votes)

11 views3 pages

Module2 Python Data Analytics Notes

The document provides an overview of Python libraries used for data analytics, focusing on NumPy and Pandas. NumPy is highlighted for its efficient numerical computations and support for multi-dimensional arrays, while Pandas is emphasized for data manipulation and analysis with its Series and DataFrame structures. Additionally, it covers data analysis operations, data importing, and data cleaning techniques.

Uploaded by

chuthya8

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views3 pages

Module2 Python Data Analytics Notes

Uploaded by

chuthya8

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Module–2: Python for Data Analytics

1. Introduction to Python Libraries for Data Analytics

Data analytics is the process of collecting, processing, analyzing, and interpreting data to extract
useful information for decision making.

Python is widely used for data analytics because it provides powerful libraries that simplify data
processing and analysis.

Two of the most commonly used libraries are:

• NumPy – Used for numerical and mathematical operations
• Pandas – Used for data manipulation and analysis

2. NumPy (Numerical Python)

NumPy is a Python library used for scientific and numerical computing. It provides support for
multi■dimensional arrays and many mathematical functions.

Features of NumPy:
• Efficient numerical computations
• Multi■dimensional array support
• Mathematical and statistical functions
• Faster execution compared to standard Python lists

Example: Creating a NumPy Array

import numpy as np

arr = [Link]([10, 20, 30, 40])

print(arr)

Output:
[10 20 30 40]

Example: 2D NumPy Array

import numpy as np

matrix = [Link]([[1,2,3],
[4,5,6]])

print(matrix)

Output:
[[1 2 3]
[4 5 6]]

Example: Mathematical Operation

import numpy as np

arr = [Link]([4, 9, 16])

print([Link](arr))

Output:
[2. 3. 4.]

3. Pandas Library
Pandas is a Python library used for data manipulation and analysis. It provides flexible data
structures for working with structured data. Main data structures: • Series – One dimensional
labeled array • DataFrame – Two dimensional table similar to an Excel sheet

Example: Creating a DataFrame

import pandas as pd

data = {
"Name":["Alice","Bob","Charlie"],
"Age":[25,30,35],
"City":["New York","Los Angeles","Chicago"]
}

df = [Link](data)
print(df)

Output:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago

4. Data Analysis Operations

Common operations used in data analysis include filtering, sorting and aggregation.

Filtering Example
older = df[df["Age"] > 30]
print(older)

Output:
Name Age City
2 Charlie 35 Chicago

Sorting Example
df.sort_values("Age", ascending=False)

Output:
Charlie 35
Bob 30
Alice 25

Aggregation Example
print(df["Age"].mean())

Output:
30

5. Data Importing
Pandas allows importing datasets from various sources such as CSV files, Excel files and
databases.

import pandas as pd

df = pd.read_csv("[Link]")
print(df)

6. Data Cleaning
Data cleaning involves detecting and correcting inaccurate or incomplete data. Common tasks
include handling missing values, removing duplicates and identifying outliers.

Handling Missing Values

[Link]()
[Link]()
[Link](0)

Removing Duplicates
df.drop_duplicates()

Handling Outliers
df = df[df["Age"] < 100]

NumPy and Pandas for Data Analysis
No ratings yet
NumPy and Pandas for Data Analysis
34 pages
ppt1 - Intro To Data Analytics and Visualization
No ratings yet
ppt1 - Intro To Data Analytics and Visualization
35 pages
Data Analytics and Reporting Overview
No ratings yet
Data Analytics and Reporting Overview
11 pages
DataScience Notes EI334
No ratings yet
DataScience Notes EI334
15 pages
DST Exp
No ratings yet
DST Exp
26 pages
First Lec - Datahandling
No ratings yet
First Lec - Datahandling
26 pages
Basic Data Science Tutorial in Python
No ratings yet
Basic Data Science Tutorial in Python
10 pages
Python Data Analysis with Pandas Guide
No ratings yet
Python Data Analysis with Pandas Guide
11 pages
Understanding NumPy for Data Science
No ratings yet
Understanding NumPy for Data Science
52 pages
Convert 26AS Text to Excel Guide
No ratings yet
Convert 26AS Text to Excel Guide
38 pages
Chapter 2 Introduction To Python Libraries
No ratings yet
Chapter 2 Introduction To Python Libraries
46 pages
Data Exploration and Cleaning Techniques
No ratings yet
Data Exploration and Cleaning Techniques
12 pages
Python Data Analytics Libraries Guide
No ratings yet
Python Data Analytics Libraries Guide
105 pages
Machine Learning with Python
No ratings yet
Machine Learning with Python
29 pages
Data Science with Python: NumPy, Pandas, Matplotlib
No ratings yet
Data Science with Python: NumPy, Pandas, Matplotlib
36 pages
Comprehensive Guide to Pandas Usage
No ratings yet
Comprehensive Guide to Pandas Usage
14 pages
Data Handling with Pandas & NumPy Guide
No ratings yet
Data Handling with Pandas & NumPy Guide
10 pages
Python Data Analytics Complete Notes
No ratings yet
Python Data Analytics Complete Notes
4 pages
Mastering Data Cleaning with Pandas
No ratings yet
Mastering Data Cleaning with Pandas
86 pages
Introduction to Pandas Library
No ratings yet
Introduction to Pandas Library
5 pages
Python Ds Cheatsheet
No ratings yet
Python Ds Cheatsheet
7 pages
Understanding Pandas Data Structures
No ratings yet
Understanding Pandas Data Structures
62 pages
Pandas Lecture Notes
No ratings yet
Pandas Lecture Notes
7 pages
Data Analysis with Python Course Overview
No ratings yet
Data Analysis with Python Course Overview
137 pages
Pandas Basics: DataFrames & Operations
No ratings yet
Pandas Basics: DataFrames & Operations
25 pages
Panda Library
No ratings yet
Panda Library
8 pages
Python Pandas Program Guide
No ratings yet
Python Pandas Program Guide
2 pages
Python Data Analysis with MySQL Guide
No ratings yet
Python Data Analysis with MySQL Guide
45 pages
Unit 2-5
No ratings yet
Unit 2-5
3 pages
NumPy and Pandas: Python Data Science Tools
No ratings yet
NumPy and Pandas: Python Data Science Tools
12 pages
Python Libraries for Statistical Analysis
No ratings yet
Python Libraries for Statistical Analysis
40 pages
Python Libraries for Data Analysis
No ratings yet
Python Libraries for Data Analysis
57 pages
Calculating Median and Mean in Pandas
No ratings yet
Calculating Median and Mean in Pandas
38 pages
Python For Analy 2
No ratings yet
Python For Analy 2
39 pages
Saving NumPy Arrays to Files
No ratings yet
Saving NumPy Arrays to Files
85 pages
Data Analytics for Business Success
No ratings yet
Data Analytics for Business Success
34 pages
Python EDA and Data Science Basics
No ratings yet
Python EDA and Data Science Basics
53 pages
Introduction to Pandas for Data Analysis
No ratings yet
Introduction to Pandas for Data Analysis
8 pages
Introduction to Pandas Library Basics
No ratings yet
Introduction to Pandas Library Basics
6 pages
Introduction to Data Analysis with Pandas
No ratings yet
Introduction to Data Analysis with Pandas
18 pages
Introduction to Pandas Data Analysis
No ratings yet
Introduction to Pandas Data Analysis
27 pages
Data Science Laboratory Manual Guide
No ratings yet
Data Science Laboratory Manual Guide
46 pages
NumPy and Pandas for Data Analysis
No ratings yet
NumPy and Pandas for Data Analysis
12 pages
Introduction to Pandas for Data Analysis
No ratings yet
Introduction to Pandas for Data Analysis
14 pages
Unit V - Python Libraries
No ratings yet
Unit V - Python Libraries
34 pages
Handling DataFrame Sorting Issues
No ratings yet
Handling DataFrame Sorting Issues
12 pages
Mastering NumPy and pandas Basics
No ratings yet
Mastering NumPy and pandas Basics
3 pages
Python Data Science Essentials
No ratings yet
Python Data Science Essentials
27 pages
Data Exploration with Python and Pandas
No ratings yet
Data Exploration with Python and Pandas
397 pages
DataFrames in Machine Learning
No ratings yet
DataFrames in Machine Learning
10 pages
Introduction to Pandas for Data Analysis
No ratings yet
Introduction to Pandas for Data Analysis
31 pages
Intro to Data Analysis with Python
100% (2)
Intro to Data Analysis with Python
29 pages
NumPy in Python
No ratings yet
NumPy in Python
12 pages
BCA & BSc(CS) Timetable Feb 2025-26
No ratings yet
BCA & BSc(CS) Timetable Feb 2025-26
4 pages
BCA Class Schedule: OS & Java 217
No ratings yet
BCA Class Schedule: OS & Java 217
4 pages
IoT-Based Smart Surveillance Robot
No ratings yet
IoT-Based Smart Surveillance Robot
73 pages
Smart Surveillance Robot Project Report
No ratings yet
Smart Surveillance Robot Project Report
1 page
Smart Surveillance Robot Project Report
No ratings yet
Smart Surveillance Robot Project Report
2 pages
Application Example: Quality Control Turbines: Quality Assurance and Product Definition For The Power Generation Industry
No ratings yet
Application Example: Quality Control Turbines: Quality Assurance and Product Definition For The Power Generation Industry
4 pages
SQL Grocery Store Database Project
No ratings yet
SQL Grocery Store Database Project
1 page
Technical Drawing Specifications Document
No ratings yet
Technical Drawing Specifications Document
1 page
Cond 3210 Conductivity Meter Manual
No ratings yet
Cond 3210 Conductivity Meter Manual
58 pages
Air University Mid Term Date Sheet Fall 21
No ratings yet
Air University Mid Term Date Sheet Fall 21
1 page
Grade 6 MS Word Lesson Plan
No ratings yet
Grade 6 MS Word Lesson Plan
2 pages
Payment Overview and Status Tracker
No ratings yet
Payment Overview and Status Tracker
3 pages
Computer Optimization Techniques Exam Guide
No ratings yet
Computer Optimization Techniques Exam Guide
3 pages
C Programming Bootcamp Overview
No ratings yet
C Programming Bootcamp Overview
39 pages
FPSC Admission Certificate for Assistant Engineer
No ratings yet
FPSC Admission Certificate for Assistant Engineer
1 page
Introduction to NumPy for Python
No ratings yet
Introduction to NumPy for Python
10 pages
Arduino Dual Axis Solar Tracker System
No ratings yet
Arduino Dual Axis Solar Tracker System
4 pages
Axispay App Crash Report Analysis
No ratings yet
Axispay App Crash Report Analysis
3 pages
Top 50 Operating System Interview Questions: 1) Explain The Main Purpose of An Operating System?
No ratings yet
Top 50 Operating System Interview Questions: 1) Explain The Main Purpose of An Operating System?
11 pages
(掃描建模) From - scan to BIM
No ratings yet
(掃描建模) From - scan to BIM
13 pages
Carberry Brochure ENG 2 Web
No ratings yet
Carberry Brochure ENG 2 Web
25 pages
CKP CMP Simulator Instruction Manual
No ratings yet
CKP CMP Simulator Instruction Manual
17 pages
5G Architecture and Log Analysis
No ratings yet
5G Architecture and Log Analysis
20 pages
Understanding Midrise Uniform Quantisation
No ratings yet
Understanding Midrise Uniform Quantisation
8 pages
Django 用户认证系统详解
No ratings yet
Django 用户认证系统详解
19 pages
CEH v10 Certified Ethical Hacker Study Guide 1119533198 Sample
No ratings yet
CEH v10 Certified Ethical Hacker Study Guide 1119533198 Sample
84 pages
Workdaycrm Com Pricing
No ratings yet
Workdaycrm Com Pricing
4 pages
Keylight User Guide for Nuke Software
No ratings yet
Keylight User Guide for Nuke Software
78 pages
IIT Hyderabad VLSI Interview Insights
No ratings yet
IIT Hyderabad VLSI Interview Insights
5 pages
Carbon SOCD Defect Review Log
No ratings yet
Carbon SOCD Defect Review Log
40 pages
Overview of Electronic Flight Instrumentation
No ratings yet
Overview of Electronic Flight Instrumentation
88 pages
Android UI Components Implementation
No ratings yet
Android UI Components Implementation
8 pages
Understanding Embedded Systems Basics
No ratings yet
Understanding Embedded Systems Basics
63 pages
Multi-Robot Assembly Planning for Manufacturing
No ratings yet
Multi-Robot Assembly Planning for Manufacturing
22 pages
MS Office Course Outline and Syllabus
100% (2)
MS Office Course Outline and Syllabus
4 pages

Module2 Python Data Analytics Notes

Uploaded by

Module2 Python Data Analytics Notes

Uploaded by

Module–2: Python for Data Analytics

1. Introduction to Python Libraries for Data Analytics

Two of the most commonly used libraries are:

2. NumPy (Numerical Python)

Example: Creating a NumPy Array

arr = [Link]([10, 20, 30, 40])

Example: 2D NumPy Array

Example: Mathematical Operation

arr = [Link]([4, 9, 16])

Example: Creating a DataFrame

4. Data Analysis Operations

Handling Missing Values

You might also like