0% found this document useful (0 votes)

14 views3 pages

R Data Analysis Lab: Iris & mtcars Datasets

Uploaded by

SpiZz

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views3 pages

R Data Analysis Lab: Iris & mtcars Datasets

Uploaded by

SpiZz

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

WEEK 2 LAB EXERCISE – Exploring built in datasets

Duration: 2 hours
Mode: Guided and Hands-on Practice
Module: CT127-3-2 Programming for Data Analysis
Lecturer: Dr. Kulothunkan Palasundram (Dr. Kulo)

Objective
By the end of this lab, students will be able to:
1. Write basic R commands to perform simple exploratory data analysis on 2 built
in datasets – iris and mtcars

Dataset: Iris dataset

Part A — Explore iris
Load and inspect the famous Fisher’s iris dataset by running the commands below
one by one
data(iris) # Loads the built-in iris dataset
dim(iris)
names(iris) # Column names
str(iris) # Structure: types for each column;
head(iris, 3) # First 3 rows
summary(iris) # Summary stats for numeric; counts for factor
table(iris$Species) # Frequency table for the Species

Part B — Perform basic manipulations - Select, Filter, Sort

Create subsets of the data frame and order rows by a variable.
# Select two columns into a new object sl
sl <- iris[, c("[Link]", "Species")]
head(sl)

setosa_big <- subset(iris, Species == "setosa" & [Link] > 5)

nrow(setosa_big)

# Reorder rows
sorted <- iris[order(iris$[Link], decreasing = TRUE), ]

# Show top 5 rows and first two columns

head(sorted, 5)[, 1:2]

Notes:
• subset() uses a logical condition to filter rows.
• order() returns row indices for sorting; use inside [ ] to reorder the data frame.

1
Part C — New Variables & Grouping
Create a ratio variable and bin a numeric variable into categories; compute grouped
means.
# New numeric column
iris$[Link] <- iris$[Link] / iris$[Link]

summary(iris$[Link])

iris$SepalLenCat <- cut (

iris$[Link],
breaks = c(-Inf, 5.5, 6.5, Inf),
labels = c("short", "medium", "long")
)

table(iris$SepalLenCat)

# Mean [Link] per Species

tapply(iris$[Link], iris$Species, mean)

Notes:
• cut() converts a continuous variable into categorical bins (factor).
• tapply(x, g, f) applies f to x within each group g.

Part D — Quick Visuals (base R)

Produce a histogram, a grouped boxplot, and a scatterplot.
hist(iris$[Link], # Numeric vector for histogram
main = "Histogram of Sepal Length", # Title
xlab = "[Link]") # X-axis label

boxplot([Link] ~ Species, data = iris, # Formula: y ~ group

main = "Sepal Length by Species", # Title
ylab = "[Link]") # Y-axis label

plot(iris$[Link], iris$[Link], # Scatter: x then y

xlab = "[Link]", ylab = "[Link]",
pch = 19) # Solid points

Notes:
• Histogram shows a distribution; boxplot compares groups; scatter shows
relationships.

2
Dataset: mtcars
Part A — Explore mtcars

#load the dataset

data(mtcars)

1. Write R command to return the number of rows and columns in the dataset

2. List down the column names of the mtcars dataset

3. Identify the data types for all the columns

Part B — Checking the data distribution

4. Write R commands to get the average and middle point for a column (choose any
column)

Part C — Visuals
5. Plot a histogram for mpg. Explain what you see.

6. Plot a grouped boxplot. What is a boxplot used for?

7. Plot a scatterplot of hp and mpg. Explain the relationship between the 2

variables.

Part F — Data Wrangling (Base R: New Variables, Cross-Tabs, Reshape)

1. Create a new variable called mpg_band

The new variable will have values as defined below

Mpg Mpg_band
< 18 low
18 to 25 medium
> 25 high

2. Write a command to find out how many cars there are in each band

3. Write a command to split the cars based on their weight. Any cars weighing
more than the median should be categorized as heavy otherwise light. How
many are there in each category?

R Programming Basics and Plotting Techniques
No ratings yet
R Programming Basics and Plotting Techniques
4 pages
R Scripts for Data Analysis in R
No ratings yet
R Scripts for Data Analysis in R
25 pages
R Data Analysis: Visualization & Stats
No ratings yet
R Data Analysis: Visualization & Stats
7 pages
Data Frames in R: Creation & Usage
No ratings yet
Data Frames in R: Creation & Usage
5 pages
FDS Exp 1,2,3,4&5
No ratings yet
FDS Exp 1,2,3,4&5
27 pages
Data Visualization Techniques in R
No ratings yet
Data Visualization Techniques in R
13 pages
R Data Types and Plotting Techniques
No ratings yet
R Data Types and Plotting Techniques
9 pages
R Programming for Data Analysis Guide
No ratings yet
R Programming for Data Analysis Guide
31 pages
Tutorial-1 - Handling Data in R
No ratings yet
Tutorial-1 - Handling Data in R
5 pages
Data Science Techniques Using R
No ratings yet
Data Science Techniques Using R
38 pages
Exploring the Iris Dataset in R
100% (1)
Exploring the Iris Dataset in R
1 page
Data Presentation and Visualization in R
No ratings yet
Data Presentation and Visualization in R
18 pages
Graph Plotting Techniques in R
No ratings yet
Graph Plotting Techniques in R
12 pages
Data Visualization with ggplot2 in R
No ratings yet
Data Visualization with ggplot2 in R
31 pages
Bar Chart of MPG by Cylinder Count
No ratings yet
Bar Chart of MPG by Cylinder Count
34 pages
Data Visualization with ggplot2 in R
No ratings yet
Data Visualization with ggplot2 in R
17 pages
R Data Analytics and Visualization Guide
No ratings yet
R Data Analytics and Visualization Guide
28 pages
Iris Dataset Analysis in R
No ratings yet
Iris Dataset Analysis in R
3 pages
R For Data Science Overview
No ratings yet
R For Data Science Overview
1 page
Download and Install R and RStudio
No ratings yet
Download and Install R and RStudio
30 pages
Data Visualization Techniques in R
No ratings yet
Data Visualization Techniques in R
45 pages
R Data Analysis Basics and Techniques
No ratings yet
R Data Analysis Basics and Techniques
78 pages
AD8502 Data Exploration Lab Manual
No ratings yet
AD8502 Data Exploration Lab Manual
29 pages
R Studio Lab: Data Analysis Guide
No ratings yet
R Studio Lab: Data Analysis Guide
3 pages
Data Visualization with ggplot2
No ratings yet
Data Visualization with ggplot2
22 pages
R Data Visualization Techniques
No ratings yet
R Data Visualization Techniques
28 pages
R Scripts for Data Analysis Techniques
No ratings yet
R Scripts for Data Analysis Techniques
3 pages
Assignment DADS301 MBA 3
No ratings yet
Assignment DADS301 MBA 3
17 pages
R Data Visualization Techniques
No ratings yet
R Data Visualization Techniques
14 pages
DV Lab Manual - r23 (23ad5l02)
No ratings yet
DV Lab Manual - r23 (23ad5l02)
41 pages
Data Manipulation in Watson Studio
No ratings yet
Data Manipulation in Watson Studio
58 pages
R Programming Unit 2
No ratings yet
R Programming Unit 2
9 pages
Descriptive Statistics with R: Data Analysis
100% (1)
Descriptive Statistics with R: Data Analysis
24 pages
Installing R and RStudio on Windows
No ratings yet
Installing R and RStudio on Windows
110 pages
Stats Practical - 1
No ratings yet
Stats Practical - 1
12 pages
Task 11: Write An R Script To Demonstrate R Objects
No ratings yet
Task 11: Write An R Script To Demonstrate R Objects
53 pages
R Programming for Statistics & Visualization
No ratings yet
R Programming for Statistics & Visualization
19 pages
Data Manipulation Techniques in R
No ratings yet
Data Manipulation Techniques in R
29 pages
EAP Unit 1
No ratings yet
EAP Unit 1
12 pages
R Basics for Data Analysis and Visualization
No ratings yet
R Basics for Data Analysis and Visualization
4 pages
Creating Histograms in R
No ratings yet
Creating Histograms in R
32 pages
Data Exploration and Analysis Techniques
No ratings yet
Data Exploration and Analysis Techniques
23 pages
R Script for Data Import, Export & Visualization
No ratings yet
R Script for Data Import, Export & Visualization
57 pages
R Data Analysis and Visualization Guide
No ratings yet
R Data Analysis and Visualization Guide
4 pages
Descriptive Statistics in R Programming
No ratings yet
Descriptive Statistics in R Programming
11 pages
Data Science Practical Completion
No ratings yet
Data Science Practical Completion
31 pages
R for Basic Statistical Analysis
No ratings yet
R for Basic Statistical Analysis
38 pages
Chapter 1
No ratings yet
Chapter 1
30 pages
Graphics in R: Essential Packages and Plots
No ratings yet
Graphics in R: Essential Packages and Plots
51 pages
ANOVA Analysis with R Programming
No ratings yet
ANOVA Analysis with R Programming
32 pages
R Programming Data Analytics Manual
No ratings yet
R Programming Data Analytics Manual
38 pages
Exploratory vs Confirmatory Data Analysis
100% (1)
Exploratory vs Confirmatory Data Analysis
48 pages
Data Visualization Techniques in R
No ratings yet
Data Visualization Techniques in R
318 pages
R Data Set Creation and Analysis Guide
No ratings yet
R Data Set Creation and Analysis Guide
2 pages
PCA and Factor Analysis in R
No ratings yet
PCA and Factor Analysis in R
8 pages
R Programming Cheat Sheet Guide
No ratings yet
R Programming Cheat Sheet Guide
7 pages
R Class 5: Data Visualization Techniques
No ratings yet
R Class 5: Data Visualization Techniques
5 pages
Potassium Dichromate Safety Data Sheet
100% (1)
Potassium Dichromate Safety Data Sheet
7 pages
Non-Balanced Binary Tree Query
No ratings yet
Non-Balanced Binary Tree Query
4 pages
Unix Shell Programming Lab Manual
No ratings yet
Unix Shell Programming Lab Manual
28 pages
Digital Scale User Manual
No ratings yet
Digital Scale User Manual
2 pages
The Lighthouse at The Edge of Winter
No ratings yet
The Lighthouse at The Edge of Winter
9 pages
Compensatory vs Non-Compensatory Decisions
No ratings yet
Compensatory vs Non-Compensatory Decisions
11 pages
Best CV Format for Ethiopian Engineers
No ratings yet
Best CV Format for Ethiopian Engineers
2 pages
Edison Fuse Links Catalog Ca132008en
No ratings yet
Edison Fuse Links Catalog Ca132008en
12 pages
Understanding Major Scales for Guitar
100% (2)
Understanding Major Scales for Guitar
3 pages
Understanding Life Cycle Costing
No ratings yet
Understanding Life Cycle Costing
12 pages
Environmental Conservation Strategies
No ratings yet
Environmental Conservation Strategies
7 pages
AI-Driven Gaming Engine Development
No ratings yet
AI-Driven Gaming Engine Development
12 pages
EDAC Exam Sample Questions Guide
No ratings yet
EDAC Exam Sample Questions Guide
8 pages
Weekly Chartering Report: Week 46
No ratings yet
Weekly Chartering Report: Week 46
5 pages
Bio-Medical Workshop Remodeling Report
No ratings yet
Bio-Medical Workshop Remodeling Report
21 pages
BTX Trunking System Overview and Benefits
No ratings yet
BTX Trunking System Overview and Benefits
8 pages
Postnatal Exercise Class Overview
100% (1)
Postnatal Exercise Class Overview
13 pages
Understanding Business Ethics Principles
No ratings yet
Understanding Business Ethics Principles
7 pages
Supply Chain Management at Vijaya Dairy
0% (1)
Supply Chain Management at Vijaya Dairy
49 pages
Tirumala Tirupati Credit Society List
No ratings yet
Tirumala Tirupati Credit Society List
18 pages
HFO Storage Tanks: Types and Standards
No ratings yet
HFO Storage Tanks: Types and Standards
19 pages
Artist Relations Career Experience Guide
No ratings yet
Artist Relations Career Experience Guide
4 pages
B503 Steel Mesh Specifications
No ratings yet
B503 Steel Mesh Specifications
1 page
Limiting and Excess Reactants Explained
No ratings yet
Limiting and Excess Reactants Explained
8 pages
Ater Chillers: Euro Chiller
0% (1)
Ater Chillers: Euro Chiller
8 pages
Yamaha AL115FX Parts Catalogue
No ratings yet
Yamaha AL115FX Parts Catalogue
54 pages
Maximize Bifacial Solar Efficiency with GEOLUX
No ratings yet
Maximize Bifacial Solar Efficiency with GEOLUX
8 pages
PhD Publication Criteria at SR University
No ratings yet
PhD Publication Criteria at SR University
1 page
أنواع مخارج الكهرباء والقواطع الكهربائية
No ratings yet
أنواع مخارج الكهرباء والقواطع الكهربائية
15 pages
High-Performance Centrifuge Solutions
No ratings yet
High-Performance Centrifuge Solutions
2 pages

R Data Analysis Lab: Iris & mtcars Datasets

Uploaded by

R Data Analysis Lab: Iris & mtcars Datasets

Uploaded by

WEEK 2 LAB EXERCISE – Exploring built in datasets

Dataset: Iris dataset

Part B — Perform basic manipulations - Select, Filter, Sort

setosa_big <- subset(iris, Species == "setosa" & [Link] > 5)

# Show top 5 rows and first two columns

iris$SepalLenCat <- cut (

# Mean [Link] per Species

Part D — Quick Visuals (base R)

boxplot([Link] ~ Species, data = iris, # Formula: y ~ group

plot(iris$[Link], iris$[Link], # Scatter: x then y

#load the dataset

2. List down the column names of the mtcars dataset

3. Identify the data types for all the columns

Part B — Checking the data distribution

6. Plot a grouped boxplot. What is a boxplot used for?

7. Plot a scatterplot of hp and mpg. Explain the relationship between the 2

Part F — Data Wrangling (Base R: New Variables, Cross-Tabs, Reshape)

1. Create a new variable called mpg_band

The new variable will have values as defined below

You might also like