0% found this document useful (0 votes)

6 views36 pages

Data Structures in R

The document provides an overview of data structures in R, focusing on arrays, matrices, data frames, and factors. It includes syntax for creating and manipulating these structures, as well as handling missing values and performing data imputation. Additionally, it outlines exercises for practical application of the concepts discussed.

Uploaded by

ruqayyah1530

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views36 pages

Data Structures in R

Uploaded by

ruqayyah1530

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Data structures in R

Arrays

• Multi-dimensional data structures (unlike vectors which are 1D)

• Store elements of the same data type
• Built on top of vectors with dimension attribute
• Can be 1D, 2D (matrix), 3D, or higher dimensions
• Useful for organizing complex datasets
Arrays

• Single dimension Arrays

a =c(10,20,30,40,50)
arr =array(a)
Print(class(arr)) # array
Print(a)
[1] 10 20 30 40 50 # output
Arrays

Multi dimensional Arrays

Syntax:
array(data, dim = c(nrow, ncol, narray))
a = c(10, 20, 30, 40, 50, 60)
n = array(a, dim = c(2, 2, 3))
print(n)
Arrays

• n=array(a,dim=c(2,2,3))
print(n[2, 1, 1]) # Single element row 2 colum 1 layer 1 #20
print(n[2 ,,1]) # entire 2nd row [1] 20 40
print(n[, c(1,2), 3]) # All rows, Col 1-2, Array
Arrays

a[row,column,layer]
a=array(c(10,20,30,40,50,60),dim=c(2,2,1))
b=array(c(10,20,30,40,50,60),dim=c(2,2,1))
Apply()
Apply( array_name, margin ,function)

res=apply(a,2,sum)
# 30 70 margin 1 for row 2 for columns
Arrays

• Using for loop to iterate through array elements:

for(i in a) { print(i) }
Search in Array
> 20 %in% a
• [1] TRUE
Matrices
• Matrices in R are created using the matrix() function with three key
parameters:
• data (a vector), nrow (number of rows), and ncol (number of columns)
• For example, m <- matrix(c(10,20,30,40,50,60), nrow=3,
ncol=2,byrow=FALSE)
• fills the matrix column-wise by default, resulting in:
• [,1] [,2]
• [1,] 10 40
• [2,] 20 50
• [3,] 30 60
Matrices

• Accessing elements in matrix

• Use indexing m[row, col] for single elements :m[2,1] [1] 20.
• Access whole rows with m[row, ] print(m[1,]) [1] 10 40
• columns with m[, col], print(m[,1])
• [1] 10 20 30
• multiple rows via m[c(1,2), ]
• multiple columns via m[, c(1,2)].
Matrices

multiple rows via m[c(1,2), ]

print(m[c(1,2),])
• [,1] [,2]
• [1,] 10 40
• [2,] 20 50
• multiple columns via m[, c(1,2)].
Matrices

Operation in matrix
Adding rows and columns in matrix
In order to add rows in matrix we use
rbind(matrix_name,data)
n=rbind(m,c(70,80))
print(n)
Matrices

Operation in matrix
To add rows column wise
Cbind(matrix_name, data)
• Note: the arguments to rbind() should have the same number of columns and
the arguments to cbind() should have the same number of rows.
• Since cbind() and rbind() work on vectors, you can use them to construct
matrices from vectors on a row by row, or column by column basis.
Matrices
• Deleting columns and rows in a matrix
• Single element –matrixname[-c(index)]
• Single row -matrix_name[ -(row_index),]
• Single colum
• MatrixName[,-c(column_num)]
• Entire row and column – matrix_name[-c(row_index),-
c(column_index)
MATRIX
• searching an element in-membership operator element %in%
• 10 %in% m [TRUE]
• dimension of matirx
• length of a matrix print(length(matrix_name))
• finding number of rows and no of columns
• nrow(matrix_namer)- return number of rows
• ncol(matrix_name)-return number of columns
MATRIX
MATRIX
matrix

• looping in matrix_elements
• for(row in 1:nrow(m))
• {for(col in 1:ncol(m))
•}
Data frame

• . A data frame is a 2-D data structure with rows (records) and columns
(variables)
• Each column represents one feature, each row represents one observation.
• Unlike a matrix, columns can have different data types (numeric, character,
factor, etc.)
• Internally, a data frame is a list of equal-length vectors, where each vector is
a column.
DATA FRAME

• Creation of dataframe
• [Link](col_name1,col_name2,col_name3)
a <- c(1,2,3,4,5)
b <- c("R", "Is", "Fun!","Let's","Learn")
c <- c(TRUE,FALSE,TRUE,TRUE,FALSE)
my_frame <- [Link](a,b,c)
DATA FRAME

ACCESSING DATAFRAME
dataframe[index] – return columns with specified index
dataframe[c(col1,col2,…)] –return multiple columns having given
index
dataframe[[“col_name”]] – return column having given name
or
Datafram$ col_name
Data Frame

• Dataframe$col_name[index]
• –return element having index in
• specifiedcolumn
DATA FRAME
DATA FRAME

• Summary(dataframe)
• Gives a statistical overview of each column (min, max, mean for
numeric; counts for factors).
• length(data_frame)
• Dim(data_frame)
• nrow(data_frame)
• ncolumn(data_frame)
Factor

A factor is a way of categorizing or labeling data that falls into different

groups or categories. Think of it like labels or tags for data points.
• gender_vector <- c(rep("male",10),
rep("female",15)) # Create a character variable

gender_factor <- factor(gender_vector)

• print(gender_factor) # male , female
Factor

•
Factor

• data <- rep(c("very low", "low", "medium", "high", "very high"), 5)

• dat_factor <- factor(dat,

• levels=c("very low", "low", "medium", "high", "very high"),
• ordered=TRUE)

• print(dat_factor)
Handling missing values

• data <- [Link]("C:/Users/madhu/Downloads/titanic/[Link]")

reads a CSV (comma-separated values) file from disk and loads it into R
as a data frame.
• #Dataset dimensions and structure
• dim(data) -dim() returns the dimensions of the dataset: number of rows
and number of columns
• str(data) –str() displays the internal structure of the dataset, including
variable types, dimensions, and sample values.
Handling missing values
# Check if any missing values exist
anyNA(data)
#Identifies the exact row and column positions of all missing values (NA) in the dataset.
• idx <- which([Link](data), [Link] = TRUE)
#[Link]()
• Definition
• Checks whether values are missing (NA).
• What it returns
• TRUE → value is NA
• FALSE → value is not NA
Handling missing values
[Link]() -[Link](data$Age)
• Definition
• Checks whether an object itself is NULL (i.e., does not exist).
[Link]()- new_data <- [Link](data)
• Definition
• Removes all rows that contain at least one missing value (NA).
[Link]()-[Link](data)
• Definition
• Identifies rows with no missing values across all columns.
Handling missing values

• table(data$Embarked)
• Counts the frequency of unique values.
Numeric Imputation and categorical imputation
• Definition
• Replacing missing numeric values with the median of the variable.
• Example
• data$Age[[Link](data$Age)] <- median(data$Age, [Link] = TRUE)
• data$Embarked[[Link](data$Embarked)] <- "S"
Exercise

• Q1. Data Loading & Inspection

• Write R code to:
• Load the Titanic dataset from a CSV file
• Display the number of rows and columns
• Display the internal structure of the dataset
Exercise

Q2. Missing Value Detection & Summary

• Write R code to:
• Check whether missing values exist in the dataset
• Count missing values for each column
• Compute the percentage of missing values
• Create a summary data frame with variable name, missing count, and
missing percentage
Exercise

• Q3. Locating Missing Values & Data Structures

• Write R code to:
• Identify the row and column indices of all missing values
• Display the first six such indices
• Convert the index object into a data frame
• Add a column with corresponding variable names
Exercise

Q4. Logical Matrix, Matrix Indexing & Array

• Write R code to:
• Create a logical matrix indicating missing values
• Extract a 5×5 subset from this matrix
• Convert the logical matrix into an array
Exercise

Q5. Handling Missing Values

•Write R code to:
•Replace missing values in a numeric column using median
imputation
•Randomly introduce missing values into a categorical
column
•Replace missing categorical values using mode imputation
Exercise

Q6. Final Cleaning & Validation

•Write R code to:
•Remove rows containing any remaining missing values
•Verify that all rows in the final dataset are complete

Essential R Data Structures Explained
No ratings yet
Essential R Data Structures Explained
18 pages
R Data Structures Explained
No ratings yet
R Data Structures Explained
6 pages
Data Structures in R: Matrices, Lists, Arrays
No ratings yet
Data Structures in R: Matrices, Lists, Arrays
46 pages
Creating R Matrices from Vectors
No ratings yet
Creating R Matrices from Vectors
13 pages
Data Structures in R: Vectors to Data Frames
No ratings yet
Data Structures in R: Vectors to Data Frames
26 pages
Zelig For R Cheat Sheet: Plots Vectors
No ratings yet
Zelig For R Cheat Sheet: Plots Vectors
2 pages
Data Classes and Structures in R
No ratings yet
Data Classes and Structures in R
23 pages
Understanding Factors, Lists, and Data Frames in R
No ratings yet
Understanding Factors, Lists, and Data Frames in R
9 pages
R Data Types and Structures Overview
No ratings yet
R Data Types and Structures Overview
16 pages
R Programming Basics and Data Structures
No ratings yet
R Programming Basics and Data Structures
27 pages
Basic R Programming Operations Guide
No ratings yet
Basic R Programming Operations Guide
45 pages
R Programming: Vectors, Lists, and Data Structures
No ratings yet
R Programming: Vectors, Lists, and Data Structures
9 pages
R Data Structures: Matrices, Arrays, Data Frames
No ratings yet
R Data Structures: Matrices, Arrays, Data Frames
33 pages
R Programming: Data Structures & Basics
No ratings yet
R Programming: Data Structures & Basics
27 pages
R Programming: Arrays & Data Frames Guide
No ratings yet
R Programming: Arrays & Data Frames Guide
36 pages
R Notes Prof. Bhupendra Singh
No ratings yet
R Notes Prof. Bhupendra Singh
69 pages
Data Structures in R Programming
No ratings yet
Data Structures in R Programming
5 pages
Understanding Data Frames in R
No ratings yet
Understanding Data Frames in R
13 pages
Understanding R Objects and Types
No ratings yet
Understanding R Objects and Types
10 pages
R Data Structures and Analysis Basics
No ratings yet
R Data Structures and Analysis Basics
7 pages
Operations On Matrix Factors Frame
No ratings yet
Operations On Matrix Factors Frame
13 pages
Understanding R Data Structures
No ratings yet
Understanding R Data Structures
14 pages
Data Science Training Overview
No ratings yet
Data Science Training Overview
188 pages
R Programming: © 2016 SMART Training Resources Pvt. LTD
No ratings yet
R Programming: © 2016 SMART Training Resources Pvt. LTD
28 pages
R Data Structures: Vectors, Lists, Matrices, Dataframes
No ratings yet
R Data Structures: Vectors, Lists, Matrices, Dataframes
17 pages
Matrix Operations in R
No ratings yet
Matrix Operations in R
19 pages
Understanding R Data Structures
No ratings yet
Understanding R Data Structures
40 pages
Element-wise Operations in R Vectors
No ratings yet
Element-wise Operations in R Vectors
6 pages
R Data Frames and Functions Overview
No ratings yet
R Data Frames and Functions Overview
15 pages
R Programming for Data Analytics Basics
No ratings yet
R Programming for Data Analytics Basics
72 pages
R Matrices: Creation and Operations
No ratings yet
R Matrices: Creation and Operations
73 pages
Unit 3
No ratings yet
Unit 3
13 pages
Creating and Manipulating Matrices in R
No ratings yet
Creating and Manipulating Matrices in R
35 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
21 pages
R Basics: Matrices, Lists, and Arrays
No ratings yet
R Basics: Matrices, Lists, and Arrays
42 pages
Data Structures in R Programming Guide
No ratings yet
Data Structures in R Programming Guide
5 pages
R Data Structures and Manipulation Guide
No ratings yet
R Data Structures and Manipulation Guide
15 pages
R Programming for Descriptive Analytics
No ratings yet
R Programming for Descriptive Analytics
27 pages
R Lists, Matrices, and Arrays Explained
No ratings yet
R Lists, Matrices, and Arrays Explained
6 pages
List and Matrix
No ratings yet
List and Matrix
24 pages
06 Module6 BE COMP ONLY DataAnalyticsWithR
No ratings yet
06 Module6 BE COMP ONLY DataAnalyticsWithR
81 pages
R Programming: Variables and Data Types
No ratings yet
R Programming: Variables and Data Types
16 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
29 pages
R Data Handling and Visualization Guide
No ratings yet
R Data Handling and Visualization Guide
63 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
13 pages
R Programming Reference Card
No ratings yet
R Programming Reference Card
2 pages
R Operations Reference Guide
100% (1)
R Operations Reference Guide
4 pages
R Matrix and List Operations Guide
No ratings yet
R Matrix and List Operations Guide
40 pages
R Data Structures: Data Frame vs Matrix
No ratings yet
R Data Structures: Data Frame vs Matrix
6 pages
R Programming for Data Analysis Basics
No ratings yet
R Programming for Data Analysis Basics
66 pages
R Programming Practical Guide
No ratings yet
R Programming Practical Guide
35 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
42 pages
R and R Studio Basics Guide
No ratings yet
R and R Studio Basics Guide
51 pages
R Data Analysis Basics for Econometrics
No ratings yet
R Data Analysis Basics for Econometrics
7 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
42 pages
Array
No ratings yet
Array
4 pages
R Lists and Data Frames Explained
No ratings yet
R Lists and Data Frames Explained
19 pages
R Programming: Understanding Data Types
No ratings yet
R Programming: Understanding Data Types
88 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
101 pages
Common Fixed Points in Metric Spaces
No ratings yet
Common Fixed Points in Metric Spaces
7 pages
Three-Phase Boost Converter Fault Analysis
No ratings yet
Three-Phase Boost Converter Fault Analysis
5 pages
Revised Toolkit for Urban Mobility Planning
No ratings yet
Revised Toolkit for Urban Mobility Planning
138 pages
Stirling Gardner Sales Conversion Analysis
No ratings yet
Stirling Gardner Sales Conversion Analysis
16 pages
Data Clustering: Theory and Algorithms
No ratings yet
Data Clustering: Theory and Algorithms
9 pages
Lesson Plan: Culture, Society, Politics
No ratings yet
Lesson Plan: Culture, Society, Politics
6 pages
Technical and Scientific Writing Syllabus
No ratings yet
Technical and Scientific Writing Syllabus
4 pages
S-5.6 C - Pilot Card 12 - 2021
No ratings yet
S-5.6 C - Pilot Card 12 - 2021
2 pages
Understanding Atmospheric Humidity in Agriculture
No ratings yet
Understanding Atmospheric Humidity in Agriculture
11 pages
C# Login Form with User Validation
No ratings yet
C# Login Form with User Validation
3 pages
Citation and Referencing Guide
No ratings yet
Citation and Referencing Guide
53 pages
Fulton Gas Fired Steam Boiler Manual
No ratings yet
Fulton Gas Fired Steam Boiler Manual
74 pages
Non-linear Effects in Josephson Junctions
No ratings yet
Non-linear Effects in Josephson Junctions
18 pages
Race and Gender in Early Modern England
No ratings yet
Race and Gender in Early Modern England
25 pages
Paper Chromatography MCQs and Concepts
No ratings yet
Paper Chromatography MCQs and Concepts
8 pages
Grade 9 Science Lesson Plan: Volcanoes & Climate
No ratings yet
Grade 9 Science Lesson Plan: Volcanoes & Climate
19 pages
Five-Digit Number Programming Tasks
No ratings yet
Five-Digit Number Programming Tasks
5 pages
Understanding Constellations and Visibility
No ratings yet
Understanding Constellations and Visibility
4 pages
Thinking Like an Architect Course Overview
No ratings yet
Thinking Like an Architect Course Overview
3 pages
Basics of Path Testing in Software Engineering
No ratings yet
Basics of Path Testing in Software Engineering
9 pages
Expert Bookkeeping Services by Abegail Gallardo
No ratings yet
Expert Bookkeeping Services by Abegail Gallardo
22 pages
Carer NK Series Forklift Overview
No ratings yet
Carer NK Series Forklift Overview
5 pages
Surds and Indices Exam Questions
No ratings yet
Surds and Indices Exam Questions
36 pages
Red Hat Linux 9: Text File Management Lab
No ratings yet
Red Hat Linux 9: Text File Management Lab
13 pages
4MA1 2022 Jun 2H 2
100% (1)
4MA1 2022 Jun 2H 2
24 pages
Powerbridge Installation and Wiring Guide
No ratings yet
Powerbridge Installation and Wiring Guide
1 page
BBC Newsletter October 2024
No ratings yet
BBC Newsletter October 2024
2 pages
Chrysler CAN-C Network Issue - iATN
No ratings yet
Chrysler CAN-C Network Issue - iATN
3 pages
Interior Design Quotation for Home
100% (1)
Interior Design Quotation for Home
3 pages
Understanding HRD Climate and Culture
67% (12)
Understanding HRD Climate and Culture
24 pages

Data Structures in R

Uploaded by

Data Structures in R

Uploaded by

Data structures in R

• Multi-dimensional data structures (unlike vectors which are 1D)

• Single dimension Arrays

Multi dimensional Arrays

• Using for loop to iterate through array elements:

• Accessing elements in matrix

multiple rows via m[c(1,2), ]

A factor is a way of categorizing or labeling data that falls into different

gender_factor <- factor(gender_vector)

• data <- rep(c("very low", "low", "medium", "high", "very high"), 5)

• dat_factor <- factor(dat,

• data <- [Link]("C:/Users/madhu/Downloads/titanic/[Link]")

• Q1. Data Loading & Inspection

Q2. Missing Value Detection & Summary

• Q3. Locating Missing Values & Data Structures

Q4. Logical Matrix, Matrix Indexing & Array

Q5. Handling Missing Values

Q6. Final Cleaning & Validation

You might also like