0% found this document useful (0 votes)

5 views13 pages

7 Mark Answers Data Analytics

The document provides an overview of data science, its applications in business, and the differences between data analytics and data analysis. It covers various types of analytics, the concept of big data, and the importance of data preparation, visualization, and handling missing data. Additionally, it discusses R programming, regression models, textual data analysis, and key concepts such as correlation, multicollinearity, and the significance of statistical coefficients.

Uploaded by

riya1203m

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views13 pages

7 Mark Answers Data Analytics

Uploaded by

riya1203m

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

7-Mark Answers: Data Analytics & R Questions

Concept of Data Science and its use in Business

Data Science is the process of collecting, organizing, analyzing, and interpreting data to
extract useful insights. It combines statistics, programming, machine learning, and business
knowledge.

Uses in Business:
1. Helps in decision-making using data.
2. Improves customer experience through recommendations.
3. Predicts sales and market trends.
4. Detects fraud in banking and finance.
5. Optimizes inventory and supply chain.
6. Supports targeted marketing.
7. Increases efficiency and profit.

Example: Amazon uses data science to recommend products to customers.

Data Analytics vs Data Analysis

Data Analysis focuses on examining data to find conclusions. Data Analytics is broader and
includes data collection, processing, prediction, and decision-making.

Differences:
1. Data Analysis studies past data.
2. Data Analytics uses tools and models for future prediction.
3. Analysis is a part of Analytics.
4. Analysis gives insights; Analytics supports business strategy.
5. Analytics includes machine learning and forecasting.

Example: Sales report checking is analysis, while predicting future sales is analytics.

Types of Analytics and real-life uses

1. Descriptive Analytics – explains what happened.
Example: Monthly sales reports.

2. Diagnostic Analytics – explains why it happened.

Example: Finding reasons for decrease in sales.

3. Predictive Analytics – predicts future outcomes.

Example: Weather forecasting or stock prediction.

4. Prescriptive Analytics – suggests actions.

Example: Google Maps suggesting fastest route.

These analytics help businesses make better decisions.

Define Big Data, characteristics, applications and challenges

Big Data refers to extremely large and complex data that cannot be managed using
traditional methods.

Characteristics (5Vs):
1. Volume – huge amount of data.
2. Velocity – fast speed of generation.
3. Variety – different data types.
4. Veracity – data accuracy.
5. Value – usefulness of data.

Applications:
- Healthcare
- Banking
- E-commerce
- Social media
- Education

Challenges:
- Data security
- Storage issues
- Data quality
- Processing speed
- Privacy concerns

How does classification of analytics help in decision-making?

Classification of analytics helps organizations understand past performance, identify
problems, predict future trends, and choose the best actions.

1. Descriptive analytics gives past information.

2. Diagnostic analytics identifies causes.
3. Predictive analytics forecasts future outcomes.
4. Prescriptive analytics recommends solutions.

Benefits:
- Better planning
- Faster decisions
- Reduced risks
- Improved business performance
Example: Companies predict customer demand before launching products.

Process of data preparation and cleaning in spreadsheet

Data preparation and cleaning means organizing and correcting raw data before analysis.

Steps:
1. Remove duplicate records.
2. Handle missing values.
3. Correct spelling and formatting errors.
4. Standardize data format.
5. Remove unnecessary columns.
6. Check outliers.
7. Validate data accuracy.

Importance:
- Improves data quality.
- Gives accurate results.
- Reduces errors in analysis.
- Saves time during reporting.

How can outliers be identified in a dataset using spreadsheet?

Outliers are unusual values that are very different from other data.

Methods:
1. Sort data to find extreme values.
2. Use conditional formatting.
3. Create box plots or charts.
4. Use formulas like mean and standard deviation.
5. Apply IQR method.

Steps in spreadsheet:
- Calculate Q1 and Q3.
- Find IQR = Q3 – Q1.
- Values below Q1–1.5(IQR) or above Q3+1.5(IQR) are outliers.

Outlier detection improves accuracy of analysis.

Use of Pivot Table and Pivot Charts

Pivot Tables summarize large data quickly.

Uses:
1. Group data easily.
2. Calculate totals, averages, and counts.
3. Filter information.
4. Compare categories.
5. Create reports quickly.

Pivot Charts visually represent Pivot Table data using graphs.

Benefits:
- Easy visualization
- Better understanding
- Faster analysis
- Supports decision-making

Handling missing data in spreadsheet

Missing data refers to blank or unavailable values in a dataset.

Methods:
1. Remove incomplete rows.
2. Replace with mean or median.
3. Use previous values.
4. Fill manually if possible.
5. Use formulas or interpolation.

Implications:
- Incorrect analysis
- Biased results
- Reduced accuracy
- Wrong business decisions

Proper handling improves data quality.

Interactive dashboard in spreadsheet

An interactive dashboard is a visual display of key information using charts, tables, and
filters.

Steps:
1. Organize data.
2. Create Pivot Tables.
3. Add charts and graphs.
4. Use slicers and filters.
5. Apply conditional formatting.
6. Design clear layout.

Benefits:
- Real-time insights
- Easy monitoring
- Better decision-making
- User-friendly visualization

Role of scatter plots, line charts and histograms

Scatter Plot:
Shows relationship between two variables.

Line Chart:
Shows trends over time.

Histogram:
Shows frequency distribution of data.

Importance:
- Identifies patterns
- Detects trends
- Helps comparison
- Makes data easy to understand
- Supports analysis and forecasting

Techniques available in spreadsheet for data visualization

1. Bar charts
2. Pie charts
3. Line charts
4. Histograms
5. Scatter plots
6. Pivot charts
7. Conditional formatting

Importance:
- Improves understanding
- Highlights trends
- Detects errors
- Helps accurate reporting
- Supports decision-making

What is R? How do we install an R package?

R is a programming language used for statistics, data analysis, and visualization.

Features:
- Open-source
- Statistical computing
- Graphical tools
- Data analysis support

Installing package:
Use command:
[Link]("package_name")

Loading package:
library(package_name)

Example:
[Link]("ggplot2")

Features of R
1. Open-source software
2. Supports statistical analysis
3. Powerful data visualization
4. Large package library
5. Cross-platform support
6. Supports machine learning
7. Easy data manipulation

R is widely used in research and business analytics.

Difference between setwd() and getwd()

setwd():
Used to set/change the current working directory.

Example:
setwd("C:/Data")

getwd():
Used to display the current working directory.

Example:
getwd()

Difference:
setwd() changes location, while getwd() shows location.

How do you remove NA values from a data frame?

NA values represent missing data in R.

Methods:
1. [Link](dataframe)
2. [Link]()
3. Replace NA with mean/median.

Example:
data <- [Link](data)

Benefits:
- Improves accuracy
- Prevents calculation errors
- Makes analysis reliable

Logical operators in R
Logical operators compare conditions.

Operators:
1. & → AND
2. | → OR
3. ! → NOT
4. == → Equal to
5. != → Not equal to
6. >, <, >=, <=

Example:
x > 5 & y < 10

Used in filtering and decision-making.

What does a histogram represent?

A histogram represents frequency distribution of continuous data.

Features:
- Bars touch each other.
- Shows spread of data.
- Displays patterns and distribution.

Uses:
- Detects skewness
- Identifies outliers
- Understands data distribution

Example: Marks distribution of students.

Difference between bar chart and histogram
Bar Chart:
- Used for categorical data.
- Bars are separated.
- Compares categories.

Histogram:
- Used for continuous data.
- Bars touch each other.
- Shows frequency distribution.

Example:
Bar chart for subjects, histogram for marks distribution.

When is a line graph most appropriate?

A line graph is best used to show trends and changes over time.

Uses:
- Stock prices
- Temperature changes
- Monthly sales
- Population growth

Advantages:
- Easy trend analysis
- Shows increase/decrease clearly
- Useful for forecasting

Correlation vs Covariance
Correlation measures strength and direction of relationship between variables.

Covariance measures how two variables vary together.

Differences:
1. Correlation ranges from -1 to +1.
2. Covariance has no fixed range.
3. Correlation is standardized.
4. Covariance depends on units.

Correlation is easier to interpret.

Linear Regression Model
Linear Regression shows relationship between dependent and independent variables.

Equation:
Y = a + bX

Where:
Y = dependent variable
X = independent variable
a = intercept
b = slope

Uses:
- Sales prediction
- Trend analysis
- Forecasting

Advantages:
- Simple
- Easy interpretation
- Useful for prediction

Multiple Regression
Multiple Regression uses two or more independent variables to predict one dependent
variable.

Equation:
Y = a + b1X1 + b2X2 + ...

Example:
Predicting house price using size, location, and age.

Advantages:
- Better accuracy
- Handles multiple factors
- Useful in business forecasting

Multicollinearity in Regression
Multicollinearity occurs when independent variables are highly correlated.

Effects:
- Reduces accuracy
- Difficult coefficient interpretation
- Increases errors

Detection:
- Correlation matrix
- VIF (Variance Inflation Factor)

Solution:
- Remove related variables
- Use feature selection

Heteroscedasticity in Regression
Heteroscedasticity occurs when error variance is not constant.

Effects:
- Unreliable predictions
- Incorrect statistical tests

Causes:
- Outliers
- Improper data

Detection:
- Residual plots
- Statistical tests

Solutions:
- Transform data
- Remove outliers
- Use weighted regression

Textual Data Analysis

Textual Data Analysis means analyzing text data to extract useful information.

Steps:
1. Data collection
2. Cleaning text
3. Tokenization
4. Sentiment analysis
5. Interpretation

Applications:
- Social media analysis
- Customer feedback
- Review analysis
Role of Residuals in Regression
Residuals are differences between actual and predicted values.

Formula:
Residual = Actual – Predicted

Importance:
- Measures prediction error
- Checks model accuracy
- Detects outliers
- Helps validate regression assumptions

Good models have small residuals.

Purpose of Confidence Interval in Regression

Confidence Interval gives a range within which the true parameter value is expected.

Importance:
- Measures reliability
- Shows uncertainty
- Helps statistical inference

Example:
95% confidence interval means results are expected to fall within range with 95%
confidence.

Predictive Interval in Regression

Prediction Interval estimates the range for future observations.

Features:
- Wider than confidence interval
- Includes uncertainty in prediction

Uses:
- Forecasting
- Future value estimation

Example:
Predicting next month sales range.

Importance of checking statistical significance of coefficients

Statistical significance checks whether variables truly affect the outcome.
Methods:
- p-value
- t-test

Importance:
1. Identifies useful variables.
2. Improves model accuracy.
3. Removes unnecessary variables.
4. Supports reliable conclusions.

Usually p-value < 0.05 indicates significance.

Goal of Textual Data Analysis

Goals:
1. Extract useful information from text.
2. Identify sentiments and opinions.
3. Classify documents.
4. Detect patterns and trends.
5. Support business decisions.

Applications:
- Chatbots
- Review analysis
- Social media monitoring

Difference between Structured and Unstructured Data

Structured Data:
- Organized in rows and columns.
- Easy to store and analyze.
Example: Excel tables.

Unstructured Data:
- No fixed format.
- Difficult to process.
Example: Images, videos, emails.

Structured data is easier for analysis.

Tokenization in Text Analysis

Tokenization is the process of breaking text into smaller units called tokens.

Tokens may be:

- Words
- Sentences
- Characters

Example:
“I love data science” → [I, love, data, science]

Importance:
- Text processing
- Sentiment analysis
- Machine learning

Text Mining, Text Categorization and Sentiment Analysis

Text Mining:
Extracting useful patterns from text data.

Text Categorization:
Classifying text into categories.

Sentiment Analysis:
Finding emotions/opinions from text.

Applications:
- Product review analysis
- Spam detection
- Social media monitoring
- Customer feedback analysis

Data Preparation for Predictive Analytics
No ratings yet
Data Preparation for Predictive Analytics
6 pages
Understanding Data Science and Analytics
No ratings yet
Understanding Data Science and Analytics
10 pages
Data Analysis: Process and Techniques
No ratings yet
Data Analysis: Process and Techniques
7 pages
Data Analytics Life Cycle Explained
No ratings yet
Data Analytics Life Cycle Explained
23 pages
DA Lab 1
No ratings yet
DA Lab 1
4 pages
Chapter 3
No ratings yet
Chapter 3
27 pages
Viva QA With Answers
No ratings yet
Viva QA With Answers
19 pages
BA Revision Notes-2
No ratings yet
BA Revision Notes-2
14 pages
BA Revision Notes
No ratings yet
BA Revision Notes
16 pages
Data Analysis for Business Insights
No ratings yet
Data Analysis for Business Insights
44 pages
Data Analysis Techniques Overview
No ratings yet
Data Analysis Techniques Overview
26 pages
Data Analysis: Techniques and Insights
No ratings yet
Data Analysis: Techniques and Insights
49 pages
Data Analytics Overview and Techniques
No ratings yet
Data Analytics Overview and Techniques
6 pages
Introduction to Data Analytics Basics
No ratings yet
Introduction to Data Analytics Basics
23 pages
Data Analytics: Types and Importance
No ratings yet
Data Analytics: Types and Importance
21 pages
Understanding Predictive Analytics Techniques
No ratings yet
Understanding Predictive Analytics Techniques
13 pages
VTU Exam Question Paper With Solution of 21AD62 Data Science and Its Applications July-2024-Rekha Penmatsa
No ratings yet
VTU Exam Question Paper With Solution of 21AD62 Data Science and Its Applications July-2024-Rekha Penmatsa
16 pages
Pre-Study Material For Data Analytics
No ratings yet
Pre-Study Material For Data Analytics
9 pages
Introduction to Data Analytics Basics
No ratings yet
Introduction to Data Analytics Basics
20 pages
Business Analytics Revision
No ratings yet
Business Analytics Revision
15 pages
Power BI Data Visualization Guide
No ratings yet
Power BI Data Visualization Guide
8 pages
Introduction to Data Analytics Concepts
No ratings yet
Introduction to Data Analytics Concepts
7 pages
Exploratory Data Analysis Techniques
No ratings yet
Exploratory Data Analysis Techniques
23 pages
Comparing Bias in Predictive Models
No ratings yet
Comparing Bias in Predictive Models
29 pages
Intro to Data Science and Excel Basics
No ratings yet
Intro to Data Science and Excel Basics
85 pages
GET305 Assignment1 Answers
No ratings yet
GET305 Assignment1 Answers
7 pages
Data Cleaning in Business Analytics
No ratings yet
Data Cleaning in Business Analytics
38 pages
Statistics for Managerial Decision-Making
No ratings yet
Statistics for Managerial Decision-Making
7 pages
Week 4: Data Analytics Class Agenda
No ratings yet
Week 4: Data Analytics Class Agenda
57 pages
EDA: Analyzing Data Patterns and Trends
No ratings yet
EDA: Analyzing Data Patterns and Trends
31 pages
Business Analytics and Decision-Making Insights
No ratings yet
Business Analytics and Decision-Making Insights
1 page
Data Science Analytics Overview
No ratings yet
Data Science Analytics Overview
8 pages
Data Analytics: From Fundamentals To Advanced: Authored By: Siddharth Vidyarthi
No ratings yet
Data Analytics: From Fundamentals To Advanced: Authored By: Siddharth Vidyarthi
40 pages
Data Visualization Fundamentals Guide
No ratings yet
Data Visualization Fundamentals Guide
13 pages
Data Cleaning and Exploration in Analytics
No ratings yet
Data Cleaning and Exploration in Analytics
37 pages
Notes Unit 4 Part 1 - 260423 - 133540
No ratings yet
Notes Unit 4 Part 1 - 260423 - 133540
11 pages
Exploratory Data Analysis in Research
No ratings yet
Exploratory Data Analysis in Research
32 pages
DST 102 QB01
No ratings yet
DST 102 QB01
16 pages
Understanding Regression and Data Analytics
No ratings yet
Understanding Regression and Data Analytics
2 pages
Data Analysis Fundamentals Overview
No ratings yet
Data Analysis Fundamentals Overview
17 pages
Comprehensive Guide to Data Analytics
No ratings yet
Comprehensive Guide to Data Analytics
8 pages
Comprehensive Data Analysis Guide
100% (1)
Comprehensive Data Analysis Guide
34 pages
Comprehensive Data Analysis Guide
No ratings yet
Comprehensive Data Analysis Guide
33 pages
Hypothesis Testing in Python Statsmodels
No ratings yet
Hypothesis Testing in Python Statsmodels
20 pages
Overview of Predictive Analytics
No ratings yet
Overview of Predictive Analytics
7 pages
Data Analysis Process in R
No ratings yet
Data Analysis Process in R
3 pages
Seven Key Data Relationships Explained
No ratings yet
Seven Key Data Relationships Explained
9 pages
Introduction to Data Analytics Overview
No ratings yet
Introduction to Data Analytics Overview
26 pages
Understanding Analytical Decision Making
No ratings yet
Understanding Analytical Decision Making
27 pages
Excel and R Data Analysis Techniques
No ratings yet
Excel and R Data Analysis Techniques
9 pages
R Programming for Data Analysis Functions
No ratings yet
R Programming for Data Analysis Functions
12 pages
1 - Unit1-Data Science Fundamentals
No ratings yet
1 - Unit1-Data Science Fundamentals
23 pages
Data Analysis vs. Data Analytics Explained
No ratings yet
Data Analysis vs. Data Analytics Explained
8 pages
Data Analysis Techniques and Methods
No ratings yet
Data Analysis Techniques and Methods
82 pages
Week 3 L1 Data Cleaning and EDA Spring2026
No ratings yet
Week 3 L1 Data Cleaning and EDA Spring2026
12 pages
Data Analytics Exam Guide: 5th Semester
No ratings yet
Data Analytics Exam Guide: 5th Semester
2 pages
Business Analytics and Descriptive Statistics
No ratings yet
Business Analytics and Descriptive Statistics
11 pages
Regression 2
No ratings yet
Regression 2
8 pages
FOI Questions On Bond Fundamentals
No ratings yet
FOI Questions On Bond Fundamentals
4 pages
FOI Questions On Valuation of Equity
No ratings yet
FOI Questions On Valuation of Equity
5 pages
Income Tax Depreciation Guidelines
No ratings yet
Income Tax Depreciation Guidelines
12 pages
Python Interview Questions for Networking
No ratings yet
Python Interview Questions for Networking
21 pages
Class 10 Computer Project Documentation
No ratings yet
Class 10 Computer Project Documentation
45 pages
Sonicos 3 Billion 4 TTT
No ratings yet
Sonicos 3 Billion 4 TTT
18 pages
Machine ECU Diagnostic Tools Guide
No ratings yet
Machine ECU Diagnostic Tools Guide
124 pages
Lux Intensity Measurement SOP
No ratings yet
Lux Intensity Measurement SOP
4 pages
Autosofted Auto Keyboard Presser v1.9
No ratings yet
Autosofted Auto Keyboard Presser v1.9
19 pages
CO2 Total Flooding System Overview
No ratings yet
CO2 Total Flooding System Overview
24 pages
Samsung PIM/PNM for AI Efficiency
No ratings yet
Samsung PIM/PNM for AI Efficiency
31 pages
PMP Mind Mapping Techniques Overview
No ratings yet
PMP Mind Mapping Techniques Overview
30 pages
Lacoste Facebook Ad Campaign Insights
No ratings yet
Lacoste Facebook Ad Campaign Insights
3 pages
ViewSonic ID2456 ID2456 24" Touch Monitor With MPP2.0 Active Pen - Datasheet - ViewSonic Global
No ratings yet
ViewSonic ID2456 ID2456 24" Touch Monitor With MPP2.0 Active Pen - Datasheet - ViewSonic Global
2 pages
Mobile Developer Resume Overview
No ratings yet
Mobile Developer Resume Overview
1 page
The Insiders Guide To Working With RFID - atlasRFIDstore
No ratings yet
The Insiders Guide To Working With RFID - atlasRFIDstore
184 pages
Building a Harmless C++ Virus
No ratings yet
Building a Harmless C++ Virus
8 pages
IoT Water Quality Monitoring System
No ratings yet
IoT Water Quality Monitoring System
6 pages
3GPP TS 29.010: Technical Specification
No ratings yet
3GPP TS 29.010: Technical Specification
145 pages
Solution Manual For Introduction To Information Systems 6th Edition Rainer Prince 1119108004 9781119108009 Download
100% (29)
Solution Manual For Introduction To Information Systems 6th Edition Rainer Prince 1119108004 9781119108009 Download
80 pages
Area Manager Store Visit Checklist
67% (6)
Area Manager Store Visit Checklist
2 pages
JavaScript & TypeScript in Visual Studio
No ratings yet
JavaScript & TypeScript in Visual Studio
168 pages
GDPR Compliance in Pharmacovigilance SOP
No ratings yet
GDPR Compliance in Pharmacovigilance SOP
2 pages
Senior Oracle Fusion Cloud Consultant Role
No ratings yet
Senior Oracle Fusion Cloud Consultant Role
2 pages
Digital Transformation in Finance
No ratings yet
Digital Transformation in Finance
11 pages
Ds TPSM Telecommunications Technology
No ratings yet
Ds TPSM Telecommunications Technology
2 pages
Edexcel IGCSE ICT Software Question Bank
No ratings yet
Edexcel IGCSE ICT Software Question Bank
4 pages
Key Concepts in Software Engineering
100% (1)
Key Concepts in Software Engineering
88 pages
Overview of Photochemical Machining Process
No ratings yet
Overview of Photochemical Machining Process
16 pages
IoT Adoption Framework in Logistics
No ratings yet
IoT Adoption Framework in Logistics
139 pages
Roller Team Zefiro 665 Buyers Guide
No ratings yet
Roller Team Zefiro 665 Buyers Guide
14 pages
Profibus Card 590P 690P
No ratings yet
Profibus Card 590P 690P
34 pages
Revenue Assurance Expertise at Airtel Africa
No ratings yet
Revenue Assurance Expertise at Airtel Africa
1 page

7 Mark Answers Data Analytics

Uploaded by

7 Mark Answers Data Analytics

Uploaded by

7-Mark Answers: Data Analytics & R Questions

Concept of Data Science and its use in Business

Example: Amazon uses data science to recommend products to customers.

Data Analytics vs Data Analysis

Types of Analytics and real-life uses

2. Diagnostic Analytics – explains why it happened.

3. Predictive Analytics – predicts future outcomes.

4. Prescriptive Analytics – suggests actions.

These analytics help businesses make better decisions.

Define Big Data, characteristics, applications and challenges

How does classification of analytics help in decision-making?

1. Descriptive analytics gives past information.

Process of data preparation and cleaning in spreadsheet

How can outliers be identified in a dataset using spreadsheet?

Outlier detection improves accuracy of analysis.

Use of Pivot Table and Pivot Charts

Pivot Charts visually represent Pivot Table data using graphs.

Handling missing data in spreadsheet

Proper handling improves data quality.

Interactive dashboard in spreadsheet

Role of scatter plots, line charts and histograms

Techniques available in spreadsheet for data visualization

What is R? How do we install an R package?

R is widely used in research and business analytics.

Difference between setwd() and getwd()

How do you remove NA values from a data frame?

Used in filtering and decision-making.

What does a histogram represent?

Example: Marks distribution of students.

When is a line graph most appropriate?

Covariance measures how two variables vary together.

Correlation is easier to interpret.

Textual Data Analysis

Good models have small residuals.

Purpose of Confidence Interval in Regression

Predictive Interval in Regression

Importance of checking statistical significance of coefficients

Usually p-value < 0.05 indicates significance.

Goal of Textual Data Analysis

Difference between Structured and Unstructured Data

Structured data is easier for analysis.

Tokenization in Text Analysis

Tokens may be:

Text Mining, Text Categorization and Sentiment Analysis

You might also like