EL LENGUAJE DE PROGRAMACIÓN R Y SU USO EN R STUDIO
PARA ANÁLISIS DE DATOS.
I. INTRODUCCÓN
a) Objetivos:
En la era digital y la creciente importancia de los datos en prácticamente todos los
campos del conocimiento, la capacidad de analizar y visualizar datos se ha
convertido en una habilidad fundamental. Entre las herramientas más destacadas
en este ámbito se encuentran R y RStudio, dos entornos de programación y análisis
de datos de código abierto que han ganado una creciente popularidad tanto en el
ámbito académico como en el profesional.
Esta investigación tiene como objetivo principal acercar el aprendizaje de R y
RStudio a estudiantes y principiantes de manera accesible y amigable.
Reconocemos que, aunque estas herramientas son poderosas, pueden parecer
intimidantes al principio.
A lo largo de este estudio, nos centraremos en enseñar a los interesados qué son
R y RStudio, cómo funcionan juntos, y cómo pueden utilizarlos de manera efectiva
en el análisis de datos. También promoveremos las mejores prácticas y
proporcionaremos ejemplos y recursos prácticos para facilitar su aprendizaje.
b) Introducción a R:
R es un lenguaje de programación con enfoque estadístico, es un lenguaje de
programación interpretado y de entorno de software libre.
Con el software libre R se puede hacer modelos de regresión lineal y logísticos,
análisis de series de tiempo, pruebas estadísticas clásicas, agrupamientos,
clustering, clasificaciones y aplicar muchas otras técnicas estadísticas.
Este software proporciona un amplio abanico de herramientas estadísticas y
gráficas que permiten a los usuarios definir sus propias funciones. R es uno de los
lenguajes de programación más utilizados en áreas como:
• Investigación científica.
• Manipulación de datos.
• Análisis estadístico.
• Inteligencia artificial.
• Aprendizaje automático o Machine Learning.
• Técnicas gráficas.
• Modelado y predicciones.
• Matemáticas financieras.
• Bioinformática.
• Investigación biomédica.
c) Características de R:
• Es gratuito
• Es un lenguaje orientado a objetos
• R proporciona un amplio abanico de herramientas estadísticas y graficas
• R puede integrarse con distintas bases de datos
• Los usuarios lo pueden extender definiendo sus propias funciones
d) Importancia de R en el Análisis de Datos
R es un entorno de software y un lenguaje de programación estadística creado para
el cálculo estadístico y la visualización de datos. Las numerosas capacidades de R
tienden a clasificarse en tres grandes categorías:
✓ Manipulación de datos
✓ Análisis estadístico
✓ Visualización de datos
R está pensado para cálculos estadísticos, cálculos matemáticos y creación de
gráficos de una manera fácil y rápida, con mucha documentación disponible gracias
a la gran comunidad activa que posee por ser un proyecto colaborativo.
Muchas empresas y universidades utilizan el software R para el análisis estadístico,
por su robustez, su gran modularidad e infinitas posibilidades, que se adaptan a
todo tipo de necesidades para el manejo de datos complejos, además podemos ir
ampliando nuestro entorno R con aspectos que realmente vayamos a trabajar y que
nos permitirán tomar decisiones concluyentes y resultados que suelen ser realmente
satisfactorios.
Por estas razones sumándole la capacidad de conectarse a cualquiera de las bases
de datos más utilizadas hoy en día, leerla, procesarla y calcularla, es una de las
herramientas y lenguajes mas utilizados en el análisis de datos.
II. INSTALACIÓN Y CONFIGURACIÓN DE R´
1. Buscamos en el buscador “r-project” y seleccionamos la siguiente página:
2. Ya dentro le damos en donde dice “dowland R”
3. No dirigirá a otra pagina y le daremos al primer link que dice “[Link]
[Link]/.”
4. Seleccionaremos el Sistema operative de nuestro ordenador para
descargar R. En este caso será Windows.
5. Seleccionamos donde dice “install R for the first time.”
6. Nos dirigirá a otra página y seleccionamos descargar R en la parte superior.
7. Después de descargarse lo ejecutamos, aceptamos y le damos siguiente a
todas las opciones y por último le damos finalizar; y ya tendríamos instalado
R
Instalación de R Studio
1. Abrimos el buscador y buscamos “[Link]” y seleccionamos la
siguiente página:
2. Ya dentro le damos la opción de “DOWLAND RSTUDIO”
3. Ahora bajaremos hasta que aparezca la opcion que diga “DOWLAND
RSTUDIO DESKTOP FOR WINDOWS” y lo instalamos.
4. Después de instalarlo lo ejecutamos, aceptamos y le damos siguiente a
todas las opciones y por último le damos terminar y ya tendríamos instalado
RStudio.
Comprobar si ya tengo R y que versión
Para comprobar que ya tenemos instalado basta con buscar en el escritorio “R” y
nos tendrá que aparecer el programa
Para saber que versión tenemos ejecutamos la siguiente función en el código de R
En este caso tenemos la versión 4.3.1
III. VARIABLES Y TIPOS DE DATOS EN R
Las variables en R son valores son términos con los cuales podemos operar con
otras variables o asignarles un valor.
En R hay 5 tipos de datos básicos:
• Enteros (integer): Debe tener una “L” terminando el número.
• Decimales (numeric): Son números fraccionarios o números enteros que
no son declarados como enteros con la “L”
• Cadenas de texto (chacracter): Son caracteres o conjunto de caracteres
que siempre van entre ‘ ‘ o “ “.
• Números complejos: Es un valor complejo que se expresa de la forma
“ax+bi” siendo i el indicador de que es un numero complejo.
• VERDADERO o FALSO (logical): Normalmente son el resultado de
operaciones lógicas.
Operadores en R
Hay varios tipos de operadores en R. Estos incluyen operadores aritméticos
para cálculos matemáticos, operadores lógicos y de asignación.
• Aritmetricos: Aquellos qu se utilizan para realizar las operacioes
matematicas entre variables y constantes.
• Relacionales: Sirven para identificar relaciones de magnitud, igualdad o
diferencia, principalmente númerica.
• Lógicos: Identifican el verdadero y el falso.
Para vectores en vez de usarse “&” y “|” se usan “&&” y
“||” respectivamente.
• Asignación: Brindan valor a una determinada variable o elemento.
Estructuras de Control
If (si): Esta estructura se ejecutara una operación siempre y cuando la condición
sea verdadera y si no ejecutara otra operación en caso de ser falsa. Estructura:
✓ If (condición) {operaciones en caso de ser verdadero} else {operaciones en
caso de ser falsa}
✓ Manera rápida (ifelse)
ifelse (condición, operaciones en caso de ser verdadera, operaciones en
caso de ser falsa)
While (mientras): Bucle que se ejecutara mientras la condición sea cierta y
realizara una operación hasta que no se cumpla la condición puesta. Estructura:
✓ While (condición) {operaciones}
For: Bucle que se realiza en un cierto rango determinado por la estructura:
✓ for (rango) {operaciones}
Ejemplos