Introducción a R, el lenguaje de programación

por | Nov 25, 2019

R es un lenguaje de programación enfocado al análisis de datos, creado por Ross Ihaka y Robert Gentleman en la Universidad de of Auckland, Nueva Zelanda. R es open source, es decir, libre y gratis. Es mantenido y mejorado por una gran comunidad de programadores y analistas de datos. En este artículo vamos a dar una breve introducción a R.

Introducción a R

R nos permite controlar todo el flujo de trabajo de un analista de datos. Esto incluye desde conectarse a fuentes de datos (bases de datos, APIs, etc.) hasta crear potentes visualizaciones interactivas listas para un cliente. Todo esto pasando por la correspondiente transformación y análisis de los datos.

A parte de esto, R es un lenguaje de fácil sintaxis y que no necesita que lo compilemos antes de ejecutarlo, se interpreta el código a medida que se ejecuta.

La gran cantidad de librerías disponibles, su estupenda documentación y comunidad de desarrollo, hacen de R una herramienta esencial para cualquier data scientist o data analyst.

Instalación de R

R Studio es el IDE por excelencia de R. Nos permite escribir nuestro código, ejecutarlo, visualizar gráficos, explorar variables, etc. En resumen, desarrollar todo nuestro proyecto basado en R sin salir de su interfaz.

La forma más sencilla de instalar R Studio es a través de la distribución Anaconda. Si aún no tenemos instalado Anaconda en nuestro ordenador, procedemos a hacerlo.

Una vez instalado Anaconda, abrimos Anaconda Navigator con privilegios de administrador (o con la orden sudo en MacOS). A continuación crearemos un entorno virtual únicamente para R Studio con R instalado, y todas las dependencias necesarias. Esto es muy recomendable para evitar conflictos entre unas librerías y otras.

  1. Pulsamos Enviroments en el panel izquierdo
  2. Creamos un entorno nuevo pulsando create abajo a la izquierda
  3. Le damos un nombre, por ejemplo “R”, y seleccionamos R en el checkbox
  4. Pulsamos create y esperamos a que todo se instale

introducción a R

A continuación regresamos a Home en el panel izquierdo, y revisando que estemos en el entorno “R”, pulsamos en install debajo de R Studio.
Cuando acabe de instalarse, el botón debajo de R Studio pondrá launch. Pulsamos y abrimos R Studio.

R studio

Qué es R Studio

R Studio tiene una interfaz bastante sencilla, pero quizá abrume un poco al principio si no estás habituado a programar. A los que hayan programado en otros lenguajes, como Matlab, les será muy familiar la disposición de los paneles.

En la siguiente imagen vemos un breve resumen de la información que nos ofrece cada panel. Quizá los colores de tu IDE no coincidan con los de la imagen, no te preocupes. Es fácilmente personalizable desde la barra de opciones: Tools > Global options > Appearance.

interfaz de R studio

Veamos que función tiene todo lo que vemos en pantalla, siguiendo los números de la imagen:

  1. Este panel contiene la consola, dónde veremos el código ejecutado, podremos ejecutar código de forma manual y ver los prints o resultados de operaciones sencillas.
  2. En este lateral tenemos 2 paneles, el superior nos permite inspeccionar variables y ver el histórico de comandos ejecutados. El inferior tiene más opciones (como podéis ver en las pestañas superiores) como ver la ayuda de una función, visualizar los plots que hagamos, etc.
  3. Aquí escribiremos nuestro programa, es un editor de texto plano con resaltado de sintaxis. Si seleccionamos un fragmento de código y pulsamos Control+Enter (Cmd+Enter en MacOS), se ejecuta en la consola.
  4. Aquí tenemos la cinta de opciones, dónde podemos abrir, guardar o crear archivos, así como configurar todo lo relacionado con el comportamiento y estética de R Studio.

Es importante decir, que todos los paneles se pueden mover y reubicar libremente, arrastrando y soltando. R Studio es completamente configurable, tanto en disposición como en colores, comportamiento, etc.

Primeros pasos con el lenguaje R

Veamos en el siguiente fragmento de código, los elementos básicos de R.

#Podemos crear comentarios en R con un "#" 
#Los comentarios no se tienen en cuenta cuando se ejecuta el código

#Los tipos de datos básicos son
"nebulova"     #Texto o en lenguaje técnico "string"
98             #Número entero o "integer"
89.14          #Número decimal o "float"
FALSE          #Falso, usado en proposiciones lógicas
TRUE           #Verdadero, usado en proposiciones lógicas

#Las operaciones matemáticas básicas son las siguientes
2 + 2          #Suma
4 - 2          #Resta
10 * 2         #Multiplicación
12 / 6         #División
2 ^ 3          #Potencia
7 %% 2         #División entera (el resto de una división)

#Podemos efectuar operaciones de comparación
2 > 1          #Operador mayor que, en este caso devuelve TRUE
5 < 3          #Operador menor que, en este caso devuelve FALSE
7 >= 7         #Operador mayor o igual que, en este caso devuelve TRUE
9 <= 0         #Operador menor o igual que, en este caso devuelve FALSE
13 == 13       #Operador igual que, en este cado devuelve TRUE
13 != 12       #Operador distinto de, en este caso devuelve TRUE

#También tenemos operadores lógicos
(2 > 1) & (4 > 1)       # Operador "y", TRUE si ambas operaciones son TRUE
(2 > 1) | (4 > 1)       # Operador "o", TRUE si una de las operaciones es TRUE
! (4 > 1)               # Operador "no", TRUE si la operación es FALSE

#Las estructuras de datos básicas en R son:
#Vectores, sólo admiten un tipo de datos. Por ejemplo, si mezclamos
#integers con strings, el vector convierte todos los elementos a string
c(1, 2, 3, 4)
c(1:4)
c(1, 2, "nebulova")     #Aquí los números 1 y 2 se convertirán a string

#Listas, en comparación con los vectores, pueden tener elementos de distinto tipo
#manteniendo su tipo
list("nebulova", 14, TRUE)

#Matrices, en este caso de dimensión 2x2
matrix(c(1,2,3,4), nrow=2)
matrix(c(1:4), nrow=2)

#A parte de estos elementos existen más, como arrays, factores, etc
#Son estructuras más avanzadas que se usan frecuentemente en R

#Por último veamos como asignar o "guardar" variables
x <- 4
print(x)                #Imprime en consola el valor de x

Próximos pasos a seguir

Como habrás notado, R tiene una sintaxis sencilla y fácil de aprender, pero complejidad no se queda ahí, y dominar R requiere de mucho tiempo y trabajo.

En Nebulova vemos R en profundidad en nuestro Master de Data Analytics. Serás un auténtico crack de R y podrás desarrollar multitud de aplicaciones de forma autónoma aplicando modelos estadísticos o herramientas de visualización como R Shiny.

1 Comentario

  1. Berta

    Muy buen post. Gracias por compartirlo.

    Responder

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *