Nebulova Blog

Data Analytics

Introducción a R, el lenguaje de programación

R es un lenguaje de programación enfocado al análisis de datos, creado por Ross Ihaka y Robert Gentleman en la Universidad de of Auckland, Nueva Zelanda. R es open source, es decir, libre y gratis. Es mantenido y mejorado por una gran comunidad de programadores y analistas de datos. En este artículo vamos a dar una breve introducción a R.

Introducción a R

R nos permite controlar todo el flujo de trabajo de un analista de datos. Esto incluye desde conectarse a fuentes de datos (bases de datos, APIs, etc.) hasta crear potentes visualizaciones interactivas listas para un cliente. Todo esto pasando por la correspondiente transformación y análisis de los datos.

A parte de esto, R es un lenguaje de fácil sintaxis y que no necesita que lo compilemos antes de ejecutarlo, se interpreta el código a medida que se ejecuta.

La gran cantidad de librerías disponibles, su estupenda documentación y comunidad de desarrollo, hacen de R una herramienta esencial para cualquier data scientist o data analyst.

Instalación de R

R Studio es el IDE por excelencia de R. Nos permite escribir nuestro código, ejecutarlo, visualizar gráficos, explorar variables, etc. En resumen, desarrollar todo nuestro proyecto basado en R sin salir de su interfaz.

La forma más sencilla de instalar R Studio es a través de la distribución Anaconda. Si aún no tenemos instalado Anaconda en nuestro ordenador, procedemos a hacerlo.

Una vez instalado Anaconda, abrimos Anaconda Navigator con privilegios de administrador (o con la orden sudo en MacOS). A continuación crearemos un entorno virtual únicamente para R Studio con R instalado, y todas las dependencias necesarias. Esto es muy recomendable para evitar conflictos entre unas librerías y otras.

  1. Pulsamos Enviroments en el panel izquierdo
  2. Creamos un entorno nuevo pulsando create abajo a la izquierda
  3. Le damos un nombre, por ejemplo “R”, y seleccionamos R en el checkbox
  4. Pulsamos create y esperamos a que todo se instale
introducción a R

A continuación regresamos a Home en el panel izquierdo, y revisando que estemos en el entorno “R”, pulsamos en install debajo de R Studio.
Cuando acabe de instalarse, el botón debajo de R Studio pondrá launch. Pulsamos y abrimos R Studio.

R studio

Qué es R Studio

R Studio tiene una interfaz bastante sencilla, pero quizá abrume un poco al principio si no estás habituado a programar. A los que hayan programado en otros lenguajes, como Matlab, les será muy familiar la disposición de los paneles.

En la siguiente imagen vemos un breve resumen de la información que nos ofrece cada panel. Quizá los colores de tu IDE no coincidan con los de la imagen, no te preocupes. Es fácilmente personalizable desde la barra de opciones: Tools > Global options > Appearance.

interfaz de R studio

Veamos que función tiene todo lo que vemos en pantalla, siguiendo los números de la imagen:

  1. Este panel contiene la consola, dónde veremos el código ejecutado, podremos ejecutar código de forma manual y ver los prints o resultados de operaciones sencillas.
  2. En este lateral tenemos 2 paneles, el superior nos permite inspeccionar variables y ver el histórico de comandos ejecutados. El inferior tiene más opciones (como podéis ver en las pestañas superiores) como ver la ayuda de una función, visualizar los plots que hagamos, etc.
  3. Aquí escribiremos nuestro programa, es un editor de texto plano con resaltado de sintaxis. Si seleccionamos un fragmento de código y pulsamos Control+Enter (Cmd+Enter en MacOS), se ejecuta en la consola.
  4. Aquí tenemos la cinta de opciones, dónde podemos abrir, guardar o crear archivos, así como configurar todo lo relacionado con el comportamiento y estética de R Studio.

Es importante decir, que todos los paneles se pueden mover y reubicar libremente, arrastrando y soltando. R Studio es completamente configurable, tanto en disposición como en colores, comportamiento, etc.

Primeros pasos con el lenguaje R

Veamos en el siguiente fragmento de código, los elementos básicos de R.

Próximos pasos a seguir

Como habrás notado, R tiene una sintaxis sencilla y fácil de aprender, pero complejidad no se queda ahí, y dominar R requiere de mucho tiempo y trabajo.

En Nebulova vemos R en profundidad en nuestro Master de Data Analytics. Serás un auténtico crack de R y podrás desarrollar multitud de aplicaciones de forma autónoma aplicando modelos estadísticos o herramientas de visualización como R Shiny.