R es un lenguaje de programación enfocado al análisis de datos, creado por Ross Ihaka y Robert Gentleman en la Universidad de of Auckland, Nueva Zelanda. R es open source, es decir, libre y gratis. Es mantenido y mejorado por una gran comunidad de programadores y analistas de datos. En este artículo vamos a dar una breve introducción a R.
R nos permite controlar todo el flujo de trabajo de un analista de datos. Esto incluye desde conectarse a fuentes de datos (bases de datos, APIs, etc.) hasta crear potentes visualizaciones interactivas listas para un cliente. Todo esto pasando por la correspondiente transformación y análisis de los datos.
A parte de esto, R es un lenguaje de fácil sintaxis y que no necesita que lo compilemos antes de ejecutarlo, se interpreta el código a medida que se ejecuta.
La gran cantidad de librerías disponibles, su estupenda documentación y comunidad de desarrollo, hacen de R una herramienta esencial para cualquier data scientist o data analyst.
R Studio es el IDE por excelencia de R. Nos permite escribir nuestro código, ejecutarlo, visualizar gráficos, explorar variables, etc. En resumen, desarrollar todo nuestro proyecto basado en R sin salir de su interfaz.
La forma más sencilla de instalar R Studio es a través de la distribución Anaconda. Si aún no tenemos instalado Anaconda en nuestro ordenador, procedemos a hacerlo.
Una vez instalado Anaconda, abrimos Anaconda Navigator con privilegios de administrador (o con la orden sudo en MacOS). A continuación crearemos un entorno virtual únicamente para R Studio con R instalado, y todas las dependencias necesarias. Esto es muy recomendable para evitar conflictos entre unas librerías y otras.
A continuación regresamos a Home en el panel izquierdo, y revisando que estemos en el entorno “R”, pulsamos en install debajo de R Studio.
Cuando acabe de instalarse, el botón debajo de R Studio pondrá launch. Pulsamos y abrimos R Studio.
R Studio tiene una interfaz bastante sencilla, pero quizá abrume un poco al principio si no estás habituado a programar. A los que hayan programado en otros lenguajes, como Matlab, les será muy familiar la disposición de los paneles.
En la siguiente imagen vemos un breve resumen de la información que nos ofrece cada panel. Quizá los colores de tu IDE no coincidan con los de la imagen, no te preocupes. Es fácilmente personalizable desde la barra de opciones: Tools > Global options > Appearance.
Veamos que función tiene todo lo que vemos en pantalla, siguiendo los números de la imagen:
Es importante decir, que todos los paneles se pueden mover y reubicar libremente, arrastrando y soltando. R Studio es completamente configurable, tanto en disposición como en colores, comportamiento, etc.
Veamos en el siguiente fragmento de código, los elementos básicos de R.
Como habrás notado, R tiene una sintaxis sencilla y fácil de aprender, pero complejidad no se queda ahí, y dominar R requiere de mucho tiempo y trabajo.
En Nebulova vemos R en profundidad en nuestro bootcamp de Data Analytics. Serás un auténtico crack de R y podrás desarrollar multitud de aplicaciones de forma autónoma aplicando modelos estadísticos o herramientas de visualización como R Shiny.
A la hora de desarrollar web existen muchas alternativas para todo tipo de proyectos web, pero… ¿Cuál es la mejor?
Descubre por qué en numerosas ocasiones se encuentran situaciones en las que poseer un exceso de datos que puede llegar a suponer un lastre si no se tiene un buen control y manejo sobre la información.
Que Python era y es un lenguaje con gran proyección y en auge ya lo sabíamos algunos, pero esta vez se ha proclamado como el lenguaje de programación más popular en la actualidad, y no nos lo hemos sacado de la chistera, sino que ha sido TIOBE quien lo ha catalogado como tal.