Prefacio

Este curso ha sido diseñado por Javier Álvarez Liébana y pensado para introducir en el lenguaje R a todas aquellas personas que quieran aprender desde cero. Dicho manual ha sido elaborado a su vez en R con {bookdown}. Puedes ver un resumen de las funcionalidades de algunos paquetes documentados por el equipo de R Studio en sus esquemas resumen. El código de dicho manual se encuentra en GitHub.

 

Para elaborar informes o libros con una estructura similar (de forma nativa en R) el paquete bookdown puede ser instalado desde la plataforma CRAN o desde su versión en desarrollo actualizada en Github:

install.packages("bookdown")
# o desde su versión en desarrollo actualizada
# devtools::install_github("rstudio/bookdown")

Propósito

El objetivo de este tutorial es introducir a la programación y análisis estadístico en R a toda aquella persona que nunca se haya iniciado en él, sin necesitar conocimientos previos de programación (aunque siempre ayuda, obviamente). Con este manual no se pretende que adquieras un vasto y experto conocimiento de R, pero si lo suficiente como para lograr 5 objetivos:

  • No tener miedo a programar.
  • Entender los conceptos básicos de R.
  • Dotarte de una autonomía muy básica para pdoer trabajar con datos.
  • Introducirte en el análisis estadístico.
  • Algunos trucos sencillos para que el trabajo sea más rápido, tanto en tiempo de escritura como de ejecución.

Requisitos

  • Conexión a internet (para la descarga de algunos datos y paquetes).

  • Instalar R (ver 1). R será nuestro lenguaje, nuestro diccionario, nuestro castellano, nuestra ortografía para poder «comunicarnos» con el ordenador. https://cran.r-project.org/

  • Instalar R Studio (ver 1.1). De la misma manera que podemos escribir el mismo texto en castellano en una tablet, en un ordenador, en un Word, en un papel o en un tuit, en programación podemos usar distintos IDE (entornos de desarrollo integrados, nuestro Office), para que el trabajo sea más cómodo. Nosotros trabajaremos con RStudio.

Todo lo necesario para seguir este curso es de descarga gratuita: viva el software libre.

Código de colores

En los recuadros rojos encontrarás errores comunes o prácticas a evitar.

En los recuadros naranjas encontrarás warnings o advertencias sobre cosas a tener en cuenta para evitar problemas.

Algunas funciones pueden arrojar ciertas advertencias que nunca está de más leer. Pero si dichos mensajes de alerta los tenemos controlados, y no queremos que nos ensucie la ejecución en la consola, podemos poner al inicio del código assign("last.warning", NULL, envir = baseenv()) para limpiar los warnings antiguos y options(warn = -1) para desactivarlos.

En los recuadros verdes encontrarás consejos o tips para ampliar y facilitar tu programación. Además en cada cajita de código, si pasas el ratón, encontrarás un botón 📄📄 en la esquina superior derecha de la caja para copiar el código directamente a tu consola. Puedes encontrarlos todos escribiendo «consejo» en el buscador.

En los recuadros azules encontrarás un 📚 glosario con algunos términos estadísticos y conceptos básicos.

Sobre el autor

Esto de presentarse a sí mismo es siempre un poco raro pero vamos a intentarlo. Mi nombre es Javier Álvarez Liébana, soy matemático, nacido en 1989 en Carabanchel (Madrid), pasando por Bologna (Italia). Tras terminar licenciatura y Máster en Ingeniería Matemática, recibí en julio de 2018 el título de Doctor en Estadística (por la Universidad de Granada, con dos estancias en Université Pierre et Marie Curie)

Además de investigador (con plaza y acreditación de Ayudante Doctor en la Facultad de Estudios Estadísticos de la Universidad Complutense de Madrid, tras ocupar dicha plaza en la Universidad de Oviedo), soy docente en dicha facultad y ando intentando eso de la divulgación en estadística y dataviz (visualización de datos) en redes sociales

🎲 Web
💌 Newsletter
🐦 Twitter
📸 Instagram

Docencia impartida

  • 2021-2022 (UCM):
    • estadística descriptiva y exploración de datos (Grado en Estadística Aplicada)
    • minería de datos (Máster en Minería de Datos e Inteligencia de Negocio)
  • 2020-2021 (UNIOVI):
    • estadística (Grado en Informática, Grado en Ingeniería Química)
  • 2019-2020 (UNIOVI):
    • estadística (Grado en Informática, Grado en Ingeniería Química)
    • modelos lineales generalizados (Máster en Análisis de Datos para la Inteligencia de Negocios)
  • 2018-2019 (UNIOVI):
    • estadística (Grado en Informática, Grado en Ingeniería Química).
    • bioestadística y epidemiología (Grado en Fisioterapia)
    • programación matemática (Grado en Matemáticas y Doble Grado en Matemátias y Física)
  • 2016-2017 (UGR):
    • estadística (Grado en Ciencias Ambientales)
    • matemáticas III (Grado en Ingeniería Civil)
  • 2015-2016 (UGR):
    • probabilidad (Grado en Matemáticas)
    • estadística (Grado en Ciencias Ambientales y Grado en Informática)
    • matemáticas III (Grado en Ingeniería Civil)

Licencia

Licencia: GPLv3

Este documento es publicado bajo licencia pública general GNU, una licencia libre de copyleft que garantiza a los usuarios finales (personas, organizaciones, compañías) la libertad de usar, estudiar, compartir (copiar) y modificar el software, citando adecuadamente al autor del mismo.