Mi colección R
24 May 2018 5 minsEste es mi compendio de enlaces al material bibliográfico y cursos de R, publicado en distintos sitios. Trato de compendiar material que pueda accederse de forma gratuita, o al menos eso entiendo yo.
Hay muchos, libros en formato knitr, esto significa, que eventualmente puedes clonar el repositorio localmente y generar versiones en PDF y Epub (Mi Kindle agradecido). Los libros que están en esta lista al menos, puedo confirmar que se han podido pasar a los tipos de archivo mencionados.
Libros y otros documentos
En Inglés
- R for Data Science : Un clásico de Garrett Grolemund y Hadley Wickham. Muy claramente se describen las principales areas y tareas de la ciencia de Datos. En versión Knitr.
- R in a Nutshell : El libro de Joseph Adler, (2010, 636 páginas). Gran profundidad en el lenguaje y una parte bastante completa de estadística aplicada.
- Advanced R : De Hadley Wickham, presenta herramientas y técnicas útiles para atacar muchos tipos de problemas de programación de R, anudándole a evitar errores y callejones sin salida. Con más de diez años de experiencia programando en R, el autor ilustra la elegancia, belleza y flexibilidad en el corazón de R. Del 2014, en versión Knitr.
- Introductory Statistics with R: De Peter Daalgard, este libro proporciona una introducción a R a nivel elemental, dirigida tanto a científicos no estadísticos en varios campos como a estudiantes de estadística. El modo principal de presentación es a través de ejemplos de código con comentarios liberales del código y la salida, tanto desde el punto de vista computacional como estadístico. Se puede descargar un paquete R suplementario que contiene los conjuntos de datos. Del 2008.
-
R packages: De Hadley Wickham. Convierta su código R en paquetes que otros puedan descargar y usar fácilmente. Este práctico libro le muestra cómo combinar funciones R reutilizables, datos de muestra y documentación aplicando la filosofía de desarrollo de paquetes del autor. En el proceso, trabajará con
devtools
,roxygen
ytestthat
, un conjunto de paquetes R que automatizan tareas de desarrollo comunes. Devtools resume las mejores prácticas que Hadley ha aprendido durante años de trabajar con este lenguaje de programación. - An Introduction to Statistical Learning: Tiene curso online (ver más abajo)
En español
- El arte de programar en R: De Julio Sergio Santana Sepúlveda (198 páginas), uno de los poco libros de calidad en Español, del año 2014. Orientado únicamente al lenguaje.
- R para Principiantes: Emmanuel Paradis, Institut des Sciences de l’Evolution Universit Montpellier II. (2003, 61 páginas) El objetivo de este documento es proporcionar un punto de partida para personas interesadas en comenzar a utilzar R.
- Introducción a R: R Development Core Team (2000, 106 páginas) Estas notas sobre R están escritas a partir de un conjunto de notas que describían los entornos S y S-Plus escritas por Bill Venables y Dave Smith. Hemos realizado un pequeño número de cambios para reflejar las diferencias entre R y S.
- Cartas sobre Estadística: Dr. Ing. Marcelo R. Risk, Facultad Regional Buenos Aires, Universidad Tecnológica Nacional, Argentina (2003, 57 páginas)
- Introducción a la programación estadística con R para profesores: José Miguel, Contreras García, Elena Molina Portillo, Pedro Arteaga Cezón (2010, 161 páginas)
- R for Data Science en Español: Actualmente en desarrollo, la versión traducida de este clásico.
Cheat Sheets
Los clásicos “machetes”.
En ingles
- RStudio IDE
- Base R
- Advanced R
- Basics of regular expressions and pattern matching in R
- The leaflet package
- How big is your graph?
- R tools to access the eurostat database
- Elegant survival plots
- dplyr friendly Data and Variable Transformation
- Quantitative Analysis of Textual Data in R
- LaTeX cheat sheet
- Intro stats One quantitative variable with mosaic
- R Syntax Comparison
- Machine learning with R
- Machine Learning Modelling in R
- h2o
- xplain
En español
- Domar Datos con dplyr and tidyr
- Transformación de Datos con dplyr
- R Markdown
- Shiny
- Desarrollo de Paquetes
- Visualización de Datos usando ggplot2
- Ciencia de Datos en Spark
- Importar Datos con readr, tibble, and tidy
- Paquete caret
- Aplicar funciones con purrr
- Trabajar con cadenas con stringr
- Fechas y tiempos con lubridate
- Aprendizaje Profundo con Keras
Tutoriales y Cursos
En inglés
Aprendizaje supervisado : Este es un curso de nivel introductorio en aprendizaje supervisado, con un enfoque en métodos de regresión y clasificación. El programa incluye: regresión lineal y polinómica, regresión logística y análisis discriminante lineal; validación cruzada y métodos de bootstrap, selección de modelos y métodos de regularización (ridge and lasso); modelos no lineales, splines y modelos aditivos generalizados; métodos basados en árboles, randomforest y boosting; máquinas de soporte vectorial. Se discuten algunos métodos de aprendizaje no supervisados: componentes principales y agrupación (k-medios y jerárquicos). Las conferencias cubren todo el material de An Introduction to Statistical Learning, con aplicaciones en R de James, Witten, Hastie y Tibshirani (Springer, 2013). El pdf de este libro está disponible gratuitamente en el sitio web del libro. Interesante y gratuito. Cuando tenga algo de tiempo lo haré y veremos que tal.
R Programming - Data Science using R : Curso de Udemy.
Amazon trainning : Amazon abrió el material de entrenamiento interno, hay cosas muy buenas, por ejemplo el de matemáticas para Machine Learning. Lamentablemente no he visto nada de R, se ve que apuestan totalmente a Python
En español
- R para Análisis Científicos Reproducibles: El objetivo de esta lección es enseñar a las programadoras principiantes a escribir códigos modulares y buenas prácticas en el uso de R para el análisis de datos. R nos provee un conjunto de paquetes desarrollados por terceros, éstos se usan comúnmente en diversas disciplinas científicas para el análisis estadístico. Encontramos que muchos científicos que asisten a los talleres de Software Carpentry utilizan R y quieren aprender más. La importancia de estos materiales es proporcionar a los asistentes con una base sólida en los fundamentos de R, y enseñar las mejores prácticas del cómputo científico: desglose del análisis en módulos, automatización tareas y encapsulamiento. Ten en cuenta que éste taller se enfoca en los fundamentos del lenguaje de programación R, y no en el análisis estadístico.