Importación y limpieza de datos con R

¿Estás listo para dominar el arte de la limpieza y manipulación de datos?

Este curso de 6 semanas está diseñado para enseñar a los participantes técnicas avanzadas de limpieza y manejo de datos utilizando el lenguaje de programación R y el conjunto de paquetes Tidyverse. A lo largo del curso, los estudiantes aprenderán a importar datos desde diferentes formatos, limpiar y transformar datos, trabajar con tipos de datos complejos como fechas y texto, y utilizar herramientas avanzadas como expresiones regulares y la API de OpenAI ChatGPT para la limpieza y extracción de información.

⚠️ Prerrequisitos del Curso

Para poder desenvolverte en el curso sin problemas, es importante cumplir con los siguientes requisitos. Si tienes dudas, escríbenos o considera optar por alguno de nuestros cursos anteriores, como Fundamentos de R y RStudio o Visualización de datos con R.

  • Conocimientos sólidos sobre el uso de RStudio.
  • Conocimientos básicos de lectura y manipulación de datos con dplyr.
  • Capacidad de filtrar datos y crear nuevas variables.
  • Experiencia en la creación de reportes con rmarkdown o Quarto.
  • Conocimientos básicos en la creación de gráficos en R.

En este curso, aprenderás a:

Semana 1: Introducción y Fundamentos de la Limpieza de Datos

Durante la primera semana, nos concentraremos en entender a detalle el proceso de lectura y las particularidades de los formatos CSV, Excel y SPSS. Aprenderemos cómo importar datos desde estas fuentes utilizando las librerías readr, readxl y haven. También discutiremos cómo dar formato correcto a los datos, errores comunes y particularidades de cada uno. Además, haremos un repaso de los tipos de datos en R y las reglas de casting o transformación de tipos de datos. Los estudiantes comprenderán la importancia de la limpieza de datos y explorarán técnicas básicas de manipulación con dplyr, como select(), filter(), mutate(), arrange() y summarise().

Semana 2: Manipulación y Transformación de Datos

En la segunda semana, los estudiantes aprenderán a seleccionar, filtrar y transformar datos utilizando dplyr. También conocerán cómo normalizar nombres de variables con janitor y cómo transformar datos con tidyr mediante las funciones pivot_longer() y pivot_wider(). Esta semana se enfocará en la manipulación y transformación de datos para prepararlos para análisis posteriores. Lectura recomendada: Capítulos 3 y 4 de “R for Data Science”. Práctica: Ejercicios de manipulación y transformación de datos.

Semana 3: Trabajo con Textos y Expresiones Regulares

Durante la tercera semana, los estudiantes se centrarán en la manipulación y limpieza de datos textuales utilizando la librería stringr. Aprenderán sobre expresiones regulares básicas y avanzadas para extraer y reemplazar patrones en textos. Esta semana incluirá ejercicios prácticos para limpiar datos textuales, como la remoción de espacios y caracteres especiales.

Semana 4: Trabajo con Fechas y Tiempos

En la cuarta semana, los estudiantes aprenderán a manejar y limpiar datos de fechas utilizando la librería lubridate. Aprenderán a convertir cadenas a fechas, descomponer fechas en componentes (año, mes, día, hora, minuto, segundo) y realizar operaciones aritméticas con fechas, como sumas y restas. Esta semana se enfocará en preparar datos de fechas para análisis basados en el tiempo.

Semana 5: Integración con LLMs para la limpieza de datos

Durante la quinta semana, los estudiantes aprenderán a integrar modelos de limpieza de datos complejos y a utilizar APIs como OpenAI ChatGPT para la limpieza y extracción de información. Conocerán cómo trabajar con APIs en R utilizando las librerías httr y jsonlite, y cómo integrar herramientas de inteligencia artificial para abordar tareas complejas de limpieza de datos.

Semana 6: Proyecto Final

La última semana está dedicada al proyecto final, donde los estudiantes aplicarán todos los conocimientos adquiridos a lo largo del curso. Seleccionarán uno de los conjuntos de datos propuestos y aplicarán técnicas de limpieza de datos para extraer información útil y contestar preguntas específicas. Deberán presentar y discutir su informe final para demostrar su comprensión del tema. Los estudiantes desarrollarán un informe completo y presentarán sus proyectos, demostrando sus habilidades y conocimientos en limpieza de datos.

¡No pierdas esta oportunidad! Inscribirte en nuestro curso vivir una experiencia de aprendizaje única.

Inscríbete Ahora

  • Inicio de lecciones: martes 10 de junio de 2025
  • Clases en vivo
  • Grabaciones de las clases
  • Sesiones de seguimiento personalizadas
  • Acceso a una comunidad de aprendizaje
  • Ayuda en minutos a través de Zoom o WhatsApp
  • Certificado compatible con LinkedIn emitido por Certifier
  • Precio: $200 USD

Inscribirte ahora

¡Hola estudiantes de pregrado! 📚👋 Si estás cursando tu primera carrera en alguna universidad, ya sea nacional o extranjera, contáctanos en info@aprendetidyverse.com. ¡Tenemos un regalo para ti! 🎁 Podrás llevar todos nuestros cursos de forma gratuita o con un descuento muy importante. 🎓✨ Evaluamos cada caso individualmente porque nuestra prioridad es darte acceso a educación de calidad, incluso si en este momento no puedes pagarlo. Creemos que la educación es un derecho de todos. 🌟

Conoce al instructor

Hola 👋🏼, soy Carlos Aguero. Ingeniero en sistemas de información y, desde 2016, me dedico a enseñar a personas de todas las áreas y niveles de formación a programar en R 👨🏻‍💻.

Formo parte del listado de instructores certificados por RStudio, enfocándome en Tidyverse y Shiny. Recientemente, tuve el gusto de unirme a los instructores de la organización Software Carpentry 🚀.

A lo largo de los años, he tenido el privilegio de ayudar a más de 400 estudiantes en toda América Latina a descubrir el potencial del análisis de datos con R. Mi objetivo es ofrecerte una guía cercana y personalizada, similar a tener un instructor privado. Estoy aquí para asegurarte que tengas una experiencia de aprendizaje accesible y efectiva, ayudándote a superar cualquier obstáculo en tu camino hacia la dominio del lenguaje R para la ciencia de datos.

¿Tienes dudas? Hablemos sin compromiso 😊

Si tienes dudas sobre si este curso es para ti, puedes programar una reunión conmigo sin ningún compromiso. 🗓️ Aquí podemos revisar todas tus inquietudes.

Mi objetivo no es venderte un curso que no vas a terminar, sino ayudarte a encontrar una solución que realmente te funcione, incluso si la respuesta es que no somos el curso que necesitas. 😊 No estamos aquí para vender, sino para enseñar. Programa tu reunión aquí: https://cal.com/aprendetidyverse/reuniones-1h.


Conoce lo que dicen nuestros estudiantes


No esperes más. ¡Inscríbete ahora y empieza tu camino hacia el dominio del lenguaje R! Recibe el soporte que necesitas para triunfar desde el primer día.

Inscríbete Ahora

  • Inicio de lecciones: martes 10 de junio de 2025
  • Clases en vivo
  • Grabaciones de las clases
  • Sesiones de seguimiento personalizadas
  • Acceso a una comunidad de aprendizaje
  • Ayuda en minutos a través de Zoom o WhatsApp
  • Certificado compatible con LinkedIn emitido por Certifier
  • Precio: $200 USD

Inscribirte ahora

Ponte en contacto

La comunidad de usuarios de R me ha permitido conectar con personas interesantes de todo el mundo, algo que valoro enormemente. Si tienes una idea de proyecto, especialmente si está relacionado con datos de Costa Rica, me encantaría ayudarte en lo que sea posible.

Para charlar o preguntar, escríbeme a carlos.aguero@aprendetidyverse.com. También puedes encontrarme en LinkedIn o en Twitter (sí, sé que ahora se llama X, pero me resisto a cambiarle el nombre; simplemente no me gusta). ¡Espero tu mensaje!