Curso Avanzado de Web Scraping y Automatización con R

LLeve sus análisis a un nuevo nivel dominando técnicas de Web Scraping y Automatización con R.

Foto de Sigmund en Unsplash

Este curso está diseñado para profesionales y entusiastas del análisis de datos que buscan alcanzar la maestría en técnicas avanzadas de extracción de datos de sitios web y APIs. A lo largo de este programa, profundizarás en tecnologías web como HTML, CSS y XPath, aprendiendo a manejar y manipular estructuras de datos complejas para una extracción efectiva y precisa de información.

¿Qué aprenderás?

  • Extracción de datos con rvest: Domina el scraping estático de páginas web.
  • Interacción con sitios dinámicos mediante RSelenium: Aprende a simular interacciones del usuario real para recuperar datos dinámicos.
  • Manejo avanzado de APIs con httr2: Comprende y utiliza métodos de API como GET, POST, PUT y DELETE para integrar y enviar datos.
  • Integración de IA con ChatGPT: Utiliza inteligencia artificial para optimizar la limpieza y análisis de datos.
  • Programación funcional con purrr: Eleva la calidad de tu código haciéndolo más limpio, modular y reutilizable.
  • Automatización de ETL con GitHub Actions y DuckDB: Configura un proceso automatizado que monitorea, extrae y almacena información en una base de datos SQL.

Próxima apertura

  • Fecha: martes 23 de julio de 2024
  • Lecciones: Todos los martes
  • Costa Rica/México: 6:00 p.m.
  • Colombia: 7:00 p.m.
  • Argentina: 9:00 p.m.

¿Qué obtendrás?

  • 6 clases en vivo de 2 horas cada una.
  • Sesión semanal privada de 30 minutos con el instructor para retroalimentación personalizada.
  • Asistencia por correo electrónico y consultas en tiempo real vía Zoom.
  • Certificado de aprovechamiento compatible con LinkedIn, emitido por Certifier.
  • Acceso prioritario a cursos avanzados.
  • Precio: $99 USD

Inscribirte ahora


Conoce al instructor

Mi nombre es Carlos Agüero B, desde el 2016, me dedico a enseñar a profesionales, en su mayoría no programadores, cómo analizar datos utilizando el lenguaje R.

He tenido la increíble oportunidad de formarme como instructor certificado por RStudio para la enseñanza de Tidyverse y Shiny y, recientemente, unirme la comunidad de instructores de The Carpentries. En estos 8 años de experiencia, he impartido más de 70 cursos relacionados con el lenguaje R a más de 400 estudiantes a lo largo de toda América Latina.

Conoce lo que dicen nuestros estudiantes

Contenido del curso

Semana 1: Fundamentos de Web Scraping
  • Introducción a Web Scraping: Comprender los fundamentos y la ética del web scraping.
  • Tecnologías Web Básicas: Repaso a HTML y CSS para identificar elementos en una página web.
  • XPath y Selección de Datos: Aprender a usar XPath para seleccionar nodos específicos dentro de documentos XML/HTML.
Semana 2: Interacción con Sitios Web Dinámicos
  • Introducción a RSelenium: Configuración y uso de Selenium para simular interacciones del usuario.
  • Scraping de Sitios Dinámicos: Técnicas para extraer datos de sitios que cargan contenido de manera dinámica.
Semana 3: Utilización de APIs
  • Conceptos de API: Qué son las APIs, cómo funcionan, y su relevancia en el mundo moderno de la programación.
  • Uso de httr2 para APIs: Realizar peticiones GET, POST, y más.
  • Autenticación y Seguridad: Manejo seguro de claves API y sesiones.
Semana 4: Automatización y Monitoreo de Datos
  • Introducción a GitHub Actions: Automatizar scraping y otros scripts de R.
  • Proyecto de ETL con DuckDB: Diseño de un proceso ETL para recopilar, transformar y cargar datos.
Semana 5: Avanzado en Manipulación y Análisis de Datos
  • Programación Funcional con purrr: Mejorar el código mediante funciones avanzadas en R.
    • Integración de ChatGPT para Análisis de Datos: Uso de IA para limpieza y análisis avanzados.
Semana 6: Proyecto Final y Gestión de Proyectos
  • Implementación de Proyecto Completo: Aplicar todo lo aprendido en un proyecto integrador.

Inscribirte ahora

  • 6 clases en vivo de 2 horas cada una.
  • Sesión semanal privada de 30 minutos con el instructor para retroalimentación personalizada.
  • Asistencia por correo electrónico y consultas en tiempo real vía Zoom.
  • Certificado de aprovechamiento compatible con LinkedIn, emitido por Certifier.
  • Acceso prioritario a cursos avanzados.
  • Precio: $99 USD.

Inscribirte ahora

Ponte en contacto

La comunidad de usuarios de R me ha permitido conectar con personas interesantes de todo el mundo, algo que valoro enormemente. Si tienes una idea de proyecto, especialmente si está relacionado con datos de Costa Rica, me encantaría ayudarte en lo que sea posible.

Para charlar o preguntar, escríbeme a carlos.aguero@aprendetidyverse.com. También puedes encontrarme en LinkedIn o en Twitter (sí, sé que ahora se llama X, pero me resisto a cambiarle el nombre; simplemente no me gusta). ¡Espero tu mensaje!