Taller de Capacitación: Limpieza y enriquecimiento de datos abiertos con tecnologías open source
2023-11-01, 16:30–18:00 (America/Montevideo), Multifunción 1 - T. Ejecutiva
Idioma: Español

Taller de capacitación con cupos limitados.
Formulario de inscripción: https://2023.abrelatam.org/agenda/capacitaciones/

Objetivo del taller:

Proporcionar orientaciones, buenas prácticas y herramientas tecnológicas, para el desarrollo de estrategias de apertura y uso de datos abiertos que cumplan con los principales estándares de calidad de datos.

Objetivos de aprendizaje:

  • Conocer los criterios de los principales índices internacionales de evaluación de datos abiertos como el Open Data Barometer, el Global Open Data Index y el Our Data Index de la OCDE, entre otros.
  • Comprender el Modelo de Calidad de Datos ISO/IEC 250125 y las características de Calidad de Datos que se deben tener en cuenta a la hora de evaluar las propiedades de un producto de datos determinado.
  • Conocer cómo se construye un sistema de Big Data para la evaluación de criterios de calidad de los conjuntos de datos publicados en portales de datos abiertos en la región.
  • Comprender los principios de perfilamiento y limpieza de datos.
  • Aprender a instalar Open Refine y cargar datos para su limpieza de manera semiautomática.
  • Conocer las principales funcionalidades de ordenación, facetado, filtrado y limpieza de datos con Open Refine.
  • Realizar un análisis exploratorio de datos (EDA) para detectar problemas y/o errores en los datos.
  • Utilizar estrategias para transformar y normalizar los datos previo a su publicación en formatos abiertos.
  • Conocer herramientas de código abierto que proporcionan funcionalidades de integración, extracción, transformación y carga de datos abiertos estandarizados y de calidad a portales nacionales.

Público objetivo:

Está dirigido a personas estudiantes, docentes, consultores, aficionados, amantes de los datos (data lovers) o a quienes trabajen, o tengan interés en trabajar con datos abiertos de manera masiva para su limpieza y enriquecimiento.

Conocimientos previos:

  • Conocimientos básicos de manipulación de datos en formatos abiertos, capacidad para abrir y explorar conjuntos de datos.
  • Conocimientos generales sobre datos abiertos, ¿Qué son los datos abiertos y por qué son importantes?, pero no necesariamente es un requisito obligatorio.
  • Habilidades de uso de computador, instalación básica de aplicaciones, dado que se instalará y utilizará Open Refine en la sesión.

Requerimientos adicionales:

Se recomienda que las personas que las personas participantes cuenten con computador portátil y permisos de administración para instalación de aplicaciones.

Metodología

Este taller se impartirá bajo una metodología de charla magistral teórica y desarrollo de ejercicios prácticos que permitan a quienes participen, aprender a utilizar la herramienta de Open Refine para la detección de errores y limpieza conjuntos de datos. Así mismo aprenderán sobre las buenas prácticas, estándares, y herramientas para potenciar las iniciativas de datos abiertos de la región.

Ingeniero de Sistemas con Magister en Administración de Organizaciones, actualmente se encuentra cursando la Maestría en Inteligencia Artificial Aplicada del TEC de Monterrey, es certificado en Scrum Master y con formación en Big Data de la Universidad Complutense de Madrid; Cuenta con una experiencia de dieciséis (16) años en la ejecución de proyectos de base tecnológica, innovación y emprendimiento, así mismo ha liderado e impulsado la iniciativa de datos abiertos de Colombia.