Ciencia de Datos

INICIO: Lunes 6 de Julio de 2020

DURACIÓN: 1 mes (cuatro encuentros)

DESARROLLO: Curso Intensivo A DISTANCIA, duración 1 mes. Se desarrollan los temas a través con clases virtuales e introductorias a coordinar con los docentes y ejercicios prácticos para aprender a través de la experiencia .

COSTO FINAL: Socios: $ 16.500 (Pesos Argentinos).- Público en Gral.: $ 18.000 (Pesos Argentinos).- Alumnos del exterior US$: 290 (dólar estadounidense)

FORMAS DE PAGO: Efectivo |Depósito y/o Transferencia | Mercado Pago.

Se entrega material y certificado, cumpliendo con el requisito de presentación de los trabajos prácticos y aprobación del examen.

Consultas: Whatsapp: 11 6641-9311 / capacita@cpci.org.ar

Temario

INTRODUCCIÓN A LA CIENCIA DE DATOS


Unidad 1

- Definición de datos, ciencia de datos, carrera de un científico/a de datos, diferencias con otros puestos y diferentes roles dentro de la organización

- Introducción a estadística descriptiva

- Modelo CRISP-DM

Unidad 2

- Bases de datos, definición, tipos de de bases de datos y ejemplos

- Herramientas open source para conectarse a bases de datos

- Tipos de archivos más usados para análisis de datos y ejemplos de aplicación

- Introducción a SQL (Structured Query Language) para hacer preguntas y extraer información de datos almacenados en una base de datos. E

- Ejemplos de SQL queries, NoSQL queries y ejercicio.

Unidad 3

- Introducción a entorno de trabajo para realizar data science en python.

- Creación del entorno, configuración y breve introducción a librerías y fuentes online de consulta para poder

- Concepto de dataset, repositorio de datos y datos abiertos. Competencias de datos y sus beneficios a la comunidad y para los/as estudiantes.

Unidad 4

- Análisis Exploratorio de Datos (EDA)

- Qué es el EDA y por qué es importante realizarlo?

- Breve introducción de estadística descriptiva para el/la analista o científico/a de datos.

- Variables categóricas vs variables numéricas

- Preguntar a los datos!

- Valores nulos, reemplazos, outliers

Unidad 5

- Introducción a librería de python, pandas.

- Agregación, sumarización y conteo de datos

- Filtrado de datos, limpieza de datos

- Merge, join y otras técnicas para responder a las preguntas de negocio planteadas

- Valores nulos, reemplazos, outliers

Unidad 6

- Visualización de datos

- Diferentes tipos de visualización con matplotlib y seaborn

- Entender qué variables visualizar y la necesidad de hacerlo

- Explicabilidad (Interpretabilidad)

Destinatarios

El/la estudiante debe poseer conocimientos mínimos de computación (hardware y software). Preferentemente haber tenido un acercamiento al ambiente informático o de programación o computación.

Profesionales en las ciencias informáticas, electrónicas y económicas, o bien con conocimientos tecnológicos, que deseen desempeñarse como:

Analistas de datos

Científicos/as de datos (o dando soporte a los/as mismos/as)

Programadores/as que quieran volcarse al mundo de los datos

Especialistas de profesiones diversas dónde sientan que usar hojas de cálculo se siente poco poderoso y quieran dar un paso más hacia la explotación y análisis de datos

Objetivos

Objetivos Generales

Que los/as estudiantes conozcan conceptos generales de todo el proceso de la ciencia de datos, diferencias de perfiles profesionales en la actualidad, principales conceptos téoricos y prácticos para poder realizar ciencia de datos o bien un análisis de datos que de soporte a la toma de decisiones, aportando valor a través de la objetividad de los datos.

Objetivos específicos

Que los/as estudiantes logren:

Entender los diferentes roles relacionados a los datos dentro de una organización

Comprender el marco de trabajo de metodología de datos más utilizado en el mundo CRISP-DM

Entender qué es una base de datos y qué es el SQL (Simple Query Language o Lenguaje Simplificado de Consultas, en espanol)

Aprender consultas básicas en SQL para poder hacer una primera exploración de los datos

Aplicar la análisis de datos a un dataset particular a través de programación python y jupyter notebooks

Integrar conclusiones estadísticas o agregaciones o sumarizaciones que permitan hacer ciencia de datos sobre nuestros datasets

Hacer un EDA (Exploratory Data Analysis) y sus posibles usos y necesidad en el negocio

Visualizar las variables estudiadas a través de código python y librerias como matplotlib y seaborn.

Metodología de enseñanza – aprendizaje

Materiales: Presentaciones y realización de diferentes actividades individuales con vínculos en la web de videos o textos para ampliar información.

Interacción y seguimiento: Se utilizarán herramientas de comunicación para establecer contacto con los alumnos. Se llevarán a cabo videoconferencias. El docente se enfoca en acompañar a los/as estudiantes en el camino de la práctica y el aprendizaje con el objetivo de sostener el éxito del proceso.

Observaciones Importantes

Se les compartirá a los/as estudiantes múltiples herramientas de programación y datasets para realizar las actividades del curso, como así también alternativas a la utilización de sus propias computadoras para programar y realizar los ejercicios.

Cuerpo docente

DOCENTE:

Mg. Ing. Hernán Borré

Hernán Borré se graduó como Ingeniero en Sistemas de Información en la UTN FRBA (2009) y obtuvo el Máster en Ciencia en Inteligencia Artificial con Honores en la Universidad de Essex, Reino Unido (2018). Además de trabajar para la industria como desarrollador de software web (java) y móvil (iOS) y dirigir una empresa de desarrollo de software a medida con más de 20 personas a cargo, es Profesor Universitario de la UTN FRBA desde 2009 y ha sido profesor de la cátedra Algoritmos y Estructuras de Datos.

Además fue instructor del programa nacional 111Mil en el cual enseñó programación Java y MySQL. También, grabó y guionó los videos teórico-prácticos de la plataforma de educación online del mismo programa que se encuentran actualmente publicados.

En la actualidad es consultor implementador de Machine Learning en diversas organizaciones tanto estatales como privadas y está inmerso en diversas líneas de investigación de cooperación nacionales e internacionales.