Analítica aplicada con Python

Página creada Mary Ruviella
 
SEGUIR LEYENDO
Workshop Virtual de Microfinanzas

   Analítica aplicada
     con Python

Introducción
Python se ha convertido en una herramienta clave para el análisis de datos, su
rendimiento y la gran variedad de librerías de esta herramienta abarcan todo tipo
de análisis, desde modelos de regresión hasta redes neuronales. Python permite
modelar datos históricos para explorar y anticipar eventos creando modelos
analíticos pertenecientes al mundo de la minería de datos.

Mediante ejercicios prácticos aprenderá a identificar y diseñar diferentes casos de
uso para los modelos analíticos. Entenderá los supuestos que se requieren en cada
método empleado, la manera operativa de construirlos y la forma correcta para
interpretar resultados.

Objetivo
Introducir al usuario en el uso de machine learning dentro del ámbito de la minería
de datos aprendiendo a utilizar diferentes técnicas de modelado y su correcta
interpretación con enfoque de negocio.
Dirigido a
    El workshop está dirigido a profesionales provenientes de diferentes áreas de
    negocio que estén interesados en conocer y aplicar las diferentes técnicas de
    machine learning.

    Fechas y horarios
        Día           Fecha                  Horario     Duración      Docente
     Lunes       27 de septiembre de 2021
     Miércoles   29 de septiembre de 2021
     Jueves      30 de septiembre de 2021   2:00 p.m.
     Miércoles   6 de octubre de 2021           a          3hrs      Pedro Bautista
     Jueves      7 de octubre de 2021       5:00 p.m.
     Lunes       11 de octubre de 2021
     Martes      12 de octubre de 2021

    Modalidad
    - Plataforma ZOOM

    Informes e inscripciones
    - eventos@fpcmac.org.pe / +51 985 422 913

Metodología
La metodología que se utilizará en el workshop involucra métodos expositivos,
participativos y de análisis, combinando los conceptos teóricos con el desarrollo
de ejercicios prácticos haciendo uso de las utilidades que ofrece Python.

Los participantes tienen la posibilidad de realizar laboratorios para reforzar los
conceptos impartidos. En este sentido, las bases de datos que se emplean para
el desarrollo del curso son estándar y provistas por el instructor.
Temario
Sesión 1 (Tiempo: 1 hr)

   Introducción
     ¿Qué es analítica?
     Tipos de Análisis.
     Modelos supervisados.
     Modelos no supervisados.
     Metodología Crisp DM.
     Opciones cloud vs. opciones on premise.

Sesión 2 (Tiempo: 3 hrs)

   Introducción a Python
     Tipos de datos, cadenas, listas, secuencias y cómo operar estos objetos en Python.
     Librerías y sus principales funcionalidades: Numpy, Pandas, scikit-learn, Seaborn y
     Matplotlib.

Sesión 3 (Tiempo: 4 hrs)

   Preparación de datos para la modelización
     Análisis estadístico descriptivo. Conocer las diferentes medidas y gráficas para un
     análisis básico de datos con Python para un entendimiento inicial de los datos.
     Depurar los datos, equilibrar datos, transformaciones numéricas a los datos y
     conversiones.

Sesión 4 (Tiempo: 1 hr)

   Reducción de datos
     Componentes principales ¿Qué busca un análisis de componentes principales
     o factores?
     Principios. Análisis factorial vs. análisis de componentes principales.

Sesión 5 (Tiempo: 2 hrs)

   Técnicas de agrupación
     ¿Qué buscar cuando agrupamos?
     ¿Qué técnicas podemos utilizar?
     Ejercicio con agrupación K- medias y revisión de perfiles de clúster.

Sesión 6 (Tiempo: 3 hrs)

   Modelos de regresión lineal y logístico
     Aplicación básica de regresión lineal, conceptos y aplicación de la regresión
     logística binomial.
     Ejemplo de aplicación práctico al sector financiero (modelo admisión de
     créditos).
Sesión 7 (Tiempo: 3 hrs)

         Arboles de clasificación
            Árboles de clasificación.
            Modelización de resultados categóricos y numéricos.
            Comparación de resultados de los modelos.
            Ejemplo de aplicación práctico al sector financiero.

    Sesión 8 (Tiempo: 2 hrs)

         Introducción a los modelos de máquinas de soporte
         vectorial
            Introducción al modelo de máquinas de soporte vectorial y sus aplicaciones.
            Ejemplo de aplicación práctico al sector financiero.

    Sesión 9 (Tiempo: 3 hrs)

         Introducción a las redes neuronales
            Redes neuronales para clasificación.
            Métodos multi-layer perceptrón y la función de base radial.
            Ejemplo de aplicación práctico al sector financiero.

    Sesión 10 (Tiempo: 1 hr)

         Redes Bayesianas
            Introducción a las redes bayesianas y sus aplicaciones.
            ¿Por qué las redes bayesianas?
            Principales conceptos.

    Sesión 11 (Tiempo: 1 hr)

         Modelos Cuasi supervisados: Reglas de asociación
            Introducción a las reglas de asociación.
            ¿Por qué las redes bayesianas?
            Aplicaciones para el market basket analysis.

                                           150
                                       $
    Inversión                                                más IGV

Con el apoyo de:

Infórmese es el socio analítico preferido de las organizaciones en Latinoamérica. Desde hace 28 años apoyamos a nuestros clientes
a desplegar analítica a través de su cadena de valor para maximizar el uso de sus datos. Apoyamos el desarrollo de las habilidades
de nuestros clientes a través del Analytical Journey®, agregando valor y mejorando sus procesos de toma de decisiones a partir del
análisis de datos. Día a día nos consolidamos como líderes apoyando a nuestros 1100 clientes resolver sus problemáticas de negocio
a partir del aprovechamiento de los datos y la analítica.
Expositor

                                    Pedro Bautista
                                   Experiencia en Análisis de Datos (8 años), Uso de herra-
                                   mientas de código abierto (R, Python , SQL, PostgreSQL).
                                   Esperiencia en desarrollo de productos analiticos para
                                   Analisis de Precios en retail, Scoring financiero, Text
                                   Analytics, conocimiento y experiencia en multiples tecnicas
                                   de modelado de Machine Learning: Regresión, Arboles,
                                   Random Forest, XGBoost, Cluster, Redes Neuronales Artifi-
                                   ciales, Anomaly Detection, e Interpretación de modelos
                                   (Interpretability).

Experiencia
 INFÓRMESE (2019 - Actualidad)
    Brindar soluciones para explotación de los datos
    y su uso en la toma de decisiones de las empresas.
    Especialista en Elasticidad de precio de la demanda,
    análisis de datos no estructurados, (Web scraping
    Python). Experiencia en R y Python, uso de modelos
    de Machine Learning (regresión, árboles, clasificación,
    cluster, redes sociales).

Wallmart México (2015 - 2019)
    Reducción en un 90% de tiempos de entrega
    (Automatización) de las reportería del área (SQL, VBA,
    Python, R). Desarrollo y mantenimiento de procesos de
    automatización, eficientando las áreas de: Precios,
    Compras, Recurtido, Planeación y Operaciones.

    Responsables de 50,000 movimientos diarios de
    precios en reacción vs competencia (antes imposible
    mediante procesos manuales). Análisis de precios,
    análisis de ventas, elasticidades de precios, canastas
    de compra.

Televisa Telecom (2014 - 2015)
   Automatización de presentaciones ejecutivas, mejorando
   tiempos de entrega para juntas directivas (SQL, VBA,
   Python). Manejo de información financiera de filiales
   consolidado en una base de datos para eficientar el
   manejo de la información en el área. Cálculo de indicadores
   Operativos y Financiero en Telecomunicaciones.
También puede leer