Python em Data Science: Da análise de dados à tomada de decisão – 5 módulos

1. Introdução a Python | 2. Análise e Processamento de Dados | 3. Métodos de Previsão | 4. Visualização de Dados | 5. Projeto Final

Formato: Online – Ao Vivo

DATA

M1: 16 e 18/11

M2: 23 e 25/11

M3: 30/11 e 02/12

M4: 07 e 09/12

M5: 14 e 16/12

Horário

18h às 20h

Duração: 4h Cada Módulo

LOCAL

Online-Ao vivo

PREÇO

70€ cada módulo
Oferta do 5º módulo aos inscritos nos 4 anteriores

descrição

Este curso pretende capacitar profissionais ou investigadores académicos a usarem python como uma ferramenta de apoio a projetos de data science, com o intuito de melhorar a tomada de decisão.

Serão abordadas metodologias orientadas para a análise estatística, realização de previsões e visualização de dados, assim como técnicas para adaptar um projeto em python às necessidades de cada formando, recorrendo a casos práticos e exemplos.

A discussão e a aplicação a casos reais serão incentivadas, sensibilizando para a aplicação de diferentes técnicas em projetos futuros.

Espera-se que no final os alunos sejam capazes de extrair poder dos dados e possam utilizar as técnicas ministradas para executar autonomamente um projeto de data science, apto a criar valor no âmbito das suas organizações.

Será privilegiada a interação durante as sessões, através da aplicação dos conceitos em casos práticos e da discussão acerca da sua aplicação em problemas reais. Espera-se assim que os formandos sejam capazes de trazer as suas questões e problemas que enfrentam nas suas organizações ou na sua investigação.

a quem se destina

Profissionais e estudantes académicos que queiram incorporar a análise de dados na tomada de decisão.

formador

José Guimarães

É formado em Engenharia Industrial e Gestão pela Universidade do Porto e tem mais de 6 anos de experiência em consultoria. Ao longo deste período, ajudou organizações de diferentes setores como Retalho, Indústria ou Saúde, a melhorar a sua tomada de decisão usando diferentes técnicas como análise de dados, visualização de dados, simulação ou otimização para resolver problemas de negócio. Ao longo do seu percurso, já trabalhou com diferentes linguagens como Python, R, VBA e SQL. Atualmente é Senior Consultant na LTPLabs, onde continua a auxiliar as organizações a obter melhorias de performance sustentáveis através da análise de dados.

programa

Módulo 1: Introdução a Python

Neste módulo será realizada uma introdução ao ambiente Python, onde se espera que os formandos ganhem familiaridade com os conceitos que serão usados ao longo do curso, assim como as funcionalidades e potenciais aplicações desta linguagem.

1.1. Porquê Data Science?
1.2. A linguagem Python
1.3. Variáveis e Objetos
1.4. Operações
1.5. Controlo de ciclos e condições
1.6. Funções
1.7. Bibliotecas – instalação e funcionamento


Módulo 2: Análise e processamento de dados

Neste módulo será usada a biblioteca pandas como ponto de partida para inspeção, tratamento e obtenção de informação a partir de dados presentes em datasets.

2.1. Aquisição de dados
2.2. Limpeza dos dados
2.3. Deteção e correção de outliers
2.4. Manipulação de datasets
2.5. Cálculo de estatísticas e indicadores
2.6. Interação com ficheiros e bases de dados


Módulo 3: Métodos de Previsão

Neste módulo será feito um overview a diferentes técnicas de regressão, que poderão ser usadas para se realizarem previsões ou interpretar o problema. Serão também referidos métodos de classificação, para problemas de previsões com variáveis binárias ou de atribuição a grupos.

3.1. Previsões com séries temporais
3.2. Regressões lineares simples e múltiplas
3.3. Regressões não lineares
3.4. Métodos de machine learning: random forests e gradient boosting machines
3.5. Regressão logística
3.6. Clustering


Módulo 4: Visualização de dados

O objetivo deste módulo será a transformação dos dados em gráficos e outros meios de representação, de forma a auxiliar a interpretação e comunicação das conclusões obtidas.

4.1. Visualização de dados em datasets
4.2. Distribuições e estatísticas de localização e dispersão
4.3. Comparação
4.4. Evolução
4.5. Correlação
4.6. Hierarquia
4.7. Dados geográficos

 

Módulo 5: Projeto final

O último módulo envolve a execução de um projeto utilizando as metodologias abordadas, desde a sua concepção até à execução final. Será usado um problema real como demonstração dos conceitos abordados e da sua potencial aplicação, onde os participantes terão oportunidade de debater e contribuir para a sua execução.  Este módulo irá apresentar aos participantes uma perspectiva mais real de uma abordagem de data Science para desafios do seu dia a dia profissional.

preço

70€ por módulo (isento de IVA) – quem participar nos 4 primeiros módulos terá direito à participação no módulo de projeto final.
(Limite de 20 pessoas)

data e horário

Datas:
Módulo 1: 16 e 18 de Novembro
Módulo 2: 23 e 25 de Novembro
Módulo 3: 30 Novembro e 2 de Dezembro
Módulo 4: 7 e 9 de Dezembro
Módulo 5: 14 e 16 de Dezembro
(2ª e 4ª feiras)

Horário: 18h às 20h

pré-requisitos e metodologia

Formato: Online-Ao Vivo. A formação será realizada através da plataforma Webex.

Língua de ensino: Língua Portuguesa

Rácio: 30% de exposição teórica e 70% de trabalho prático (com resolução de exercícios em tempo real com o software python)

Materiais utilizados e disponibilizados: Serão disponibilizados todos os slides do curso em formato digital (.pdf)

Não existem pré-requisitos necessários para frequentar o curso.

Recursos Tecnológicos

– Computador com acesso à Internet
– Instalação dos seguintes softwares: Python e VS Code
– Recomenda-se a utilização de um 2º monitor
– Será realizada uma primeira sessão de 30 min para instalação e configuração dos programas necessários

Referência bibliográficas

Lutz, Mark. Learning Python (5th Edition). O’Reilly, 2013

Vanderplas, Jake. Python Data Science Handbook. O’Reilly, 2016

Guido, Sarah; Mueller, Andreas. Introduction to Machine Learning with Python : A Guide for Data Scientists. O’Reilly, 2016

Michie, Donald, David J. Spiegelhalter, and C. C. Taylor. “Machine learning.” Neural and Statistical Classification, 1994

Chen, Chun-houh, Wolfgang Karl Härdle, and Antony Unwin, eds. Handbook of data visualization. Springer Science & Business Media, 2007.

Fale connosco

gades solutions

Rua Ferreira de Castro nº19

2635-361, Sintra, Portugal

Telefone: 210 124 743

Telemóvel: 932 027 860

Email: info@gades-solutions.com

inscrição

Por favor, introduza os seus dados. Entraremos em contacto brevemente.

Qual o módulo em que deseja participar:

8 + 3 =

Usaremos seus dados para fornecer informações sobre produtos e serviços da Gades Solutions. Para mais informações, consulte a nossa Política de Privacidade

 

COPYRIGHT © 2019 • GADES SOLUTIONS • TODOS OS DIREITOS RESERVADOS