Este repositório contém o conteúdo do curso de Machine Learning oferecido pela plataforma Alura, ministrado pelo instrutor João Vitor de Miranda. O curso aborda o processo completo de construção de modelos de classificação, incluindo análise exploratória, transformação de dados, treinamento de modelos e exportação de resultados.
- Leitura e inspeção inicial dos dados.
- Exploração de variáveis categóricas e numéricas.
- Identificação e tratamento de dados inconsistentes.
- Separação entre variáveis explicativas e variável alvo.
- Transformação de variáveis categóricas com One Hot Encoding.
- Normalização e transformação dos dados para preparar os modelos.
- Divisão do dataset em treino e teste.
- Construção de um modelo de base.
- Implementação e ajuste de uma Árvore de Decisão.
- Discussão sobre Overfitting e Underfitting.
- Implementação de K-Nearest Neighbors (KNN).
- Comparação de diferentes algoritmos e métricas de avaliação.
- Exportação do modelo treinado utilizando a biblioteca Pickle.
- Análise exploratória: Técnicas para investigar e entender os dados.
- Transformação de variáveis: Pré-processamento de variáveis categóricas e numéricas.
- Treinamento de modelos: Construção e ajuste de modelos de classificação.
- Validação: Divisão de dados em treino e teste para avaliar o desempenho dos modelos.
- Exportação de modelos: Armazenamento de modelos utilizando a biblioteca Pickle para uso futuro.
- Python: Linguagem principal utilizada para a implementação dos algoritmos.
- Pandas: Biblioteca para manipulação e análise de dados.
- Scikit-Learn: Biblioteca para a construção e avaliação dos modelos de machine learning.
- Pickle: Biblioteca para salvar e carregar modelos treinados.
O curso oferece uma abordagem prática e teórica sobre machine learning, com foco em modelos de classificação. É uma excelente introdução ao uso de bibliotecas como Scikit-Learn e Pickle para a construção de pipelines de machine learning.
Instrutor: João Vitor de Miranda
Plataforma: Alura