🎬 Análise de Dados Reais: Netflix e PIB Mundial

Este projeto aplica técnicas de tratamento de dados (data wrangling) para reunir, limpar e analisar dois conjuntos de dados — um sobre filmes e séries da Netflix e outro sobre o PIB mundial, obtido por meio da API do Banco Mundial.
O objetivo principal é investigar a relação entre o poder econômico de um país (PIB) e o nível de produção audiovisual presente na plataforma.

📊 Visão Geral do Projeto

Neste projeto, apliquei as habilidades adquiridas em tratamento de dados para:

Coletar e extrair dados de diferentes fontes (download manual e API).
Avaliar e limpar os dados de forma programática.
Armazenar e combinar diferentes bases.
Visualizar e interpretar correlações com Python.

📁 Conjuntos de Dados

Conjunto 1 — Netflix Titles

Tipo: Arquivo CSV (baixado manualmente do Kaggle)
Descrição: Contém informações sobre filmes e séries disponíveis na Netflix.
Principais variáveis:
- type: Filme ou Série
- title: Título da produção
- director: Nome do diretor
- cast: Lista de atores
- country: País de origem
- release_year: Ano de lançamento
- rating: Classificação indicativa
- duration: Duração (em minutos ou temporadas)

📈 Este conjunto permite analisar padrões de produção audiovisual por país.

Conjunto 2 — PIB Mundial

Tipo: Dados em JSON obtidos via API do Banco Mundial
Método: Extração automatizada por requisição HTTP.
Principais variáveis:
- country: Nome do país
- year: Ano de observação
- gdp (US$): PIB total em dólares correntes

🌍 Este conjunto fornece o contexto econômico necessário para comparação com os dados da Netflix.

🧠 Pergunta de Pesquisa

Existe relação entre o PIB de um país e a quantidade de produções da Netflix associadas a ele?

⚙️ Etapas e Métodos

Coleta de Dados
- Dados da Netflix baixados manualmente do Kaggle.
- Dados de PIB obtidos via API do Banco Mundial com requests.
Avaliação dos Dados
- Verificação de completude, consistência e valores ausentes.
- Garantia de que cada base possuía mais de 500 observações e pelo menos 2 variáveis.
Limpeza dos Dados
- Padronização de nomes de colunas e países.
- Remoção de valores nulos e registros irrelevantes.
Junção dos Dados
- Combinação das bases por país.
- Contagem de títulos da Netflix por país e cruzamento com o PIB.
Análise e Visualização
- Cálculo de correlação entre PIB e número de títulos.
- Criação de heatmaps com a biblioteca Seaborn.

🧩 Tecnologias Utilizadas

Categoria	Bibliotecas / Ferramentas
Manipulação de dados	`pandas`, `numpy`
Visualização de dados	`matplotlib`, `seaborn`
Coleta de dados	`requests`, `BeautifulSoup`
Modelagem / Machine Learning (opcional)	`scikit-learn`
Integração com banco de dados	`SQLAlchemy`
Processamento de imagens	`Pillow`

🧪 Como Executar o Projeto

# 1. Instale as dependências
pip install numpy pandas matplotlib requests seaborn scikit-learn SQLAlchemy beautifulsoup4 pillow openpyxl

# 2. Execute o notebook
jupyter notebook data_wrangling_project.ipynb

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Data_Wrangling_Project_Starter2.ipynb		Data_Wrangling_Project_Starter2.ipynb
README.md		README.md
countries_gdp_hist.csv		countries_gdp_hist.csv
netflix_titles.csv		netflix_titles.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🎬 Análise de Dados Reais: Netflix e PIB Mundial

📊 Visão Geral do Projeto

📁 Conjuntos de Dados

Conjunto 1 — Netflix Titles

Conjunto 2 — PIB Mundial

🧠 Pergunta de Pesquisa

⚙️ Etapas e Métodos

🧩 Tecnologias Utilizadas

🧪 Como Executar o Projeto

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🎬 Análise de Dados Reais: Netflix e PIB Mundial

📊 Visão Geral do Projeto

📁 Conjuntos de Dados

Conjunto 1 — Netflix Titles

Conjunto 2 — PIB Mundial

🧠 Pergunta de Pesquisa

⚙️ Etapas e Métodos

🧩 Tecnologias Utilizadas

🧪 Como Executar o Projeto

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages