TensorFlow¶
Neste módulo, vamos explorar os fundamentos das redes neurais e aplicar esses conceitos usando a biblioteca TensorFlow.
O TensorFlow não apenas facilita a construção e o treinamento de modelos complexos, mas também oferece ferramentas robustas para o processamento de dados, essenciais para qualquer projeto de machine learning.
Objetivos de Aprendizado¶
- Entender o funcionamento das redes neurais.
- Desenvolver habilidades práticas em modelagem e treinamento de redes neurais com TensorFlow.
- Aplicar redes neurais em problemas reais de classificação e regressão.
Atividades Práticas¶
As seguintes atividades foram preparadas para reforçar os conceitos abordados (Faça o downlod dos datasets nos links a seguir)
Despesas Médicas – Problema de Regressão
- Contexto: Informações sobre pacientes (idade, índice de massa corporal, número de filhos, tabagismo, região, etc.) para prever o custo anual de despesas médicas.
- Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) para regressão.
- Métricas de Avaliação: RMSE e R² para avaliar a performance na estimativa dos custos.
- insurance: Dataset com informações sobre pacientes (idade, IMC, número de filhos, tabagismo, região, etc.) para prever o custo anual de despesas médicas.
Vendas com Base em Investimento Publicitário – Problema de Regressão
- Contexto: Dados sobre investimentos em TV, rádio e jornal, com o objetivo de prever o volume de vendas obtido.
- Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) para regressão.
- Métricas de Avaliação: RMSE (Root Mean Square Error) e R² para mensurar o erro e a capacidade explicativa do modelo.
- Advertising: Dataset com dados sobre investimentos em TV, rádio e jornal, com o objetivo de prever o volume de vendas obtido.
Rotatividade de Funcionários - Problema de Classificação Binária
- Contexto: Dataset com informações de funcionários, incluindo desempenho, tempo de casa, salário e histórico profissional, para prever se o colaborador irá deixar a organização.
- Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) com camadas densas.
- Métricas de Avaliação: Acurácia, Recall (especialmente para a classe de saída), F1-score e AUC para medir a capacidade do modelo em prever desligamentos.
- turnover: Dataset com informações de funcionários (nível de satisfação, avaliações, número de projetos, carga horária, tempo de empresa, setor e salário) para prever se o colaborador irá deixar a organização.
Churn de Clientes – Problema de Classificação Binária
- Contexto: Dataset com informações demográficas e financeiras de clientes de um banco, visando prever se o cliente irá encerrar sua conta (churn).
- Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) com camadas densas.
- Métricas de Avaliação: Acurácia, Precisão, Recall, F1-score e AUC para avaliar a capacidade do modelo em identificar clientes propensos ao churn.
- Churn_Modelling: Dataset com informações demográficas e financeiras de clientes de um banco, visando prever se o cliente irá encerrar sua conta (churn).
Pré-processamento e Tratamento de Dados¶
Antes de aplicar o treinamento de modelos, é necessário realizar o pré-processamento e o tratamento adequado dos dados. Esse processo inclui:
- Limpeza de Dados: Remoção de valores ausentes ou correção de dados corrompidos.
- Normalização/Padronização: Escalonamento dos valores numéricos para que o modelo não seja enviesado por características com escalas grandes.
- Codificação de Variáveis Categóricas: Transformação de variáveis categóricas em formatos numéricos que podem ser interpretados pelo modelo, como one-hot encoding.
Vamos começar!!!