Skip to content

TensorFlow

Neste módulo, vamos explorar os fundamentos das redes neurais e aplicar esses conceitos usando a biblioteca TensorFlow.

O TensorFlow não apenas facilita a construção e o treinamento de modelos complexos, mas também oferece ferramentas robustas para o processamento de dados, essenciais para qualquer projeto de machine learning.

Objetivos de Aprendizado

  • Entender o funcionamento das redes neurais.
  • Desenvolver habilidades práticas em modelagem e treinamento de redes neurais com TensorFlow.
  • Aplicar redes neurais em problemas reais de classificação e regressão.

Atividades Práticas

As seguintes atividades foram preparadas para reforçar os conceitos abordados (Faça o downlod dos datasets nos links a seguir)

Despesas Médicas – Problema de Regressão

  • Contexto: Informações sobre pacientes (idade, índice de massa corporal, número de filhos, tabagismo, região, etc.) para prever o custo anual de despesas médicas.
  • Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) para regressão.
  • Métricas de Avaliação: RMSE e R² para avaliar a performance na estimativa dos custos.
  • insurance: Dataset com informações sobre pacientes (idade, IMC, número de filhos, tabagismo, região, etc.) para prever o custo anual de despesas médicas.

Vendas com Base em Investimento Publicitário – Problema de Regressão

  • Contexto: Dados sobre investimentos em TV, rádio e jornal, com o objetivo de prever o volume de vendas obtido.
  • Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) para regressão.
  • Métricas de Avaliação: RMSE (Root Mean Square Error) e R² para mensurar o erro e a capacidade explicativa do modelo.
  • Advertising: Dataset com dados sobre investimentos em TV, rádio e jornal, com o objetivo de prever o volume de vendas obtido.

Rotatividade de Funcionários - Problema de Classificação Binária

  • Contexto: Dataset com informações de funcionários, incluindo desempenho, tempo de casa, salário e histórico profissional, para prever se o colaborador irá deixar a organização.
  • Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) com camadas densas.
  • Métricas de Avaliação: Acurácia, Recall (especialmente para a classe de saída), F1-score e AUC para medir a capacidade do modelo em prever desligamentos.
  • turnover: Dataset com informações de funcionários (nível de satisfação, avaliações, número de projetos, carga horária, tempo de empresa, setor e salário) para prever se o colaborador irá deixar a organização.

Churn de Clientes – Problema de Classificação Binária

  • Contexto: Dataset com informações demográficas e financeiras de clientes de um banco, visando prever se o cliente irá encerrar sua conta (churn).
  • Modelo Sugerido: Rede Neural Multilayer Perceptron (MLP) com camadas densas.
  • Métricas de Avaliação: Acurácia, Precisão, Recall, F1-score e AUC para avaliar a capacidade do modelo em identificar clientes propensos ao churn.
  • Churn_Modelling: Dataset com informações demográficas e financeiras de clientes de um banco, visando prever se o cliente irá encerrar sua conta (churn).

Pré-processamento e Tratamento de Dados

Antes de aplicar o treinamento de modelos, é necessário realizar o pré-processamento e o tratamento adequado dos dados. Esse processo inclui:

  • Limpeza de Dados: Remoção de valores ausentes ou correção de dados corrompidos.
  • Normalização/Padronização: Escalonamento dos valores numéricos para que o modelo não seja enviesado por características com escalas grandes.
  • Codificação de Variáveis Categóricas: Transformação de variáveis categóricas em formatos numéricos que podem ser interpretados pelo modelo, como one-hot encoding.

Vamos começar!!!