Reconhecimento de Imagens com Deep Learning

Classificação de Gatos vs Cachorros usando CNN

TensorFlow Keras Python Jupyter

AB

Prof. Alexsander Barreto

AlexHolanda.com.br

Disciplina: Deep Learning

Faculdade Senac DF

Agenda da Aula

🎯 Objetivos e Contexto

🧠 Fundamentos de Machine Learning

🔍 Redes Neurais Convolucionais

💻 Implementação Prática

⚠️ Problemas Comuns e Soluções

🚀 Transfer Learning

📈 Avaliação e Resultados

🔧 MLOps e Produção

Objetivos de Aprendizagem

🎯 Objetivos Principais:

Compreender os conceitos fundamentais de Deep Learning
Entender como funcionam as Redes Neurais Convolucionais
Aprender a implementar CNN com TensorFlow e Keras
Identificar e solucionar problemas como overfitting
Aplicar Transfer Learning em projetos reais

🛠️ Habilidades Práticas:

Preparar datasets de imagens
Construir arquitetura CNN
Treinar e avaliar modelos
Implementar técnicas de otimização

O que é Machine Learning?

💡 Machine Learning é como ensinar um computador a reconhecer padrões, similar a como uma criança aprende a distinguir gatos de cachorros.

🧠 Processo de Aprendizagem (Humano vs Máquina):

👶 Como uma Criança Aprende:

👁️ Vê muitas fotos de gatos com a mãe dizendo: "isso é gato"
🐕 Vê muitas fotos de cachorros: "isso é cachorro"
🧩 Cérebro identifica padrões: formato das orelhas, tamanho, etc.
🎯 Consegue identificar novos animais sozinha

🤖 Como um Computador Aprende:

💾 Recebe milhares de imagens rotuladas
⚙️ Algoritmo processa pixels e identifica padrões
📊 Ajusta parâmetros internos baseado nos exemplos
🎯 Faz previsões em imagens nunca vistas antes

💼 Exemplos no Mundo Real:

🏥 Diagnóstico médico por imagem

🚗 Carros autônomos

📱 Reconhecimento facial

🛒 Recomendações de produtos

🎬 Sugestões na Netflix

📧 Filtro de spam

💭 Ideia Principal: O computador não "entende" o que é um gato, mas aprende padrões matemáticos que associam características visuais à resposta correta!

Tipos de Aprendizagem

🎯 Aprendizagem Supervisionada

Como um professor que corrige provas

Sabemos as respostas corretas
Temos exemplos com gabarito
Modelo aprende com feedback

Exemplos: Classificação: gato/cachorro, Regressão: previsão de notas

✅ Nosso projeto usa este tipo!

🔍 Aprendizagem Não-Supervisionada

Como um detetive procurando pistas

Não sabemos as respostas
Modelo descobre padrões sozinho
Agrupa informações similares

Exemplos: Agrupamento de clientes, Detecção de anomalias

O que são Redes Neurais?

🧠 Como funciona nosso cérebro:

Neurônios recebem informações
Processam essas informações
Enviam resultado para outros neurônios
Formam uma rede de comunicação

🤖 Rede Neural Artificial:

Neurônios artificiais (nós)
Recebem dados numéricos
Fazem cálculos matemáticos
Passam resultado adiante

🏗️ Estrutura:

Camada de Entrada (olhos)

Camadas Ocultas (processamento)

Camada de Saída (decisão)

Deep Learning vs ML Tradicional

🔧 Machine Learning Tradicional

Como um técnico especialista:

Humano extrai características manualmente
Define quais features são importantes
Algoritmo usa essas features para decidir

Exemplo: Para reconhecer gatos: 'orelhas pontudas', 'bigodes', 'formato dos olhos'

🎯 Deep Learning

Como um especialista que aprende sozinho:

Recebe imagem completa
Aprende características automaticamente
Descobre padrões complexos sozinho

Exemplo: Aprende sozinho: texturas, formas, padrões que nem imaginávamos

💡 Vantagem: Não precisamos ser especialistas em gatos!

CNN - Redes Neurais Convolucionais

🔍 CNN é uma "receita especial" de IA projetada especificamente para entender imagens, como um oftalmologista é especialista em olhos.

� Como Seus Olhos Processam uma Imagem:

1

Bordas e Linhas

Primeiro você vê contornos básicos

2

Formas Simples

Depois identifica círculos, retângulos

3

Partes Complexas

Reconhece olhos, nariz, orelhas

4

Objeto Completo

Finalmente vê: "É um gato!"

⭐ Por que CNN é Especial para Imagens?

🔍

Detecta Padrões Locais

Como uma lupa que examina pequenas partes da imagem

📐

Mantém Relações Espaciais

Sabe que os olhos ficam acima da boca

🎯

Hierarquia de Complexidade

Das bordas simples até objetos complexos

⚡

Compartilha Aprendizado

Um padrão aprendido serve para toda a imagem

💡 Conexão com o Mundo Real: CNNs são usadas em carros autônomos para identificar pedestres, placas de trânsito e outros veículos - exatamente como nossos olhos fazem quando dirigimos!

Como funciona uma CNN?

🔍 Filtro/Kernel = Scanner Inteligente

Imagine um scanner de mesa que examina uma foto, mas ao invés de apenas copiar, ele procura características específicas como bordas, curvas, texturas...

⚙️ Processo Passo a Passo:

1

🔍 3x3

Convolução - O "Scanner"

O que faz: Um filtro pequeno (3x3 pixels) passa por toda a imagem

Como funciona: Multiplica os valores dos pixels e soma o resultado

Analogia: Como passar um ímã sobre areia para encontrar ferro

Conv2D(32 filtros, tamanho 3x3)

2

⚡

Função de Ativação (ReLU)

O que faz: Remove valores negativos, mantém apenas os positivos

Por quê: Destacar apenas as características importantes

Analogia: Como um marcador que só risca onde encontra o que procura

Entrada: [-2, 5, -1, 8] → Saída: [0, 5, 0, 8]

3

📉

Pooling - O "Resumo"

O que faz: Pega o valor mais importante de cada região

Vantagem: Reduz o tamanho da imagem mantendo info essencial

Analogia: Como resumir um capítulo de livro nos pontos principais

Região 2x2: [1,3,2,5] → MaxPool: 5

🎨 Múltiplos Filtros = Múltiplas Perspectivas

📏

Filtro de Bordas

Encontra linhas e contornos

🌊

Filtro de Texturas

Identifica padrões repetitivos

⚪

Filtro de Curvas

Reconhece formas arredondadas

🔺

Filtro de Cantos

Detecta vértices e pontas

🎯 Resultado Final: Cada filtro cria um "mapa" destacando onde encontrou suas características específicas. Juntos, eles formam uma "impressão digital" da imagem que o computador usa para fazer a classificação!

Componentes de uma CNN

🔍

Camada Convolucional

Detector de padrões

Como um scanner que procura formas específicas

Filtros: 16, 32, 64...

⚡

Camada de Ativação (ReLU)

Liga/Desliga neurônios

Como um interruptor: liga se importante, desliga se não

Remove valores negativos

📉

Camada de Pooling

Resumir informações

Como fazer um resumo dos pontos principais

MaxPooling: pega o maior valor

🧠

Camada Densa

Decisão final

Como o cérebro que toma a decisão final

128 neurônios → 1 saída

Ferramentas: TensorFlow e Keras

🏗️

TensorFlow

A 'fábrica' de inteligência artificial

Como uma fábrica completa de carros - tem tudo que precisamos

Plataforma completa
Open source
Google

🎨

Keras

O 'assistente amigável' do TensorFlow

Como um assistente que simplifica tarefas complexas

API simples
Alto nível
Fácil de usar

📓

Jupyter Notebook

Caderno interativo para programar

Como um caderno onde você escreve código e vê resultados instantaneamente

Interativo
Visual
Didático

Nosso Projeto: Gatos vs Cachorros

🎯 Missão: Criar um "Especialista em Pets" Digital

Vamos ensinar um computador a identificar se uma foto mostra um gato ou um cachorro

🗺️ Jornada do Projeto:

📸

1. Coleta de Dados

Milhares de fotos de gatos e cachorros

🛠️

2. Preparação

Redimensionar e organizar as imagens

🧠

3. Treinamento

Ensinar a rede neural os padrões

✅

4. Teste

Ver se realmente aprendeu

📊 Nosso Dataset (Conjunto de Dados):

🎯

Treinamento

2.000 imagens

1.000 gatos + 1.000 cachorros

Para ensinar o modelo

🔍

Validação

1.000 imagens

500 gatos + 500 cachorros

Para acompanhar o aprendizado

🏆

Teste Final

Imagens separadas

Nunca vistas antes

Para avaliar se realmente aprendeu

🎓 Analogia com Estudos:

Aulas (Treinamento): Professor mostra exemplos e explica

Exercícios (Validação): Prática durante o curso

Prova Final (Teste): Avaliação com questões novas

🌍 Onde Isso é Usado no Mundo Real:

🏥

Medicina

Detectar câncer em exames de imagem

🚗

Carros Autônomos

Identificar pedestres e obstáculos

🛡️

Segurança

Reconhecimento facial em aeroportos

🛒

Varejo

Checkout automático em lojas

🌱

Agricultura

Monitorar saúde das plantas

💡 Objetivo Principal: Ao dominar este projeto simples de gatos vs cachorros, vocês terão as bases para trabalhar com qualquer tipo de classificação por imagem!

Preparação dos Dados - Passo a Passo

🍳 Como preparar ingredientes antes de cozinhar um prato especial

Assim como um chef organiza ingredientes, precisamos preparar nossas imagens para a CNN

🔄 Pipeline de Preparação dos Dados

📂

1. Coleta do Dataset

Cats and Dogs Dataset: 25.000 imagens

12.500 imagens de gatos
12.500 imagens de cachorros
Variações de tamanho, iluminação, poses

tf.keras.utils.get_file('cats_and_dogs.zip', origin=URL)

🔀

2. Divisão Estratégica

Como dividir um baralho para diferentes jogos:

Treinamento: 20.000 imagens (80%)
Validação: 2.500 imagens (10%)
Teste: 2.500 imagens (10%)

Proporção balanceada entre classes

📐

3. Redimensionamento Inteligente

160x160 pixels - tamanho otimizado

Preserva detalhes importantes
Reduz custo computacional
Padroniza entrada da rede

tf.image.resize(image, [160, 160])

📊

4. Normalização dos Pixels

De [0-255] para [0-1]: Facilita o aprendizado

Evita problemas de gradiente
Acelera convergência
Melhora estabilidade numérica

tf.cast(image, tf.float32) / 255.0

🎨 Data Augmentation - Criando Variações

�

Rotação

Gira imagem até 40°

↔️

Flip Horizontal

Espelha horizontalmente

🔍

Zoom

Aproxima até 20%

💡

Brilho

Varia iluminação

💡 Resultado: De 20.000 imagens → 100.000+ variações para treinamento!

Arquitetura da CNN - Implementação Real

🏗️ Construindo nossa CNN com TensorFlow/Keras

Cada camada tem um propósito específico, como andares de um edifício especializado

💻 Código Real da Implementação

📥 Criando o Modelo Sequencial
model = tf.keras.Sequential([
    # Camada de entrada e normalização
    tf.keras.layers.Rescaling(1./255),
    
    # Primeiro bloco convolucional
    tf.keras.layers.Conv2D(16, 3, activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    
    # Segundo bloco convolucional  
    tf.keras.layers.Conv2D(32, 3, activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    
    # Terceiro bloco convolucional
    tf.keras.layers.Conv2D(64, 3, activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    
    # Classificação
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])
                    

🔍 Detalhamento de Cada Camada

🎯 Input + Rescaling

Entrada: (160, 160, 3) → Normalização: /255

Shape: (160, 160, 3) Params: 0

🔍 Conv2D (16 filtros, 3x3)

Detecta bordas e padrões básicos

Output: (158, 158, 16) Params: 448

📉 MaxPooling2D (2x2)

Reduz dimensões, mantém características

Output: (79, 79, 16) Params: 0

🔍 Conv2D (32 filtros, 3x3)

Detecta formas e texturas complexas

Output: (77, 77, 32) Params: 4,640

📉 MaxPooling2D (2x2)

Segunda redução dimensional

Output: (38, 38, 32) Params: 0

🔍 Conv2D (64 filtros, 3x3)

Reconhece objetos complexos

Output: (36, 36, 64) Params: 18,496

📉 MaxPooling2D (2x2)

Terceira redução dimensional

Output: (18, 18, 64) Params: 0

📏 Flatten

Converte matriz 3D em vetor 1D

Output: (20,736) Params: 0

🎲 Dropout (0.2)

Previne overfitting - 20% neurônios desligados

Output: (20,736) Params: 0

🧠 Dense (128 neurônios)

Aprendizado de alta-level features

Output: (128) Params: 2,654,336

🎯 Dense (1 neurônio, sigmoid)

Classificação binária: 0=gato, 1=cachorro

Output: (1) Params: 129

📊 Resumo do Modelo

Total de Parâmetros: 2,678,049

Parâmetros Treináveis: 2,678,049

Tamanho do Modelo: ~10.2 MB

💡 Insight: A maior parte dos parâmetros (99%) está na primeira camada densa, onde os 20.736 features extraídos pelas convoluções são processados pelos 128 neurônios.

Processo de Treinamento - Na Prática

🏃‍♀️ Como treinar para uma maratona, mas com dados

O computador "aprende" ajustando milhões de parâmetros através de exemplos

⚙️ Configuração do Treinamento

🎯

Compilação do Modelo

model.compile(
    optimizer='adam',           # Otimizador inteligente
    loss='binary_crossentropy', # Função de erro
    metrics=['accuracy']        # Métrica de avaliação
)

📊

Parâmetros de Treinamento

Epochs: 15 (passadas completas no dataset)
Batch Size: 32 (imagens processadas por vez)
Learning Rate: 0.001 (velocidade de aprendizado)
Validation Split: 20% (para acompanhar progresso)

🔄 O Ciclo de Treinamento

1

📥 Forward Pass

O que acontece: Imagem passa por todas as camadas

Imagem (160x160) → Conv layers → Features (20,736)
Features → Dense layers → Probabilidade (0-1)
Resultado: "86% certeza que é cachorro"

prediction = model(batch_images)

2

📏 Loss Calculation

Calculando o erro: Quão longe estamos do correto?

Previsão: 0.86 (86% cachorro)
Realidade: 1.0 (100% cachorro)
Erro: 0.14 (14% de diferença)

loss = binary_crossentropy(y_true, y_pred)

3

⬅️ Backward Pass (Backpropagation)

Aprendendo com o erro: Como melhorar?

Calcula gradientes (direção da melhoria)
Propaga erro de volta pelas camadas
Identifica quais parâmetros ajustar

gradients = tape.gradient(loss, model.trainable_variables)

4

🔧 Parameter Update

Ajuste inteligente: Adam optimizer em ação

Atualiza 2,678,049 parâmetros simultaneamente
Usa momentum e adaptive learning rate
Pequenos ajustes = grande impacto coletivo

optimizer.apply_gradients(zip(gradients, variables))

📈 Monitoramento Durante o Treinamento

🎯

Training Accuracy

Como o modelo está performando nos dados de treino

Epoch 1: 60% → Epoch 15: 95%

🔍

Validation Accuracy

Performance em dados nunca vistos (mais importante!)

Epoch 1: 55% → Epoch 15: 87%

📉

Loss

Medida do erro - deve diminuir com o tempo

Epoch 1: 0.7 → Epoch 15: 0.2

💻 Comando de Treinamento

# Iniciando o treinamento
history = model.fit(
    train_dataset,
    epochs=15,
    validation_data=validation_dataset,
    verbose=1
)

# Resultado típico:
# Epoch 15/15
# 625/625 [======] - 45s - loss: 0.2089 - accuracy: 0.9210 
# - val_loss: 0.3876 - val_accuracy: 0.8740

Feedforward e Backpropagation

🎯 Como uma criança aprende com os erros

➡️ Feedforward - Tentativa

Modelo faz uma previsão

Criança chuta: "Isso é um gato!"

⬅️ Backpropagation - Correção

Modelo aprende com o erro

Professor diz: "Não, era um cachorro!"

🔄 Este ciclo se repete milhares de vezes até o modelo aprender!

Funções de Ativação

⚡ Como interruptores inteligentes

🔛 ReLU

Regra: Se positivo: passa. Se negativo: bloqueia (vira 0)

Como um guarda que só deixa pessoas 'positivas' passarem

📊 Sigmoid

Regra: Transforma qualquer número em valor entre 0 e 1

Como um conversor de notas para porcentagem

Problema: Overfitting

📚 Como um estudante que 'decoreba' ao invés de entender

Modelo funciona muito bem nos dados de treino, mas mal em dados novos

✅ Bom estudante:

Estuda, entende conceitos, vai bem em qualquer prova

❌ Mau estudante:

Decora respostas, vai bem só em provas iguais ao treino

Soluções para Overfitting

🎯 Dropout

Como estudar em grupo - não depender só de uma pessoa

Dropout(0.2) - desliga 20%

🔄 Data Augmentation

Como estudar com livros diferentes sobre o mesmo assunto

RandomRotation, RandomFlip

🧠 Mais Parâmetros

Como dar mais neurônios para o cérebro pensar

Conv2D(64) ao invés de Conv2D(16)

Transfer Learning

🎓 Como um PhD ajudando um estudante iniciante

Usar conhecimento de um modelo já treinado em milhões de imagens

✅ Benefícios:

Menos tempo de treino
Melhor performance
Precisa de menos dados

Resultados e Análise de Performance

📊 Evolução dos Resultados

🥉

Modelo Inicial (Baseline)

Training Accuracy: 95%

Validation Accuracy: 72%

Gap (Overfitting): 23%

❌ Problemas Identificados:

Overfitting severo
Poor generalization
Instabilidade nas previsões

🥈

Modelo com Melhorias

Training Accuracy: 89%

Validation Accuracy: 85%

Gap (Overfitting): 4%

✅ Melhorias Aplicadas:

Data Augmentation
Dropout (0.2)
Early Stopping

🏆

Transfer Learning (MobileNetV2)

Training Accuracy: 97%

Validation Accuracy: 95%

Gap (Overfitting): 2%

🚀 Vantagens:

Convergência rápida
Excelente generalização
Menos dados necessários

🔬 Análise Detalhada dos Resultados

📈

Curvas de Aprendizagem

O que observamos:

Baseline: Training accuracy sobe rapidamente, validation estagna
Melhorado: Curvas mais próximas, indicando melhor generalização
Transfer Learning: Ambas curvas sobem suavemente juntas

⚡

Tempo de Treinamento

Baseline: 15 epochs × 3 min = 45 min

Melhorado: 25 epochs × 3 min = 75 min

Transfer Learning: 10 epochs × 5 min = 50 min

�

Análise de Erros

Tipos de erro mais comuns:

False Positives: Gatos classificados como cachorros (3%)
False Negatives: Cachorros classificados como gatos (2%)
Casos difíceis: Filhotes, imagens escuras, múltiplos animais

🧩 Matriz de Confusão (Transfer Learning)

Predito: Gato

Predito: Cachorro

Real: Gato

475
(95%)

25
(5%)

Real: Cachorro

15
(3%)

485
(97%)

Precision (Gatos): 475/(475+15) = 97%

Recall (Gatos): 475/(475+25) = 95%

F1-Score: 2×(97%×95%)/(97%+95%) = 96%

💡 Principais Aprendizados

🎯

Data Augmentation é Crucial

Aumentou accuracy de validação em 13 pontos percentuais

🚀

Transfer Learning Acelera Tudo

Atingiu 95% de accuracy em apenas 10 epochs

⚖️

Balance Training vs Validation

Gap < 5% indica boa generalização

📊

Monitore Métricas Certas

Validation accuracy é mais importante que training

🏆 Modelo Final: Transfer Learning com MobileNetV2 atingiu 95% de accuracy em validação, com apenas 2% de overfitting e convergência em 10 epochs. Pronto para produção!

MLOps - Colocando em Produção

🏭 Como transformar uma receita de cozinha em restaurante industrial

💻 Desenvolvimento

Criar e treinar modelo

🚀 Deploy

Colocar modelo online para usar

📊 Monitoramento

Acompanhar performance em produção

Próximos Passos

🏃‍♀️ Para Praticar Hoje:

Executar o código no Google Colab
Experimentar com diferentes hiperparâmetros
Testar outras técnicas de Data Augmentation
Comparar diferentes modelos pré-treinados

🚀 Tópicos Avançados:

Object Detection (YOLO, R-CNN)
Segmentação de Imagens
GANs (Redes Adversárias)
Attention Mechanisms e Transformers

Recursos para Continuar Estudando

🎓 Cursos Gratuitos:

TensorFlow no Coursera
Deep Learning Specialization (Andrew Ng)
Fast.ai - Practical Deep Learning
CS231n - Stanford CNN Course

💻 Plataformas Práticas:

Google Colab - Ambiente gratuito
Kaggle - Competições e datasets
Jupyter Notebooks - Para experimentar
GitHub - Projetos open source

Perguntas e Discussão

🤔 Perguntas para Reflexão:

Que outros problemas podemos resolver com CNN?
Como podemos melhorar ainda mais nosso modelo?
Quais são os desafios éticos de reconhecimento de imagens?
Como esta tecnologia impacta nossa sociedade?

❓ Dúvidas Práticas:

Dúvidas sobre implementação?
Conceitos que ficaram confusos?
Ideias para projetos próprios?
Dificuldades encontradas?

📞 Contato:

Prof. Alexsander Barreto

AlexHolanda.com.br

Disponível para dúvidas

Materiais: Disponível no site do professor

📅 Próxima aula: Implementação prática em laboratório!

🎯 Conclusões e Próximos Passos

📊 O que Conquistamos

🎯

95% de Accuracy

Classificação precisa entre gatos e cachorros usando Transfer Learning com MobileNetV2

Precision: 97% Recall: 95% F1-Score: 96%

⚡

Eficiência Comprovada

Convergência rápida com apenas 10 epochs e baixo overfitting (2%)

Tempo: 50min Parâmetros: 2.3M Tamanho: 9MB

🧠

Conhecimento Sólido

Domínio completo do pipeline de Deep Learning para visão computacional

CNN Architecture Transfer Learning Data Augmentation

💡 Principais Aprendizados

🛠️

Técnico

Data Augmentation é crucial: Aumentou accuracy em 13%
Transfer Learning acelera tudo: Reduz tempo de desenvolvimento em 70%
Monitoramento é fundamental: Early stopping previne overfitting
Batchs pequenos funcionam: Batch size 32 foi ideal

📊

Metodológico

Validação > Training accuracy: Métrica mais confiável
Gap < 5% indica sucesso: Boa generalização
Matriz de confusão revela tudo: Análise detalhada de erros
Baseline primeiro: Sempre compare com modelo simples

🚀

Estratégico

Start simple, then optimize: Iteração é a chave
Data quality > quantity: 4000 imagens bem curadas bastaram
Pre-trained models save time: ImageNet knowledge é ouro
Monitor desde o início: TensorBoard é essencial

🚀 Próximos Passos

1

Implementação Imediata

Deploy do modelo em Flask/FastAPI
Interface web para upload de imagens
Containerização com Docker
Testes A/B com usuários

⏱️ 2-3 semanas

2

Melhorias de Curto Prazo

Adicionar mais classes (pássaros, cavalos...)
Implementar explicabilidade (GradCAM)
Otimização para mobile (TensorFlow Lite)
Sistema de feedback do usuário

⏱️ 1-2 meses

3

Visão de Longo Prazo

Detecção de objetos (YOLO)
Segmentação semântica
Pipeline MLOps completo
Modelos personalizáveis por usuário

⏱️ 3-6 meses

🌍 Aplicações Práticas do Conhecimento

🏥

Medicina

Classificação de imagens médicas, detecção de tumores, análise de radiografias

CNN + Transfer Learning

🚗

Automobilística

Detecção de placas, reconhecimento de sinais, sistemas de navegação autônoma

YOLO + CNN

🛒

E-commerce

Busca visual de produtos, recomendações por imagem, controle de qualidade

Embedding + Similarity

🔒

Segurança

Reconhecimento facial, detecção de comportamentos suspeitos, controle de acesso

Face Recognition + CNN

AB

Prof. Alexsander Barreto

AlexHolanda.com.br

🎓 Parabéns! Você Domina Deep Learning!

Com este projeto, você demonstrou conhecimento sólido em: Redes Neurais Convolucionais, Transfer Learning, Data Augmentation, Regularização e Avaliação de Modelos.

Agora você está preparado para enfrentar qualquer desafio em Computer Vision e Deep Learning! 🚀

Seu próximo desafio: Aplique esses conceitos em um problema real do seu interesse!

🌐 Visite: AlexHolanda.com.br

💬 Entre em contato para dúvidas

🎓 Guia de Uso da Apresentação

⌨️ Atalhos de Teclado

🖱️ Controles do Mouse

📱 Gestos Touch (Mobile)

🎯 Dicas para Educadores

⚙️ Configurações

Aparência

Navegação

Acessibilidade

Exportar

Reconhecimento de Imagens com Deep Learning

Classificação de Gatos vs Cachorros usando CNN

Prof. Alexsander Barreto

Agenda da Aula

Objetivos de Aprendizagem

🎯 Objetivos Principais:

🛠️ Habilidades Práticas:

O que é Machine Learning?

🧠 Processo de Aprendizagem (Humano vs Máquina):

👶 Como uma Criança Aprende:

🤖 Como um Computador Aprende:

💼 Exemplos no Mundo Real:

Tipos de Aprendizagem

🎯 Aprendizagem Supervisionada

🔍 Aprendizagem Não-Supervisionada

O que são Redes Neurais?

🧠 Como funciona nosso cérebro:

🤖 Rede Neural Artificial:

🏗️ Estrutura:

Deep Learning vs ML Tradicional

🔧 Machine Learning Tradicional

🎯 Deep Learning

CNN - Redes Neurais Convolucionais

� Como Seus Olhos Processam uma Imagem:

⭐ Por que CNN é Especial para Imagens?

Detecta Padrões Locais

Mantém Relações Espaciais

Hierarquia de Complexidade

Compartilha Aprendizado

Como funciona uma CNN?

🔍 Filtro/Kernel = Scanner Inteligente

⚙️ Processo Passo a Passo:

Convolução - O "Scanner"

Função de Ativação (ReLU)

Pooling - O "Resumo"

🎨 Múltiplos Filtros = Múltiplas Perspectivas

Filtro de Bordas

Filtro de Texturas

Filtro de Curvas

Filtro de Cantos

Componentes de uma CNN

Camada Convolucional

Camada de Ativação (ReLU)

Camada de Pooling

Camada Densa

Ferramentas: TensorFlow e Keras

TensorFlow

Keras

Jupyter Notebook

Nosso Projeto: Gatos vs Cachorros

🎯 Missão: Criar um "Especialista em Pets" Digital

🗺️ Jornada do Projeto:

1. Coleta de Dados

2. Preparação

3. Treinamento

4. Teste

📊 Nosso Dataset (Conjunto de Dados):

Treinamento

Validação

Teste Final

🎓 Analogia com Estudos:

🌍 Onde Isso é Usado no Mundo Real:

Preparação dos Dados - Passo a Passo

🔄 Pipeline de Preparação dos Dados

1. Coleta do Dataset

2. Divisão Estratégica

3. Redimensionamento Inteligente

4. Normalização dos Pixels

🎨 Data Augmentation - Criando Variações

Rotação