Publicado originalmente em IAEDPraxis: Caminhos Inteligentes na Educação, em 11 de outubro de 2024.
A professora de literatura olha para sua turma, buscando uma maneira de tornar “Dom Casmurro” mais acessível para seus alunos do Ensino Médio. Ela imagina como seria poder mostrar Capitu e Bentinho como Machado de Assis os descreveu, ou recriar cenas do Rio de Janeiro do século XIX. Até pouco tempo atrás, isso exigiria habilidades artísticas ou um orçamento para contratar um ilustrador. Mas e se, com apenas algumas palavras digitadas, ela pudesse criar essas imagens, instantaneamente?

O poder da visualização na aprendizagem
Para iniciar nossa conversa, vamos considerar a Teoria Dual da Codificação que propõe que nosso cérebro processa a informação através de dois canais paralelos, o verbal e o não-verbal. Proposta em 1971, é uma teoria bem documentada e através dela sabemos que quando uma informação é codificada através de mais de um canal, é mais provável que ela seja retida. Importante notar, estes canais são independentes entre si, mas interconectados.

Também da neurociência sabemos que o cérebro não somente processa imagens muito mais rapidamente do que texto, mas explicita relações que seriam implícitas.
Para a sala de aula, então, as imagens funcionam como âncoras para a memória, facilitando a compreensão de conceitos abstratos e estimulando a criatividade. Usadas na ilustração dos passos de um processo, facilitam a compreensão. E particularmente, transcendendo barreiras linguísticas, tornam o aprendizado mais inclusivo, especialmente para a comunidade surda.
Ferramentas de geração de imagens por IA
Com um olho no enorme e lucrativo mercado do audiovisual, existem na atualidade diversas ferramentas de IA generativa de imagens. Em comum, elas permitem que os usuários criem imagens a partir de descrições textuais, sendo treinadas através dos chamados modelos de difusão.
Cada uma tem suas particularidades: enquanto o DALL-E é conhecido por sua versatilidade, atualmente estando integrado ao ChatGPT, o Midjourney destaca pelo realismo de suas imagens, embora possua uma curva de aprendizado maior. E logo o Bing Image Creator e o Microsoft Designer funcionam juntamente com o Copilot e outros produtos da Microsoft, a exemplo do Office 365.
Recordando o histórico de desenvolvimento recente da IA, o DALL-E, desenvolvido pela OpenAI (criadora do ChatGPT), atraiu a atenção do público mesmo antes do surgimento do famoso agente conversacional. Inicialmente, os resultados eram bem limitados, frequentemente imagens distorcidas ou pouco realistas. Evoluindo, os modelos de IA começaram a gerar imagens mais coerentes, ainda que dotadas de imperfeições curiosas, como as emblemáticas mãos com seis dedos.


Na atualidade, porém, todas estas ferramentas estão atingindo um nível de maturidade, oferecendo resultados mais precisos e, portanto, utilizáveis em diversos contextos. Além do uso generalista, plataformas como Night Café, Leonardo AI e Deviant Art Dreamup são orientadas para criações visuais mais específicas, incluindo design gráfico.
Em termos de acesso, em geral possuem um modelo de utilização gratuita, baseada em créditos renováveis, além das assinaturas premium, com mais capacidade de geração e mais recursos. A exceção é Midjourney que conta somente com o modelo de assinatura.
Aplicações práticas em sala de aula
As possibilidades de uso da geração de imagens por IA no contexto pedagógico são amplas. Mais além de imagens para utilização em apresentações, algumas imagens cumprem objetivos cognitivos específicos.
Em aulas de História, cenas de períodos históricos podem ser recriadas. Em literatura, personagens e cenários podem ser visualizados, enriquecendo a experiência de leitura. Já as aulas de Arte podem explorar estilos e técnicas diversas, estimulando a criatividade dos alunos. As imagens possuem lugar até mesmo na Matemática, conforme problemas complexos possam ser ilustrados visualmente, facilitando a compreensão.
Além disso, a possibilidade de os alunos criarem por conta própria amplia ainda mais o potencial educativo. Ao se envolverem ativamente no processo de aprendizagem, esta torna-se mais significativa. Uma prática que estimule a criatividade permite que os estudantes expressem suas interpretações de conceitos e temas abordados em sala, com a internalização do conhecimento.
Assim, a geração de imagens vai além da criação visual. Ele oferece uma oportunidade para desenvolver as tão comentadas habilidades para o século XXI. A escrita de prompts, por exemplo, envolve não somente a criatividade, mas o pensamento crítico, no sentido de que é preciso analisar e refinar os resultados obtidos.
Ao mesmo tempo, o letramento digital é desenvolvido a partir da interação com a tecnologia, sempre e quando ressignificado em termos das discussões sobre ética, direitos autorais e o impacto da IA na sociedade.
Neste ponto cabe ressaltar, o treinamento de IA com base em imagens possuidoras de direitos autorais é um tema altamente controverso. A discussão revela uma tensão entre avanço tecnológico e proteção dos direitos dos criadores, envolvendo uso justo (“fair use“), compensação adequada e o impacto potencial no mercado criativo.
Desafios e considerações éticas
Apesar de seu potencial, o uso de IA para geração de imagens traz desafios significativos. A questão dos direitos autorais é complexa: quem é o verdadeiro criador da imagem? Como citar corretamente?

Há também preocupações sobre a perpetuação de estereótipos e de vieses presentes nos dados de treinamento das IAs.

Finalmente, a facilidade de criar os chamados “deepfakes” (vídeos e áudios falsos, mas extremamente realistas) levanta questões sobre desinformação e manipulação, relacionando-se com uma leitura crítica da realidade.


Estratégias de implementação
Para integrar a geração de imagens por IA na sala de aula, precisamos pensar numa abordagem equilibrada. É recomendável começar com projetos simples, em plano de experimentação, complementando o currículo existente.
Entretanto, como passo zero, a imagem gerada deve ser avaliada em função de sua qualidade e de seu potencial de atender às necessidades educacionais específicas. Aqui cabe lembrar o caso de uma imagem utilizada num artigo científico – lamentavelmente revisado e aprovado – de um rato anatomicamente impossível. O episódio chamou a atenção para os possíveis danos que a baixa confiabilidade da atual tecnologia pode ter para a comunicação e educação científicas.

Do ponto de vista da tarefa pedagógica, o professor também encorajar seus alunos a comparar as imagens sintéticas com fontes tradicionais, estimulando a criticidade.

Quando criadas de forma sequencial e relacionada podem integrar narrativas digitais. Aqui convém lembrar, o conceito e a prática de narrativa digital é anterior ao advento das IAs, como uma forma de potencializar a criatividade, a argumentação e o planejamento do processo comunicacional que a criação de estórias envolve.
Em relação à criatividade, um dos aspectos que tanto chama a atenção das imagens geradas por IA é seu caráter transgressor da realidade, subversivo. Embora este tipo de imagem possa ser feito com técnicas artísticas mais tradicionais, o grau de realismo junto à facilidade de uso potencializam este tipo de uso. Dessa forma, imagens de alguma forma inesperadas ou que choquem com nossas concepções de mundo, incluídas as de base científicas, podem ser utilizadas para gerar discussões e problematizar questões.
Além disso, podem ser desenvolvidas atividades que combinem a geração de imagens por IA com técnicas artísticas tradicionais, promovendo uma abordagem híbrida. Tal perspectiva também trabalharia a criatividade a integração de conceitos.
Neste ponto, o conhecimento acumulado da pesquisa em tecnologia educacional já aponta direções: o recurso tecnológico pode ser um ponto de partida para discussões mais mais amplas, envolvendo ética, tecnologia e criatividade. O papel do professor passa a ser o de mediação pedagógica, orienta e direciona a experiência.
Em conclusão
Como já comentado numa edição anterior da newsletter, o avanço da geração de imagens por IA foi rápido e surpreendente. Conforme amadurecer, as imagens sintéticas são um recurso a mais para se alcançar a compreensão, especialmente para processos e conceitos complexos. Entretanto, além da adequação da imagens geradas em termos de precisão e ausência de vieses. E de forma mais, ampla também será necessário estar atento para a discussão sobre direitos autorais, impactos ambientais e a própria viabilidade financeira da IA generativa.
Se você chegou até aqui, é por que gosta de nosso conteúdo. Mas para gostar ainda mais, pedimos que responsa a nossa pesquisa de leitores.