
Poderia me defender, argumentando forma ampla a cultura brasileira se fecha para a acessibilidade? Por falta de debate e mesmo de convivência social, penso que praticamos uma invisibilidade em relação à deficiência e suas necessidades, apesar dos avanços recentes na legislação. Particularmente, a inclusão educacional plena para pessoas com deficiência continua sendo um obstáculo em muitas instituições de ensino e na Educação.
Retornando a minha experiência, o contato com alunos surdos, junto a uma progressiva inclusão de alunos com algum tipo de necessidade, levou-me a um projeto de tornar a disciplina Fundamentos da Educação mais acessível. Esta matéria é uma matéria comum a todas as Licenciaturas da Universidade Federal de Pernambuco, ou seja, o departamento ao qual pertenço tem uma grande responsabilidade ao oferecê-la. Num trabalho coletivo com outros professores avançamos num plano de disciplina comum, pensando a acessibilidade cognitiva e formatamos todos os textos utilizados para que pudessem ser lidos por ferramentas de tecnologia assistiva.
Mas foi ao me deparar com a necessidade de incluir a audiodescrição em cada uma das imagens – fotos, gráficos, diagramas – utilizadas em apresentações de aula que percebi a dimensão do esforço envolvido. Não somente em termos de tempo, mas de que as descrições atendessem a requisitos técnicos, capturando detalhes relevantes e evitando interpretações dúbias ou tendenciosas.
É neste ponto que entra a Inteligência Artificial (IA). Avanços recentes como a capacidade dos chats “enxergarem” imagens sinalizam para uma experiência educacional mais equitativa. Esta mudança pode operar em dois sentidos: a adaptação de materiais e recursos didáticos de forma a satisfazer os requisitos da acessibilidade e tecnologias assistivas que proporcionem autonomia e meios de superação de barreiras físicas, comunicativas ou cognitivas.
Materiais didáticos acessíveis: transitando entre modalidades de linguagem
Como modelos de linguagem, o ChatGPT e seus congêneres têm se mostrado particularmente úteis para a criação e adaptação de recursos didáticos acessíveis.
Para a comunidade surda, a geração de legendas e transcrições a partir de recursos audiovisuais é um cuidado necessário, que não pode mais ser ignorado. Dessa forma, aulas gravadas, vídeos educativos, filmes, documentários e podcasts – além de toda e qualquer imagem utilizada em apresentações ou textos digitais – passam a incorporar estes recursos tão necessários para a acessibilidade.
Para cegos e pessoas com baixa visão, a audiodescrição opera no outro sentido, passando textos e imagens para a linguagem oral. A possibilidade de geração automatizada de narrações, comentários, descrições detalhadas e transcrições fazem com que materiais baseados em imagem, incluindo texto escrito, passem a cumprir com requisitos de acessibilidade.

Audiodescrição gerada com ChatGPT e editada: A imagem mostra uma tela de computador com um software de reconhecimento facial em execução. Há uma clara sobreposição de uma interface gráfica dizendo “Face Detectada” em letras azuis claras, indicando que um rosto foi detectado pelo sistema. Na tela, vemos uma máscara de rosto humano com vários pontos vermelhos mapeando características faciais significativas, como contornos dos olhos, sobrancelhas, nariz, boca e contorno do rosto, que são comuns em tecnologias de reconhecimento facial. A máscara está sendo segurada por uma mulher negra, reconhecível pela cor da pele, uso de brincos e cabelos cacheados.
A mesma descrição, falada com voz gerada pelo TTS Maker.
A transformação também pode ocorrer no âmbito de um mesmo domínio semântico, isto é, numa mesma modalidade. Como exemplo, a adaptação de materiais textuais em função do nível de complexidade e estilo de linguagem, buscando facilitar sua compreensão. Neste ponto, cabe ressaltar que a inclusão educacional deve ser pensada de forma ampla, incluindo as dificuldades de aprendizagem, a neurodivergência, o público idoso, entre outros. A acessibilidade, não é somente física, é cognitiva.
Além disso, a prática da acessibilidade costuma beneficiar a todos. Quantas vezes não optamos por subir uma rampa de acesso, mesmo não tendo dificuldades de locomoção física? A mesma ideia se aplica a nossa discussão. Ao se tornarem pesquisáveis, as transcrições de recursos audiovisuais possibilitam a navegação, pesquisa e anotação no próprio material. Audiotextos certamente serão bem vindos por estudantes que gastam horas no transporte. E a audiodescrição de uma imagem nos faz perceber detalhes e nos proporciona interpretações que escapam a olhos já saturados de informação.
Finalmente, a transformação de materiais didáticos pode, potencialmente, aumentar a diversidade através de representações culturais específicas, para grupos específicos de alunos. Este uso nos leva ao tema de uma futura edição da newsletter, a inter e multiculturalidade facilitada pela AI.
Superando as barreiras de interface
Mais além da criação e adaptação de materiais didáticos, a Inteligência Artificial tem uso promissor ao ser associada às tecnologias assistivas. Em destaque, algumas possibilidades:
-
Sistemas de reconhecimento e conversão de voz aprimorados por IA para estudantes com deficiências motoras ou de fala.
-
Interfaces de comunicação aumentativa e alternativa baseadas em IA para pessoas com dificuldades de linguagem a se expressar e interagir.
-
Ferramentas de transcrição em tempo real para surdos ou pessoas com deficiência auditiva, facilitando o acompanhamento de aulas e palestras.
-
Robôs assistivos equipados com IA para auxiliar na mobilidade e na realização de atividades diárias de estudantes com deficiências físicas severas.
Com uma dose de controvérsia, o próprio chip da empresa Neuralink, de Elon Musk, implantado no cérebro de um paciente voluntário busca utilizar as ondas cerebrais como interface para o controle e operação de dispositivos digitais.

Imagem: Neuralink, divulgação
Ressalvas
Apesar de seu potencial para a acessibilidade, também precisamos estar atentos para a precisão e confiabilidade dos conteúdos gerados por IA. Erros factuais, interpretações tendenciosas ou descrições imprecisas podem comprometer seriamente o uso destes recursos.
Nesse sentido, a ação de intervenção e supervisão humanas, chamada de “human on the loop“, é fundamental. Profissionais especializados, como audiodescritores, continuam necessários para revisar e refinar as produções geradas por IA. Nuances e detalhes críticos não incorporados podem ser identificados por professores que conhecem seus assuntos em profundidade.
E sempre temos as questões éticas mais gerais. A coleta e o uso de dados dos alunos precisam ser realizados de forma transparente e responsável, garantindo a privacidade e a segurança das informações de uma parcela da população que já se encontra excluída. A questão dos vieses, reproduzindo preconceitos num campo tão sensível é outra preocupação. O desenvolvimento e implementação de soluções de IA na Educação precisa estar atenta a estas perspectivas.
Para onde vamos?
A acessibilidade em materiais educacionais é frequentemente negligenciada, apesar de ser um compromisso moral para todos os agentes da Educação. Garantir que as pessoas com deficiência tenham acesso equitativo ao conhecimento é uma obrigação moral, se não legal: o compromisso de uma educação de qualidade passa pelo atendimento universal.
No entanto, a falta de recursos tem sido um obstáculo significativo para muitas instituições e para os próprios educadores. Assim, as IAs generativas representam um passo para reduzir essas barreiras, permitindo que professores se aproximem da cultura da acessibilidade. Prompts simples podem gerar resultados úteis, ainda que exijam certo “conhecimento de causa”, para não atrapalhar mais que ajudar.
Por outro lado, com a progressiva “IAtização” de todos recursos tecnológicos, é de se esperar que a acessibilidade possa ser facilitada. Por exemplo, um programa para a preparação de slides poderia automaticamente criar a audiodescrição, assim que uma imagem fosse inserida.
Penso que não se trata da substituição dos profissionais especializados da acessibilidade, mas de uma primeira aproximação. De despertar a consciência para a necessidade deste esforço. De proporcionar materiais didáticos dotados de acessibilidade, ainda que de forma transitória. Como em outros campos, a IA deve ser uma ferramenta complementar, não uma “solução” que ignore a experiência e o discernimento humanos.
Para testar
Embora a versão plus do ChatGPT já conte com GPTs especializados para audiodescrição, a exemplo do Accesible Audio Description, sabemos que este ainda é um recurso limitado para a maioria de seus usuários

Assim, o seguinte prompt detalha os requisitos de uma audiodescrição e vai mais além da descrição. Ele inclui a etapa de interpretação, relacionando a imagem ao contexto de aprendizagem.
Observação: o uso do prompt pressupõe um modelo que possibilite o envio de imagens como anexo, uma funcionalidade já presente na maioria dos chats de IA.
Descrição de imagem para acessibilidade em recursos didáticos
Contexto: esta descrição de imagem será utilizada para materiais didáticos no Ensino Superior, visando apoiar a inclusão e a acessibilidade, principalmente em slides de aula. A audiência consiste em estudantes, professores e assistentes educacionais que podem ter diversas necessidades de acessibilidade, incluindo, mas não se limitando a, deficiência visual.
Instruções:
Dados da imagem: por favor, forneça o título da imagem, a origem (se disponível), e uma breve contextualização.
Descrição detalhada: descreva a imagem em detalhes, incluindo elementos como cores, formas, personagens, objetos, textos visíveis, configuração/ambiente, ações (se aplicável) e quaisquer outras características notáveis. O objetivo é que a pessoa que utilize a descrição chegue a uma compreensão semelhante à de alguém que pode ver a imagem.
Interpretação e contexto: quando apropriado, inclua qualquer interpretação simbólica, histórica ou científica que possa estar associada à imagem. Como essa imagem se relaciona com os conceitos discutidos na aula? Existem nuances particulares que precisam ser compreendidas?
Elementos emocionais e estéticos: descreva o tom, o humor, ou as emoções que a imagem busca evocar. Isso inclui o uso de cores, a composição e, no caso de obras de arte, técnicas artísticas relevantes.
Conclusão: explique por que a imagem é relevante para o tópico em discussão. Se possível, sintetize a importância da imagem no contexto apresentação/aula.
Nota importante: use linguagem clara, concisa e respeitosa. Evite suposições. Não descreva mais do que o que está presente na imagem. Mantenha a objetividade ao relatar os elementos da imagem. A descrição deve estar em português, brasileiro, sempre.
Exemplo:
Dados da imagem: “A Persistência da Memória” de Salvador Dalí, discutida durante a sessão sobre Surrealismo na Arte Moderna.
Descrição detalhada: A imagem mostra uma paisagem desértica sob um céu azul claro. quatro relógios derretidos estão estrategicamente posicionados sobre objetos inanimados; um relógio pendurado sobre um galho de árvore sem folhas, outro cobrindo um objeto não identificável, o terceiro derretido sobre uma borda e o último no chão, infestado por formigas. Ao fundo, um penhasco à beira-mar e um corpo de água são visíveis.
Interpretação e contexto: “A Persistência da Memória” é uma representação surrealista explorando conceitos de temporalidade, memória e a subjetivação da experiência humana. Dalí emprega relógios derretidos para simbolizar a natureza não linear e maleável do tempo, uma rejeição direta da crença comum naquele período de um tempo linear e pré-ordenado.
Elementos emocionais e estéticos: a cena evoca um sentimento de estranheza e desorientação, características centrais do surrealismo. A utilização de cores suaves contrasta com a bizarrice dos objetos, criando uma tensão visual que reflete as contradições entre o sonho e a realidade.
Conclusão: esta obra é essencial para entender o movimento surrealista e sua crítica à percepção humana convencional de realidade e tempo. Ela encerra nossa discussão enfatizando como a arte pode desafiar e expandir nossa compreensão do mundo.