Detecção de plágio com Inteligência Artificial
Como a evolução das ferramentas podem contribuir para a cultura da integridade acadêmica

Bem-vindos a mais uma edição da IAEdPraxis, sua fonte de informação para explorar os caminhos da Inteligência Artificial aplicada à Educação. Nesta semana, vamos adentrar o mundo da integridade (olhando positivamente) ou da fraude acadêmica (numa perspectiva negativa) através das ferramentas de detecção de plágio baseadas em IA. Realmente trazem melhores resultados ou é mais uma expressão do solucionismo tecnológico?
IA em Foco
Por Marcelo Sabbatini
Qual professor nunca passou por isso? Ao corrigir um trabalho, notamos uma mudança sutil de escrita, uma sofisticação que não se espera naquele contexto e nível educacional.
Selecionar uma frase significativa e colocá-la num buscador Web não dá coincidências exatas em seus resultados. Será que uma ferramenta de detecção de plágios é a solução? Ainda mais contando que os alunos passaram a desenvolver estratégias como substituir palavras e expressões, para não dar o “match” exato? Pois nem tanto, pois além de limitações em relação a sua disponibilidade e acesso, a própria tecnologia envolvida gera resultados, digamos, comedidos.
Evolução dos detectores de plágio
Os primeiros softwares para esta finalidade surgiram no final dos anos 1990 e início dos anos 2000, em resposta ao aumento da disponibilidade de conteúdo na Internet e à facilidade com que textos poderiam ser copiados e colados.
Esses sistemas operavam baseados em algoritmos de comparação textual. Para isso, o programa fazia uma análise de similaridade, dividindo o texto em fragmentos menores e logo comparando com os textos de uma base de dados indexada. Contudo, a dependência de correspondências exatas limitava os resultados à identificação de cópias literais, falhando em detectar plágios disfarçados por meio de parafraseamento ou alteração de palavras-chave.
O uso de detectores automáticos de plágio não se limita a trabalhos acadêmicos, entretanto. O surgimento do conceito de autoplágio mudou a forma como publicações científicas e mesmo agências de financiamento lidam com o reaproveitamento de textos do próprio autor. Ainda que considerada num contexto de produtivismo acadêmico, a prática, que não é nova, pode ser considerada antiética, como abordei neste texto de 2013.
Além disso, os chamados "falsos positivos" ocorriam quando o software marcava coincidências comuns ou frases de domínio público como plágio, exigindo a revisão manual dos resultados. Somando o processamento lento, especialmente para documentos mais extensos, e a falta de suporte multilíngue, na prática este tipo de software produzia resultados um tanto limitados.
A Inteligência Artificial, contudo, mudou o panorama da detecção de plágio. Através de algoritmos de Processamento de Linguagem Natural agora é possível compreender o contexto e o significado das palavras, não se limitando apenas à identificação de sequências idênticas de texto.
Ao mesmo tempo, modelos de aprendizado de máquina, treinados com milhões de documentos acadêmicos, artigos e livros, podem reconhecer padrões de similaridade de um texto em relação a outro.
Assim, a eficácia da IA na detecção de plágio se manifesta em três principais áreas:
Plágio textual "tradicional", com a comparação do texto com uma vasta base de dados, identificando correspondências exatas ou similares. Particularmente útil para detectar a cópia direta de trechos de outros trabalhos, mesmo quando são utilizadas técnicas de substituição e paráfrase para ocultar o plágio.
Plágio de ideias, a partir da análise da estrutura argumentativa e conceitual de um trabalho. Isso permite identificar casos em que as ideias centrais foram apropriadas de outras fontes, mesmo quando expressas em palavras diferentes. Através do reconhecimento de padrões de pensamento e conexões lógicas similares entre textos, a IA pode alertar para possíveis casos de plágio intelectual.
Plágio não intencional, ocasionado pela citação ou paráfrase inadequadas e para o qual a IA pode comparar o texto não apenas com fontes externas, mas também com o histórico de escrita do próprio aluno.
Em tempo, numa próxima edição da newsletter vamos abordar uma questão relacionada, mas diferente: o plágio através da IA. Dito em outras palavras, usar geradores automáticos de IA constitui fraude acadêmica? O que fazer, ao perceber que um aluno usou GPT para fazer um trabalho? É possível detectar com confiança um texto gerado por IA? E por que nos devemos nos preocupar com isso? Em breve, em IAEdpraxis. Mas se quiser enviar uma pergunta sobre este assunto específico, é só mandar uma mensagem.
Na prática
Na atualidade, algumas das ferramentas que estão usando IA são:
Oferece relatórios detalhados para identificar fontes originais de conteúdo plagiado e similaridades. Eficaz.
Combina verificação de plágio com análise da qualidade do conteúdo, sugerindo melhorias na gramática e na coesão do texto.
Software tradicional adotado por diversas instituições brasileiras, passou a integrar a IA em seu algoritmo através da aprendizagem de máquina. Com isso, identifica padrões de escrita que possam indicar o uso inadequado de fontes ou a realização de plágio disfarçado. Entre seus produtos é inclusive anunciada a capacidade detectar trabalhos contratados e elaborados por terceiros. Entretanto, a postura da empresa é a de não detectar plágio, mas sinalizar potenciais problemas de escrita, fornecendo apoio aos estudantes através de um aprendizado formativo em escrita e pensamento acadêmico original.
Em contexto
O potencial da IA para a detecção de plágio é, portanto, muito relevante. Além da velocidade e abrangência da análise, essas ferramentas podem oferecer relatórios detalhados, indicando as fontes potenciais do plágio e o grau de similaridade entre um texto e outro.
Podem, assim, facilitar o trabalho dos educadores em identificar o uso incorreto de fontes. Mas também servem como uma ferramenta pedagógica, ajudando os alunos a entenderem melhor as práticas de citação e de escrita acadêmica.
Contudo, e como sempre, é importante mantermos uma postura crítica. Por mais avançada que seja, a tecnologia não é infalível. Em destaque, falsos positivos também podem ocorrer, especialmente em casos de citações comuns ou conhecimento geral amplamente compartilhado.
Há também preocupações éticas a considerar. A dependência excessiva nessas ferramentas pode levar a uma abordagem punitiva em vez de educativa em relação ao plágio.
Aqui reside uma oportunidade: incentivar os alunos a verificarem seus próprios trabalhos antes do envio, estabelecendo um contexto para discutir ética acadêmica, atribuição adequada e o valor da originalidade.
O que nos leva a uma pergunta: como podemos equilibrar o rigor acadêmico com o reconhecimento de que todo conhecimento é, em certa medida, uma construção coletiva?
Considerado como problema tecnológico apenas, o plágio sempre será um "jogo de gato e rato". Encarar a tecnologia, baseada em IA ou não, como solução é ignorar as causas e variáveis de um problema que é bastante complexo por si só. O que precisamos, penso eu, é cultivar uma cultura de integridade acadêmica e de honestidade intelectual. E para isso ela pode dar uma ajuda, relativamente pequena, mas ainda assim, uma ajuda.
Pesquisa em Ação
Um estudo realizado na Universidade da Austrália Ocidental utilizou softwares de detecção de plágio numa perspectiva não de punição, mas como uma oportunidade pedagógica. Estudantes que utilizaram um software para verificar seus trabalhos antes do envio melhoraram significativamente suas habilidades de citação e paráfrase ao longo do semestre. Antes disso, já havia sido verificado que aulas de escrita acadêmica não haviam obtido efeito sobre a ocorrência de plágios e sobre as formas corretas de citação. Dessa forma, podemos pensar em ferramentas de detecção de plágio, principalmente as baseadas em IA, como uma "ferramenta pedagógica", um auxílio à escrita.
Prompt da Semana
Na pegada de utilizar a detecção de plágio para desenvolver habilidades de escrita acadêmica, apresentamos um prompt que cria um tutor capaz de guiar o aluno na prática de uma redação autêntica e original. Disponível em nossa biblioteca de prompts.
Momentos de Reflexão
O consultor educacional Jeppe Klitgaard Stricker reflete nos traz um questionamento interessante. Por um lado, a Inteligência Artificial tem sido anunciada como uma ferramenta para aumentar a produtividade acadêmica. Vamos pesquisar mais, escrever mais, aprender mais, não é mesmo? Porém, talvez isso seja justamente o contrário do que precisamos: desaprender, no sentido de superar modelos mentais desatualizados e preconceitos que a IA apenas amplificará. Então, como equilibrar o uso dessa tecnologia com o desenvolvimento do talento individual e da satisfação de nossas necessidades emocionais e cognitivas?
"Estou tão cansado de aprender, todo mundo espera que eu melhore constantemente, mas nunca perguntam se eu quero."
Com a competição, vemos modelos de IA sendo treinados com cada vez mais dados, numa corrida que parece não ter fim. Mas será realmente necessário? O quanto precisamos dessa pressão externa por inovação diante de necessidades práticas que podemos resolver com inteligência humana?
Sua voz é fundamental para enriquecer este diálogo. Sinta-se à vontade para nos enviar suas observações, histórias ou questionamentos através de qualquer um de nossos canais.