Eficiência de softwares nacionais e internacionais na detecção de similaridade e de plágio em manuscrito

Em Questão

Endereço:
Rua Ramiro Barcelos 2705, sala 519
Porto Alegre / RS
90035 007
Site: http://seer.ufrgs.br/EmQuestao
Telefone: (51) 3308-2141
ISSN: 1808-5245
Editor Chefe: Samile Andréa de Souza Vanz
Início Publicação: 01/01/1986
Periodicidade: Quinzenal
Área de Estudo: Ciências Sociais Aplicadas, Área de Estudo: Ciência da informação

Eficiência de softwares nacionais e internacionais na detecção de similaridade e de plágio em manuscrito

Ano: 2022 | Volume: 28 | Número: 4
Autores: Marcelo Krokoscz
Autor Correspondente: Marcelo Krokoscz | [email protected]

Palavras-chave: plágio, similaridade e plágio, detecção de plágio, software antiplágio

Resumos Cadastrados

Resumo Português:

Este estudo visa identificar a eficiência de quatorze softwares de detecção de similaridades em um texto com fragmentos sobre educação financeira, encontrados em websites da internet, anais de eventos acadêmicos e revistas científicas de acesso aberto e restrito. Os fragmentos foram usados para elaborar um texto coeso, escrito em língua portuguesa, contendo reproduções textuais literais, paráfrases, com trechos traduzidos do idioma inglês, manipulados com inserção de caractere oculto e com substituição de palavras por sinônimos. Os relatórios de similaridade gerados pelos softwares foram analisados de acordo com quatro critérios: 1 identificação de fragmentos citados corretamente; 2 identificação de fragmentos plagiados; 3 identificação de textos manipulados para enganar o software; 4 identificação de fontes originais; os quais foram pontuados em uma escala de 0 a 4 pontos. Os softwares Turnitin, StrikePlagiarism, PlagScan e Plagium tiveram performance elevada e CopySpider e Plagium (complemento do Google) foram os mais ineficientes. Constatou-se que os softwares operam com eficiência variável, o que reforça a convicção de que embora sejam ferramentas úteis para a identificação de plágio, contribuem de forma limitada para aspectos como reconhecimento de reproduções textuais literais que nem sempre correspondem à fonte original. As fontes originais de textos reescritos, manipulados e traduzidos não foram encontradas por nenhum software. O estudo contribui para o aprimoramento da capacidade do usuário na escolha, uso e análise dos relatórios de similaridades gerados por softwares, cuja eficiência pode ser maior no caso da utilização de mais de um software.



Resumo Inglês:

This study aims to identify the efficiency level of fourteen software for detecting similarities between a text with fragments extracted from online content on financial education, found on open access websites, proceedings of academic events and open and restricted access scientific journals. Fragments extracted from the sources were used to create a cohesive text, written in Portuguese, containing literal textual reproductions, paraphrases, translation from the English language and manipulation with insertion of hidden characters and replacement of words by synonyms. The similarity reports generated by the programs were analyzed according to four criteria: 1 identification of correctly cited fragments; 2 identification of plagiarized fragments; 3 identification of texts manipulated to deceive the software; 4 identification of original sources, which were scored on a scale of 0 to 4 points. Although the Turnitin, Strikeplagiarism and Plagscan software obtained the best performance indices, it was found that the programs operate with variable and limited efficiency, which reinforces the conviction that, although they are useful tools for the identification of plagiarism, they contribute significantly limited by aspects such as recognition mainly of literal textual reproductions that do not always correspond to the original source. The original sources of rewritten, manipulated and translated texts were not found by any software. The study contributes to the improvement of the user's ability to choose, use and analyze the similarity reports generated by software, whose efficiency can be greater in the case of using more than one program.