Desambiguação de nomes de autores para a identificação automática de perfis acadêmicos

Em Questão

Endereço:
Rua Ramiro Barcelos 2705, sala 519
Porto Alegre / RS
90035 007
Site: http://seer.ufrgs.br/EmQuestao
Telefone: (51) 3308-2141
ISSN: 1808-5245
Editor Chefe: Samile Andréa de Souza Vanz
Início Publicação: 01/01/1986
Periodicidade: Quinzenal
Área de Estudo: Ciências Sociais Aplicadas, Área de Estudo: Ciência da informação

Desambiguação de nomes de autores para a identificação automática de perfis acadêmicos

Ano: 2018 | Volume: 24 | Número: 2
Autores: Luciano Antonio Digiampietri, João Eduardo Ferreira
Autor Correspondente: Luciano Antonio Digiampietri | [email protected]

Palavras-chave: Desambiguação de nomes. Resolução de entidades. Bibliometria.

Resumos Cadastrados

Resumo Português:

A desambiguação de nomes é uma atividade fundamental em estudos bibliométricos, em particular naqueles que utilizam diferentes fontes de informação. O objetivo deste trabalho é propor e testar uma estratégia de desambiguação de nomes de autores de forma a possibilitar a identificação automática do perfil do Google Acadêmico de docentes. A estratégia proposta é baseada na busca pelos perfis dos docentes no Google Acadêmico, seguida por um processo de casamento de nomes. Adicionalmente são comparadas as publicações acadêmicas que estão cadastradas no currículo Lattes do docente e no perfil do Google Acadêmico. Por fim, a resolução de nomes ocorre, verificando-se entre os perfis compatíveis aquele que apresenta maiores evidências de pertencer ao respectivo docente. Um estudo de caso envolvendo os docentes da Universidade de São Paulo foi realizado, e o sistema automático foi capaz de identificar, de maneira correta, 4.283 perfis do Google Acadêmico. Uma análise de cobertura mostrou que o sistema foi capaz de encontrar cerca de 95% dos perfis dos docentes que possuem essa informação, e nenhum falsopositivo foi identificado.



Resumo Inglês:

The author name disambiguation is a fundamental activity in bibliometric studies, in particular in those that use different sources of information. The objective of this paper is to propose and test an author name disambiguation strategy in order to allow the automatic identification of the Google Academic profile of researchers. The proposed strategy is based on the search for the profiles in Google Scholar, followed by a name matching process. Additionally, the academic publications that are registered in the researcher’s Lattes curriculum and Google Scholar profile are compared. Lastly, the name resolution is carried out by verifying among the compatible profiles the one with the highest evidence of belonging to the respective researcher. A case study involving researchers from the University of São Paulo was conducted, and the automated system was able to correctly identify 4,283 Google Scholar profiles. A coverage analysis showed that the system was able to find about 95% of the profiles of the researchers who have this information, and no false-positive was identified.