DIFICULDADES NA COMPILAÇÃO DE UM CORPUS DE LÍNGUA ESPANHOLA

Ícone

Endereço:
Rua da Saudade, 56 - Vila Eduarda
São Luís de Montes Belos / GO
76100000
Site: https://www.revista.ueg.br/index.php/icone/index
Telefone: (64) 3671-1427
ISSN: 1982-7717
Editor Chefe: Maria Aurora Neta
Início Publicação: 01/12/2007
Periodicidade: Semestral

DIFICULDADES NA COMPILAÇÃO DE UM CORPUS DE LÍNGUA ESPANHOLA

Ano: 2012 | Volume: 10 | Número: 2
Autores: Laura Campos de Borba
Autor Correspondente: Laura Campos de Borba | [email protected]

Palavras-chave: Compilação de corpus, Navegadores off-line, Língua espanhola.

Resumos Cadastrados

Resumo Português:

Algumas das ferramentas utilizadas pelos pesquisadores da Linguística de Corpus, visando a criação de corpora através da coleta de textos da internet, são os navegadores off-line. O objetivo do presente trabalho é apresentar os problemas encontrados durante a coleta de textos da internet para a compilação de um corpus de língua espanhola. A metodologia utilizada é o manejo do navegador off-line HTTrack para reunir e armazenar textos jornalísticos em espanhol. Nossos primeiros resultados demonstram que a utilização desse programa não fornece garantias de que todo e qualquer texto disponível na internet possa ser obtido.