Algumas das ferramentas utilizadas pelos pesquisadores da Linguística de Corpus, visando a criação de corpora através da coleta de textos da internet, são os navegadores off-line. O objetivo do presente trabalho é apresentar os problemas encontrados durante a coleta de textos da internet para a compilação de um corpus de língua espanhola. A metodologia utilizada é o manejo do navegador off-line HTTrack para reunir e armazenar textos jornalísticos em espanhol. Nossos primeiros resultados demonstram que a utilização desse programa não fornece garantias de que todo e qualquer texto disponível na internet possa ser obtido.