O comando wget é uma ferramenta poderosa para descarregar ficheiros da Internet em sistemas UNIX e Linux. A sua versatilidade permite lidar com várias tarefas, desde o download de ficheiros individuais até à cópia completa de websites. Este guia pretende explorar em detalhe o potencial completo do wget.
Compreender o Básico do Wget
O wget é uma ferramenta gratuita e não interativa projetada para descarregar ficheiros da web. Suporta os protocolos HTTP, HTTPS e FTP, e pode recuperar ficheiros através de proxies HTTP.
A sintaxe básica do wget é a seguinte:
wget [opção] [URL]
Dentro desta sintaxe:
- O comando
wget
é o gatilho para executar a ferramenta. [opção]
é um parâmetro opcional que permite definir várias configurações. O wget oferece uma vasta gama de opções que permitem aos utilizadores ajustar o seu funcionamento. Desde permitir downloads em segundo plano até limitar a velocidade de download, uma ampla variedade de configurações pode ser ajustada conforme necessário.[URL]
representa o endereço web do ficheiro que pretende descarregar. É aqui que insere o local específico na web de onde a ferramenta irá buscar o ficheiro.
Exemplos Detalhados de Comandos Wget
- Descarregar um Ficheiro Único
O uso mais simples do wget é descarregar um ficheiro a partir de uma URL específica.
wget https://www.exemplo.com/documento.pdf
Este comando descarrega o ficheiro chamado documento.pdf de exemplo.com e guarda-o no diretório de trabalho atual.
- Descarregar em Segundo Plano
Para descarregar ficheiros grandes, o wget pode ser executado em segundo plano usando a opção-b
.
wget -b https://www.exemplo.com/filme-grande.mp4
Este comando inicia o download de filme-grande.mp4 em segundo plano, permitindo continuar a usar o terminal para outras tarefas.
- Limitar a Velocidade de Download
Para evitar que o wget consuma toda a largura de banda disponível, pode limitar a velocidade de download usando a opção--limit-rate
.
wget --limit-rate=100k https://www.exemplo.com/arquivo.zip
Este comando restringe a velocidade de download a 100 KB/s, garantindo que outras atividades online não sejam interrompidas.
- Descarregar Vários Ficheiros
O wget pode descarregar vários ficheiros ao mesmo tempo. Isto é feito criando um ficheiro de texto com uma lista de URLs e usando a opção-i
.
wget -i lista-urls.txt
Neste exemplo, lista-urls.txt é um ficheiro de texto contendo as URLs de todos os ficheiros a serem descarregados. O comando descarrega todos os ficheiros listados no lista-urls.txt.
- Descarregar um Website Inteiro
O wget pode ser utilizado para descarregar um website inteiro para visualização offline. A opção--mirror
ou-m
é usada para isso.
wget --mirror https://www.exemplo.com
Este comando faz uma cópia do website exemplo.com, descarregando todas as suas páginas e recursos para uso offline.
- Descarregar Ficheiros com Extensões Específicas
Para descarregar ficheiros com extensões específicas de um website, use a opção-r
para download recursivo e-A
para especificar os tipos de ficheiros.
wget -r -A.mp3 https://www.exemplo.com/musicas
Este comando descarrega todos os ficheiros MP3 de exemplo.com e seus subdiretórios.
- Descarregar Ficheiros com Nomes Diferentes
Usando a opção-O
, pode guardar um ficheiro com um nome diferente.
wget -O novoFicheiro.zip https://www.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip de exemplo.com e guarda-o como novoFicheiro.zip no diretório atual.
- Guardar Ficheiros em um Diretório Específico
Pode especificar um diretório para guardar o ficheiro descarregado usando a opção-P
.
wget -P /home/usuario/Downloads https://www.exemplo.com/documento.pdf
Este comando descarrega documento.pdf de exemplo.com e guarda-o no diretório especificado por /home/usuario/Downloads.
- Definir Tentativas de Repetição
Usando a opção--tries
, pode definir o número de tentativas de repetição caso o download falhe.
wget --tries=5 https://www.exemplo.com/arquivo.zip
Este comando tenta descarregar arquivo.zip de exemplo.com até 5 vezes antes de desistir.
- Descarregar via FTP
O wget também pode descarregar ficheiros via FTP. É necessário especificar o nome de utilizador e a senha.wget --ftp-user=usuario --ftp-password=senha ftp://ftp.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip do servidor FTP em ftp.exemplo.com usando o nome de utilizador e a senha especificados. - Continuar Downloads Interrompidos
Se o seu download for interrompido, pode continuar utilizando a opção-c
.wget -c https://www.exemplo.com/filme.mp4
Este comando retoma o download de filme.mp4 de exemplo.com de onde parou. - Descarregar Websites Inteiros
Pode descarregar todo o conteúdo de um website para visualização offline usando uma combinação de opções.wget --mirror --convert-links --page-requisites --no-parent -P /home/usuario/Website https://www.exemplo.com
Este comando descarrega todo o website exemplo.com e seus recursos, converte os links para uso offline e guarda tudo no diretório especificado por /home/usuario/Website. - Localizar Links Quebrados
O wget pode ser usado para encontrar todos os URLs quebrados que exibem um erro 404 em um website específico.wget -o wget-log -r -l 3 --spider http://www.exemplo.com
Este comando verifica todos os links em exemplo.com até 3 níveis de profundidade e regista os resultados no wget-log. - Descarregar Ficheiros Numerados
Se tiver ficheiros ou imagens numeradas numa lista específica, pode facilmente descarregar todos eles.wget http://www.exemplo.com/imagens/{1..50}.jpg
Este comando descarrega as imagens 1.jpg até 50.jpg do diretório exemplo.com/imagens. - Descarregar Ficheiros com um Tempo de Espera
Com a opção--timeout
, pode definir um tempo limite para o wget parar de tentar conectar-se ou ler a partir de um site.wget --timeout=20 https://www.exemplo.com/arquivo.zip
Este comando tenta descarregar arquivo.zip de exemplo.com, mas parará se não conseguir conectar ou ler o site dentro de 20 segundos. - Ignorar Maiúsculas e Minúsculas ao Comparar Ficheiros/ Diretórios
A opção-nc
ou--no-clobber
impede que o wget sobreponha ficheiros ou diretórios existentes.wget -nc https://www.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip de exemplo.com apenas se um ficheiro com o mesmo nome não existir já no diretório atual. - Descarregar Apenas Certos Tipos de Ficheiros
Usando as opções-r
e-A
, pode instruir o wget a descarregar apenas tipos específicos de ficheiros de um site.wget -r -A jpg,png https://www.exemplo.com/imagens
Este comando descarrega todos os ficheiros JPG e PNG de exemplo.com/imagens e seus subdiretórios. - Descarregar Todos os Ficheiros Exceto Certos Tipos
Usando a opção-R
ou--reject
, pode instruir o wget a descarregar todos os ficheiros exceto certos tipos de um site.wget -r -R jpg https://www.exemplo.com
Este comando descarrega todos os ficheiros de exemplo.com e seus subdiretórios, exceto ficheiros JPG. - Descarregar Ficheiros de Websites que Usam Cookies
Alguns websites exigem que os utilizadores aceitem cookies antes de poderem aceder aos ficheiros. Pode usar a opção--load-cookies
neste caso.wget --load-cookies /home/usuario/cookies.txt https://www.exemplo.com/arquivo.zip
Este comando descarrega ficheiros de exemplo.com usando os cookies armazenados em cookies.txt. - Descarregar Ficheiros de Sites Protegidos por Palavra-Passe
Se um site exigir autenticação com nome de utilizador e palavra-passe, pode fornecê-los usando as opções--user
e--password
.wget --user=usuario --password=senha https://www.exemplo.com/arquivo.zip
Este comando descarrega ficheiros de exemplo.com usando o nome de utilizador e a palavra-passe especificados. - Descarregar Ficheiros a Partir de uma Lista de URLs
Pode descarregar ficheiros a partir de uma lista de URLs usando a opção-i
.wget -i lista-urls.txt
Este comando descarrega ficheiros das URLs listadas em lista-urls.txt. - Descarregar Ficheiros para um Diretório Específico
Usando a opção-P
, pode especificar o diretório onde os ficheiros descarregados serão guardados.wget -P /home/usuario/Downloads -i lista-urls.txt
Este comando descarrega ficheiros das URLs listadas em lista-urls.txt e guarda-os no diretório especificado por /home/usuario/Downloads. - Descarregar Ficheiros com uma Extensão Específica
Pode descarregar ficheiros com uma extensão específica usando a opção-A
.wget -r -A .pdf https://www.exemplo.com/documentos
Este comando descarrega todos os ficheiros PDF de exemplo.com/documentos. - Descarregar Ficheiros de um Diretório Específico
Pode descarregar ficheiros de um diretório específico em um website usando wget.wget -r -np -nH --cut-dirs=2 -R index.html https://www.exemplo.com/dir/subdir/
Este comando descarrega todos os ficheiros do diretório subdir em exemplo.com. - Descarregar Ficheiros com um Padrão Específico na URL
Pode descarregar ficheiros com um padrão específico na URL usando wget.wget -r -np -nH --cut-dirs=2 -A '*.pdf' https://www.exemplo.com/dir/subdir/
Este comando descarrega todos os ficheiros PDF do diretório subdir em exemplo.com. - Descarregar Ficheiros de um Website Usando FTP
Pode descarregar ficheiros de um website usando FTP com wget.wget --ftp-user=usuario --ftp-password=senha ftp://ftp.exemplo.com/
Este comando descarrega ficheiros de exemplo.com usando FTP com o nome de utilizador e a senha especificados. - Descarregar Ficheiros de um Website Usando HTTPS
Pode descarregar ficheiros de um website usando HTTPS com wget.wget https://www.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip de exemplo.com usando HTTPS. - Descarregar Ficheiros de um Website Usando HTTP
Pode descarregar ficheiros de um website usando HTTP com wget.wget http://www.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip de exemplo.com usando HTTP. - Descarregar Ficheiros de um Website Usando um Proxy
Pode descarregar ficheiros de um website usando um proxy com wget.wget -e use_proxy=yes -e http_proxy=http://proxy.exemplo.com:8080 https://www.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip de exemplo.com usando o proxy especificado. - Descarregar Ficheiros de um Website e Guardá-los com um Nome Diferente
Pode descarregar ficheiros de um website e guardá-los com um nome diferente usando wget.wget -O novo-nome.zip https://www.exemplo.com/arquivo.zip
Este comando descarrega arquivo.zip de exemplo.com e guarda-o como novo-nome.zip.
Conclusão
O comando wget é uma ferramenta poderosa com uma vasta gama de aplicações. A sua versatilidade torna-o uma ferramenta essencial para qualquer utilizador que descarregue ficheiros da internet com frequência. Este guia abrangente proporciona um entendimento mais profundo do wget e das suas capacidades. Boas descargas!