wget [OPÇÃO]... [URL]...
Argumentos obrigatórios para opções longas também o são para as opções curtas.
Inicialização:
-V, –version mostra a versão do Wget e sai.
-h, –help emite esta ajuda.
-b, –background vai para o plano de fundo depois de iniciar.
-e, –execute=COMANDO executa um comando no estilo “.wgetrc”.
Arquivo de entrada e de registro:
-o, –output-file=ARQ envia as mensagens de log para ARQuivo.
-a, –append-output=ARQ anexa mensagens ao ARQuivo.
-d, –debug emite muita informações de depuração.
-q, –quiet silencioso (não emite nada).
-v, –verbose detalhista (isto é o padrão).
-nv, –no-verbose desativa o detalhamento, sem ser silencioso.
–report-speed=TYPE Output bandwidth as TYPE. TYPE can be bits.
-i, –input-file=ARQ baixa os URLs encontrados no ARQuivo local ou
externo.
-F, –force-html trata o arquivo de entrada como HTML.
-B, –base=URL resolve os links do arquivo HTML de entrada (-i -F)
relativos a URL.
–config=FILE Specify config file to use.
Download:
-t, –tries=NÚMERO define o número de tentativas como NÚMERO
(0 significa ilimitada).
–retry-connrefused tenta novamente mesmo se a conexão for
recusada.
-O, –output-document=ARQ escreve os documentos no ARQuivo.
-nc, –no-clobber skip downloads that would download to
existing files (overwriting them).
-c, –continue retoma o download de um arquivo baixado
parcialmente.
–progress=TIPO seleciona o tipo de indicador de progresso.
-N, –timestamping não tentar refazer o download de um arquivo,
a menos que ele seja mais novo que o local.
–no-use-server-timestamps não ajusta a data/hora do arquivo local pelo
do arquivo no servidor.
-S, –server-response exibe a resposta do servidor.
–spider não baixa nada.
-T, –timeout=SEGUNDOS define todos os valores de tempo de espera
como SEGUNDOS.
–dns-timeout=SEGUNDOS define o tempo de espera de busca de DNS como
SEGUNDOS.
–connect-timeout=SEGS define o tempo de espera da conexão como SEGS.
–read-timeout=SEGUNDOS define o tempo de espera de leitura como
SEGUNDOS.
-w, –wait=SEGUNDOS espera SEGUNDOS entre as tentativas.
–waitretry=SEGUNDOS espera de 1 a SEGUNDOS entre as tentativas de
baixar.
–random-wait espera de 0,5*ESPERA a 2*ESPERA segundos entre os
downloads.
–no-proxy desativa explicitamente o proxy.
-Q, –quota=QUANTIDADE define a cota de download como QUANTIDADE.
–bind-address=ENDEREÇO associa à máquina local o ENDEREÇO (nome de
máquina ou número IP).
–limit-rate=TAXA limita a taxa de download a TAXA.
–no-dns-cache desabilita o cache da busca de DNS.
–restrict-file-names=SO restringe os caracteres nos nomes de arquivos
aos que o SO (sistema operacional) permite.
–ignore-case ignora a maiusculização ao comparar arquivos/
diretórios.
-4, –inet4-only conecta apenas a endereços IPv4.
-6, –inet6-only conecta apenas a endereços IPv6.
–prefer-family=FAMÍLIA conecta primeiro a endereços da família
especificada: IPv6, IPv4 ou “none” (nenhum).
–user=USUÁRIO define o usuário para HTTP e FTP.
–password=SENHA define a senha a ser usada para HTTP e FTP.
–ask-password pergunta pelas senhas.
–no-iri desativa o suporte a IRI.
–local-encoding=COD usa COD como a codificação local para IRIs.
–remote-encoding=COD usa COD como a codificação remota padrão.
–unlink remove file before clobber.
Diretórios:
-nd, –no-directories não cria diretórios.
-x, –force-directories força a criação de diretórios.
-nH, –no-host-directories não cria diretórios do servidor.
–protocol-directories usa o nome do protocolo nos diretórios.
-P, –directory-prefix=PREFIXO salva os arquivos em PREFIXO/…
–cut-dirs=QTD ignora QTD componentes do diretório remoto.
Opções HTTP:
–http-user=USUÁRIO define o usuário do HTTP.
–http-password=SENHA define a senha a usar para HTTP.
–no-cache desautoriza dados em cache do servidor.
–default-page=NOME Altera o nome da página padrão (normalmente,
ela é “index.html”).
-E, –adjust-extension salva os documentos HTML/CSS com as extensões
apropriadas.
–ignore-length ignora o campo de cabeçalho “Content-Length”.
–header=TEXTO insere TEXTO em meio aos cabeçalhos.
–max-redirect máximo redirecionamentos permitido por página.
–proxy-user=USUÁRIO define o nome de usuário do proxy.
–proxy-password=SENHA define a senha para o proxy.
–referer=URL inclui o cabeçalho “Referer: URL” na requisição
HTTP.
–save-headers salva os cabeçalhos HTTP no arquivo.
-U, –user-agent=AGENTE identifica-se como AGENTE em vez de Wget/VERSÃO.
–no-http-keep-alive desabilita o “HTTP keep-alive” (para conexões
persistentes).
–no-cookies não usa cookies.
–load-cookies=ARQUIVO carrega os cookies do ARQUIVO antes da sessão.
–save-cookies=ARQUIVO salva os cookies no ARQUIVO depois da sessão.
–keep-session-cookies carrega e salva os cookies (não permanentes) da
sessão.
–post-data=TEXTO usa o método POST; envia o TEXTO como dados.
–post-file=ARQUIVO usa o método POST; envia o conteúdo de ARQUIVO.
–content-disposition honra o cabeçalho Content-Disposition ao
escolher os nomes do arquivo local
(EXPERIMENTAL).
–content-on-error output the received content on server errors.
–auth-no-challenge envia informações de autenticação HTTP básica
sem antes aguardar pelo desafio do servidor.
Opções HTTPS (SSL/TLS):
–secure-protocol=PR choose secure protocol, one of auto, SSLv2,
SSLv3, TLSv1, TLSv1_1 and TLSv1_2.
–no-check-certificate não valida o certificado do servidor.
–certificate=ARQUIVO o arquivo de certificado do cliente.
–certificate-type=TIPO tipo de certificado do client: PEM ou DER.
–private-key=ARQUIVO arquivo de chave privada.
–private-key-type=TIPO tipo de chave privada: PEM ou DER.
–ca-certificate=ARQUIVO arquivo com o maço de CA’s.
–ca-directory=DIR diretório onde está a lista de hash das CA’s.
–random-file=ARQUIVO arquivo com dados aleatórios para semear o SSL
PRNG.
–egd-file=ARQUIVO arquivo nomeando o soquete EGD com dados
aleatórios.
Opções FTP:
–ftp-user=USUÁRIO define o usuário de FTP.
–ftp-password=SENHA define a senha para FTP.
–no-remove-listing não exclui os arquivos “.listing”.
–no-glob desativa a pesquisa aproximada (glob search)
para nomes de arquivo no FTP.
–no-passive-ftp desabilita o modo de transferência “passivo”.
–preserve-permissions preserva as permissões do arquivo remoto.
–retr-symlinks em uma recursão, obtém arquivos apontados por
ligação (não vale para diretórios).
WARC options:
–warc-file=FILENAME save request/response data to a .warc.gz file.
–warc-header=STRING insert STRING into the warcinfo record.
–warc-max-size=NUMBER set maximum size of WARC files to NUMBER.
–warc-cdx write CDX index files.
–warc-dedup=FILENAME do not store records listed in this CDX file.
–no-warc-compression do not compress WARC files with GZIP.
–no-warc-digests do not calculate SHA1 digests.
–no-warc-keep-log do not store the log file in a WARC record.
–warc-tempdir=DIRECTORY location for temporary files created by the
WARC writer.
Download recursivo:
-r, –recursive especifica como download recursivo.
-l, –level=NÚMERO nível máximo da recursão (inf ou 0 para infinito).
–delete-after exclui os arquivos localmente depois de baixá-los.
-k, –convert-links faz os links no HTML ou CSS baixado apontarem
para os arquivos locais.
–backups=N before writing file X, rotate up to N backup files.
-K, –backup-converted antes de converter o arquivo X, faz uma cópia de
de segurança como X.orig.
-m, –mirror atalho para -N -r -l inf –no-remove-listing.
-p, –page-requisites obtém todas as imagens, etc. necessárias para
exibir a página HTML.
–strict-comments ativa a manipulação estrita (SGML) dos comentários
HTML.
Aceitação/Recusa de recursão:
-A, –accept=LISTA lista separada por vírgulas das extensões
aceitas.
-R, –reject=LISTA lista separada por vírgulas das extensões
rejeitadas.
–accept-regex=REGEX regex matching accepted URLs.
–reject-regex=REGEX regex matching rejected URLs.
–regex-type=TYPE regex type (posix|pcre).
-D, –domains=LISTA lista separada por vírgulas dos domínios
aceitos.
–exclude-domains=LISTA lista separada por vírgulas dos domínios
rejeitados.
–follow-ftp segue os links FTP dos documentos HTML.
–follow-tags=LISTA lista separada por vírgulas das tags HTML
permitidas.
–ignore-tags=LISTA lista separada por vírgulas das tags HTML
ignoradas.
-H, –span-hosts vai para máquinas estrangeiras ao recursar.
-L, –relative segue apenas links relativos.
-I, –include-directories=LISTA lista dos diretórios permitidos.
–trust-server-names use the name specified by the redirection
url last component.
-X, –exclude-directories=LISTA lista dos diretórios excluídos.
-np, –no-parent não subir ao diretório-pai.
Normalmente eu utlizo
wget -c --retry-connrefused link-do-download
Leia mais em: GNU/Linux, BSD, Unix-like e Software Livre