Next: 13.7 Примеры использования Wget
Up: 13. Программа Wget
Previous: 13.5 Отметки времени в
Подраздел
Раз вы знаете какие параметры принимает Wget, вы могли бы пожелать
установить часть параметров постоянно в специальном конфигурационном файле
.wgetrc, чтобы использовать конкретный набор параметров постоянно.
Файл .wgetrc является главным конфигурационным файлом для Wget,
однако, если имеется файл $HOME/.netrc, то он будет принят во
внимание. Формат файла $HOME/.netrc может быть найден в описании
системы Linux, смотрите, например,
man ftp
Wget читает файл $HOME/.wgetrc и интерпретирует ограниченный
набор директив.
Во время старта программа Wget читает сначала глобальный
конфигурационный файл, который находится
по умолчанию в /usr/local/etc/wgetrc и выполняет его.
Затем Wget пробует прочесть пользовательский конфигурационный файл.
Имя файла может содержаться в переменной окружения WGETRC. Если эта
переменная установлена, то Wget пытается прочесть пользовательский
конфигурационный файл. Если файл не найден, то более не предпринимается
никаких попыток разыскать пользовательский конфигурационный файл.
Если переменная WGETRC не установлена, то Wget пытается
прочесть файл $HOME/.wgetrc. Если содержание глобального и
локального конфигурационного файла противоречат друг другу, то принимаются
значения из пользовательского конфигурационного файла.
Синтаксис директив в файле .wgetrc прост:
variable = value
variable может также именоваться командой. Правильные значения
для value различны для разных команд. Значения
нечувствительны к используемому регистру и знакам подч©ркивания.
Например,
DiR___Prog полностью эквивалентно dirprog.
Пустые строки, строки содержащие в первой позиции знаки #
(реш©тка), а также строки, содержащие лишь пробелы, игнорируются.
Если вы хотите очистить какой-то параметр, то это можно сделать, например,
так
reject =
тем самым параметру reject присваивается пустое значение.
Полный список директив привед©н ниже. Буквы после знака = (равно)
означают новое значение, которое принимает параметр. Это может быть on или off, а также 0 или 1. STRING означает
непустую строку, а N - неотрицательное целое. К примеру, вы можете
написать use_proxy = off, чтобы запретить использование прокси
сервера по умолчанию. Вы можете использовать inf для чисел без
ограничений по величине.
Большинство, но не все, директивы из файла wgetrc имеют свои
эквиваленты в параметрах командной строки.
- accept/reject = string
- То же самое, что -A/-R (типы файлов).
- add_hostdir = on/off
-
Разрешить/запретить создание файлов, имеющих префикс в виде имени хоста.
Параметр -nH выключает это.
- continue = on/off
-
Разрешить/запретить продолжение поиска.
Параметр -c разрешает это.
- background = on/off
-
Разрешить/запретить работу в фоновом режиме,
то же, что параметр -b, который разрешает его.
- base = string
-
Установить базу для относительных URL,
то же, что параметр -b, который разрешает это.
- cache = on/off
-
Когда установлено off, то запрещает кэширование,
то же, что -B.
- convert links = on/off
-
Включить/выключить преобразование абсолютных линков в относительные.
То же, что -k.
- cut_dirs = n
-
Игнорировать n-ые компоненты удал©нных каталогов.
- debug = on/off
-
Включить/выключить режим отладки. То же что -d.
- delete_after = on/off
-
Включить/выключить удаление файла сразу после завершения копирования.
То же, что -delete-after.
- dir_prefix = string
-
Вершина иерархии каталогов. То же, что -P.
- dirstruct = on/off
-
Включить/выключить структуру оглавления.
То же, что -x или -nd соответственно.
- domains = string
-
То же самое, что -D.
- dot_bytes = n
-
Определить количество байтов на точку,
которые выводятся на экран, чтобы показать процесс копирования (умолчание:
1024 байта).
- dots_in_line = n
-
Определить число точек, которые будут печататься в каждой строке
(умолчание: 50 точек).
- dot_spacing = n
-
Определить число точек в кластере (умолчание: 10 точек).
- dot_style = string
-
Определить стиль вывода точек,
то же, что -dot-style.
- exclude_directories = string
-
Определить через запятую список каталогов, которые вы хотите исключить из
списка на копирование (то же что -X).
- exclude_domains = string
-
То же, что -exclude-domains.
- follow_ftp = on/off
-
Следовать всем FTP линкам в документе HTML,
то же, что -f.
- force_html = on/off
-
Если включено (on) рассматривать входной документ как документ HTML,
то же что -F.
- ftp_proxy = string
-
Использовать string как FTP прокси,
вместо определ©нного в переменной окружения.
- glob = on/off
-
Включить/выключить расширение им©н файлов,
то же что -g.
- header = string
-
Определить дополнительный заголовок,
то же что -header.
- http_passwd = string
-
Установить пароль для HTTP.
- http_proxy = string
-
Использовать string в качестве HTTP прокси
вместо прокси сервера, который определ©н в переменной окружения.
- http_user = string
-
Установить имя пользователя HTTP.
- ignore_length = on/off
-
Когда включено (on), игнорировать содержимое поля заголовка Content-Length, то же самое что -ignore-length.
- include_directories = string
-
Определить раздел©нный запятыми список каталогов, которые вы хотите
скопировать, то же самое что -I.
- input = string
-
Читать URL из string, то же что
-i.
- kill_longer = on/off
-
Рассматривать данные с размером более, чем определены в поле заголовка
Content-length, как неверные и попробовать скопировать их снова. По
умолчанию данные сохраняются если их размер равен или больше содержимого
поля заголовка Content-length.
- logfile = string
-
Установить имя файла для сохранения протокола выполнения программы.
То же, что -o.
- login = string
-
Установить имя пользователя на удал©нном FTP сервере.
Умолчание - anonymous.
- mirror = on/off
-
Включить/выключить зеркальное копирование.
То же, что -m.
- netrc = on/off
-
Включить/выключить чтение конфигурационного файла $HOME/.netrc.
- noclobber = on/off
-
То же, что -nc.
- no_parent = on/off
-
Запретить поиск вне каталожной иерархии, то же что
-no-parent.
- no_proxy = string
-
Использовать string как раздел©нный запятыми список доменов,
которые не должны загружаться через прокси сервер вместо
списка определ©нного в переменной окружения.
- output_document = string
-
Установить имя выводного файла,
то же что -O.
- passive_ftp = on/off
-
Установить режим пассивного FTP,
то же что -passive-ftp.
- passwd = password
-
Установить пароль для FTP.
Умолчание - username@hostname.domainname.
- proxy_user = string
-
Установить имя пользователя как string,
то же что -proxy-user.
- proxy_passwd = string
-
Установить пароль для прокси как
string, то же что -proxy-passwd.
- quiet = on/off
-
Включить/выключить режим работы Wget
без выдачи диагностических сообщений,
то же что -q.
- quota = quota
-
Определить квоту для суммарного объ©ма копируемых данных.
Когда квота определена, Wget остановит поиск и копирование после
превышения квоты. Квота может быть определена в байтах (умолчание),
в Kбайтах (использовать букву k), или в мегабайтах (использовать
букву m). Иными словами, quota = 5m означает квоту в 5
мегабайтов.
- reclevel = n
-
Определить уровень рекурсии,
то же что -l.
- recursive = on/off
-
Включить/выключить рекурсию, то же что -r.
- relative_only = on/off
-
Следовать лишь относительным линкам в документе HTML,
то же что -L.
- remove_listing = on/off
-
Если on, то удаляется оглавление каталогов, полученное программой
Wget с удал©нного FTP сервера, по завершении работы программы.
То же что -nr.
- retr_symlinks = on/off
-
Если установлено on, то рассматривать символический линк как обычный
файл; то же что -retr-symlinks.
- robots = on/off
-
Использовать (on) или не использовать
файл /robots.txt. Умолчание: on.
Если задумаете менять умолчание, то постарайтесь ясно понять результат.
- server_response = on/off
-
Включить/выключить печати ответов серверов HTTP и FTP;
то же что -S.
- simple_host_check = on/off
-
То же, что -nh.
- span_hosts = on/off
-
То же, что -H.
- timeout = n
-
Установить значение максимального ожидания ответа;
то же что -T.
- timestamping = on/off
-
Включить/выключить использование отметок времени;
то же что -N.
- tries = n
-
Установить число повторов на URL;
то же что -t.
- use_proxy = on/off
-
Включить/выключить использование прокси;
то же что -Y.
- verbose = on/off
-
Включить/выключить подробную/сокращ©нную диагностику времени выполнения
программы Wget; то же что -v/-nv.
- wait = n
-
Ждать n секунд между новыми попытками поиска;
то же что -w.
Ниже привед©н пример конфигурационного файла для программы Wget.
###
### Пример файла инициализации .wgetrc
###
## Вы можете использовать данный файл для изменения поведения программы
## wget, принятого по умолчанию.
##
## Инициализационный файл программы wget может находиться в
## /usr/local/etc/wgetrc ╧глобальные умолчания)
## или в $HOME/.wgetrc (персональные умолчания для отдельного
## пользователя).
# Вы можете установить квоту (полезно для начинающих) на суммарный объем
# скопированных файлов в одном сеансе работы программы. За числом может
# следовать 'K' (килобайты) или 'M' (мегабайты). По умолчанию, квота
# не ограничена.
#quota = inf
# Вы можете уменьшить или увеличить число повторов попыток скопировать
# файл с удаленного сервера. Умолчание: 20 попыток.
#tries = 20
# Глубина рекурсии при просмотре удаленных документов HTTP и FTP.
# Умолчание: 5.
#reclevel = 5
# Многие места (серверы, организации) имеют защитные серверы, которые не
# разрешают инициализацию FTP соединений извне организации. Для таких
# серверов вы может использовать режим 'passive' для FTP. Если вы
# находитесь в таком положении, то вам можно установить режим 'passive' по
# умолчанию.
#passive_ftp = off
passive_ftp = on
##
## Локальные установки (для конкретного пользователя этот файл находится в
## $HOME/.wgetrc. Крайне неудобно устанавливать эти умолчания в глобальном
## инициализационном файле (обычно в /usr/local/etc/wgetrc), поскольку
## данные установки могут оказаться неудобными и неприемлемыми для других
## пользователей.
##
# Установить в 'on', чтобы использовать отметки времени по умолчанию.
#timestamping = off
timestamping = on
# Очень хорошая идея установить этот заголовок. Wget будет посылать его
# вместе с вашими запросами. Поэтому в случае возникновения проблем,
# администратор сервера сможет связаться с вами. Wget никогда не посылает
# 'From:' по умолчанию.
#header = From: Your Name <username@site.domain>
# Вы можете установить и другие заголовки, например, Accept-Language
# (приемлемый язык). Заголовок Accept-Language не посылается по умолчанию.
#header = Accept-Language: en
# Вы можете установить по умолчанию прокси сервер, который будет
# использовать Wget. Эта установка заменит прокси сервер, который
# содержится в переменной окружения.
#http_proxy = http://proxy.yoyodyne.com:18023/
http_proxy = http://proxy.pnpi.spb.ru:81/
ftp_proxy = http://proxy.pnpi.spb.ru:81/
# Если вы не хотите использовать прокси по умолчанию, то установите 'off'.
#use_proxy = on
use_proxy = on
# Вы можете сконфигурировать внешний вид диагностики о процессе
# копирования. Правильные значения: default, binary, mega, micro.
#dot_style = default
# Установка данного параметра в 'off' будет означать, что Wget не примет
# во внимание файл /robots.txt на удаленном сервере. Прежде чем менять
# это умолчание, пожалуйста ознакомьтесь, что это будет означать конкретно
# для вас.
#robots = on
# Может оказаться полезным установить некоторый интервал между очередными
# попытками скопировать файл с удаленного сервера. Интервал может
# измеряться в секундах (без обозначений), 'm' - минуты, 'h' - часы, 'd' -
# дни.
#wait = 0
# Вы можете потребовать создать каталожную структуру, даже если вы
# копируете единственный файл. Для этого надо установить 'on'.
#dirstruct = off
# Вы можете включить рекурсивный поиск по умолчанию ('on').
#recursive = off
# Чтобы сказать Wget, что надо следовать по FTP линкам из документов HTML,
# установите 'on'.
#follow_ftp = off
Next: 13.7 Примеры использования Wget
Up: 13. Программа Wget
Previous: 13.5 Отметки времени в
Andrei Chevel
Andrei.Chevel@pnpi.spb.ru