Свойства Проекта: Фильтры URL

Фильтры URL позволяют Вам легко управлять загрузками Проектов, регулируя, - какие должны быть загружены, а какие - пропущены.

Фильтры URL подразделяются на четыре части:

Обратите, пожалуйста, внимание, что если URL не содержит имени файла (например, как http://www.srv.com/путь), то этот путь должен быть завершён наклонной чертой "/". В противном случае "путь" будет распознан как имя файла.

Разделы Фильтров URL работают как группа. Если один фильтр определяет, что файл не должен быть загружен, то он не будет загружен, даже если последующие фильтры разрешают это.

Каждый фильтр позволяет задать загрузку с начального сервера/каталога/имени файла и исключить/включить ключевые слова для точной настройки загрузок.

Когда Offline Explorer Pro определяет, будет загружена ссылка или нет, он сначала проверит поле "Загружать только с начального...". Если опция включена и ссылка не соответствует части начального URL (например, указывает на внешний сервер), то ссылка вообще загружена не будет. Если ссылка соответствует части начального URL, то будет проверена на соответствие спискам ключевых слов включаемые/исключаемые.

Загрузка файла разрешается только в случае, когда соответствующий сегмент URL точно такой же, как и в начальном URL (Проект | Адрес (URL)). Для

Загружать файлы с начального...

Если поле "Загружать файлы с начального..." не отмечено, то ссылка будет сравниваться только со списками включаемые/исключаемые.

Есть два типа ключевых слов – для включения и отключения загрузки файлов в случае обнаружения соответствия ключевому слову. Для каждого типа ключевых слов - два разных списка.

Offline Explorer Pro сравнивает соответствующую часть URL каждого файла, который будет загружен, с ключевыми словами каждого типа. Если обнаружено соответствие любому ключевому слову из списка Включить (Include), то тогда загрузка файла разрешается. Если ни одного соответствия ключевым словам нет, то тогда файл не будет загружен. Если обнаружено соответствие любому ключевому слову из списка Исключить (Exclude), то тогда загрузка файла запрещается. Если ни одного соответствия ключевым словам не найдено, то тогда файл не будет загружен. Ключевое слово может включать любой символ. Соответствие ключевому слову означает, что соответствующая часть URL (имя сервера, путь или имя файла с расширением) содержит ключевое слово.

Примеры: имя сервера www.zdnet.com содержит ключевое слово zdnet. Путь /~user015/images/ не содержит ключевого слова user705.

Два специальных символа "^" и "$" указывают на начало и конец части URL.

Например, ключевое слово ^www.cnn означает, что часть URL должна начинаться с www.cnn. Ключевое слово .htm$ означает, что часть URL должна заканчиваться на .htm.

Чтобы определить набор возможных символов в позиции, используйте [] символы. Таким образом, ключевое слово g[eo]t соответствует get и got ключевым словам. Символ "-" означает диапазон от одного символа до другого. Символ ^ после [ соответствует одиночному символу, который не содержится в скобках.

Например, [a-z] означает все символы от a до z (включительно).[0-9] означает все цифровые символы.

Используйте звёздочку "*" для любого количества любых символов, вроде ^a*.gif$, что означает все файлы, начинающиеся с a и заканчивающиеся на .gif.

Используйте плюс "+" для соответствия предыдущему символу один или более раз. Например, ab+c соответствует "abc", "abbc", "abbbc", и так далее, но не "ac". Другим примером будет ab[0-9]+.htm для соответствия именам файлов типа ab564562.htm или ab1.htm.

Если Вы хотите исключить каталог, вроде /ads/, то не забудьте разместить наклонную черту "/" слева и справа от него. Иначе другие каталоги, вроде /leads/, будут также исключены из загрузки.

Вы можете также определить имя сервера (начиная с http://, ftp://, https://, rtsp://, pnm://, mms:// или mmst://) в ключевых словах каталога.

Вы можете также определить полные URL в ключевых словах имён файлов.

Например, следующее ключевое слова разрешается в Фильтры URL | Имя файла | Произвольная конфигурация: http://www.srv.com/directory/img[0-9]/*.gif Фильтры URL | Каталоги | Произвольная конфигурация может содержать следующие ключевые слова: http://www.zdnet.*/newfiles/

Вы можете также определить ключевое слово для проверки его наличия в имени ссылки (текст между тэгами: link:someword

Это ключевое слово будет работать только в разделе Фильтры URL | Имя файла.

Значок "дерево" рядом с полем ключевых слов показывает карту загруженного сайта для того, чтобы вы могли выбрать в качестве ключевого слова имя файла, каталог или сервер. Примечание: проверка ключевых слов нечувствительна к регистру символов.

Совет: для фильтрации URL, которые заканчиваются наклоненной вправо чертой (имя файла не указано), используйте default.htm в разделе Фильтры URL | Имя файла.

За исключением Протокола фильтров URL, Произвольная конфигурация каждый Фильтр URL содержит список Включить и Исключить, и Вы можете вводить в них любое количество ключевых слов. Если ключевое слово совпадает с соответствующей частью URL в списке Исключить, то файл загружен не будет.

Примеры ключевых слов сервера:

Таблица 1. 

Ключевое словоСоответствующие URLНе соответствующие URL
zdnet.com http://www.zdnet.com/
http://hotfiles.zdnet.com
http://zdnet.com.de
http://www.zdnet.de
www.zdnethttp://www.zdnet.com/
http://my-www.zdnet.de/
http://hotfiles.zdnet.com
http://zdnet.com.de
w.zd http://www.zdnet.com/
http://www.zdnet.de/
http://hotfiles.zdnet.com
http://zdnet.com.de
www.*.comhttp://www.zdnet.com/http://www.zdnet.de/

Примеры ключевых слов каталога:

Таблица 2. 

Ключевое словоСоответствующие URLНе соответствующие URL
somedirhttp://www.zdnet.com/somedir/file.htm
http://files.com.de/somedirectory/
http://zdnet.com.uk/mysomedirs/
http://www.zdnet.de/someotherdir/
/path/dirhttp://www.zdnet.com/path/dir/file.htm
http://www.zdnet.de/inside/path/directory/
http://hotfiles.zdnet.com/mypath/dir/file.gif
http://zdnet.com.de/path/dir.txt
^/mydir/$ http://www.zdnet.com/mydir/file.exthttp://hotfiles.zdnet.com/mydir/path/file.txt
http://zdnet.com.de/some/mydir/
http://www.s3.*/pathhttp://www.s3.com/path/file.htm
http://www.s3.jp/path/dir/image.jpgfile.htm
http://www.zdnet.com/path/

Примеры ключевых слов в имени файла:

Таблица 3. 

Ключевое словоСоответствующие URLНе соответствующие URL
somefilehttp://www.zdnet.com/dir/somefile.htm
http://files.com.de/file.asp?somefile=val
http://www.zdnet.de/someotherfile
default.htm http://www.server.com/dir/
http://www.other.com/default.htm
http://www.server.com/file.html
http://*.zdnet.*/path*/*.cgihttp://www.zdnet.com/path/file.cgi
http://www.zdnet.de/path/dir/other.cgi
http://hotfiles.zdnet.com/mypath/dir/file.gif
http://zdnet.com.de/path/dir.txt
/*folder*/*.ziphttp://www.srv.com/dir/folder/other/file.zip
http://www.other.uk/folder/archive.zip
http://hotfiles.zdnet.com/folder/dir/file.gif
http://zdnet.com.de/dir/file.zip
link:Footballлюбая ссылка, содержащая слово Football в своём тексте 

Раздел Протокол - Произвольная конфигурация Фильтров URL позволяет непосредственный выбор или отмену каждого протокола.

Некоторые полезные сочетания клавиш для управления списком ключевых слов в Фильтрах URL:

Ctrl-L - загружает ключевые слова из текстового файла в выбранный текущий список.

Ctrl-M - перемещает все ключевые слова в другое место текущего списка (например, из списка Включаемые в Исключаемые).

Ctrl-S - добавляет начальный сервер, каталог или имя файла в выбранный список ключевых слов. Например, если Вы хотите разрешить загрузку только из начального каталога в Фильтры URL | Каталоги | Произвольная конфигурация.

Ctrl-C - копирует все ключевые слова в буфер обмена Windows.

Ctrl-A - отмечает все ключевые слова в списке.

Ctrl-N - снимает отметку со всех ключевых слов в списке.

Нажмите клавишу F2 на выбранном ключевом слове для быстрой его правки.

Примечание: Настройки Фильтров URL не применяются к файлам, для которых в категории Фильтры файлов не включена настройка "Загружать используя Фильтры URL" в поле Размещение.

Вы можете также использовать макрокоманды URL в ключевых словах Фильтров URL. Например:

filename{:0day}.htm

Совет: для фильтрации URL, которые заканчиваются наклоненной вправо чертой (имя файла не указано), используйте default.htm в разделе Фильтры URL | Имя файла.

Примечание: Offline Explorer Pro пропускает URL, если любая настройка Фильтра URL или Фильтра файлов не разрешает его загрузку (даже если любые другие настройки Проекта разрешают загрузку URL).