Фильтры URL позволяют Вам легко управлять загрузками Проектов, регулируя, - какие должны быть загружены, а какие - пропущены.
Фильтры URL подразделяются на четыре части:
Протокол - ограничение загрузки исходя из протокола (http://www.server.com/dir1/dir2/file.htm);
Сервер - ограничение загрузки исходя из имени сервера (http://www.server.com/dir1/dir2/file.htm);
Каталог - ограничение загрузки исходя из пути (http://www.server.com/dir1/dir2/file.htm);
Имя файла - ограничение загрузки исходя из имени файла (http://www.server.com/dir1/dir2/file.htm), имени ссылки и текста между тэгами).
Обратите, пожалуйста, внимание, что если URL не содержит имени файла (например, как http://www.srv.com/путь), то этот путь должен быть завершён наклонной чертой "/". В противном случае "путь" будет распознан как имя файла.
Разделы Фильтров URL работают как группа. Если один фильтр определяет, что файл не должен быть загружен, то он не будет загружен, даже если последующие фильтры разрешают это.
Каждый фильтр позволяет задать загрузку с начального сервера/каталога/имени файла и исключить/включить ключевые слова для точной настройки загрузок.
Когда Offline Explorer Pro определяет, будет загружена ссылка или нет, он сначала проверит поле "Загружать только с начального...". Если опция включена и ссылка не соответствует части начального URL (например, указывает на внешний сервер), то ссылка вообще загружена не будет. Если ссылка соответствует части начального URL, то будет проверена на соответствие спискам ключевых слов включаемые/исключаемые.
Загрузка файла разрешается только в случае, когда соответствующий сегмент URL точно такой же, как и в начальном URL (Проект | Адрес (URL)). Для
Загружать файлы с начального...
... домена - загрузка файла разрешается только в случае, если домен тот же, что и в начальном URL (Проект | Адрес (URL)). Например, начальный сервер www.server.com, загрузка будет разрешена из cgi.server.com, images.server.com, и так далее.
... сервера - загрузка файла разрешается только в случае, если имя сервера то же, что и в начальном URL (Project | Address (URL)). Например, начальный сервер www.server.com, загрузка будет позволена только из www.server.com. Загрузка из всех других серверов будет блокирована.
... Загружать до X ссылок с других серверов - страницы вне начального сервера или домена будут загружаться с другим пределом. Загрузка до одной ссылки означает, что Offline Explorer Pro загрузит все внешние ссылки и на этом загрузка прекратится. Установка значения два загрузит страницы по внешним ссылкам и все страницы, связанные с ними.
... каталога - файлы из каталога будут загружаться только в случае, если путь такой же или начинается так в начальном адресе URL. Обратите, пожалуйста, внимание, что если URL не содержит имя файла (типа как http://www.srv.com/path), то он должен заканчиваться наклонной чертой ”/”. Иначе "путь" будет распознан как имя файла.
Если поле "Загружать файлы с начального..." не отмечено, то ссылка будет сравниваться только со списками включаемые/исключаемые.
Есть два типа ключевых слов – для включения и отключения загрузки файлов в случае обнаружения соответствия ключевому слову. Для каждого типа ключевых слов - два разных списка.
Offline Explorer Pro сравнивает соответствующую часть URL каждого файла, который будет загружен, с ключевыми словами каждого типа. Если обнаружено соответствие любому ключевому слову из списка Включить (Include), то тогда загрузка файла разрешается. Если ни одного соответствия ключевым словам нет, то тогда файл не будет загружен. Если обнаружено соответствие любому ключевому слову из списка Исключить (Exclude), то тогда загрузка файла запрещается. Если ни одного соответствия ключевым словам не найдено, то тогда файл не будет загружен. Ключевое слово может включать любой символ. Соответствие ключевому слову означает, что соответствующая часть URL (имя сервера, путь или имя файла с расширением) содержит ключевое слово.
Примеры: имя сервера www.zdnet.com содержит ключевое слово zdnet. Путь /~user015/images/ не содержит ключевого слова user705.
Два специальных символа "^" и "$" указывают на начало и конец части URL.
Например, ключевое слово ^www.cnn означает, что часть URL должна начинаться с www.cnn. Ключевое слово .htm$ означает, что часть URL должна заканчиваться на .htm.
Чтобы определить набор возможных символов в позиции, используйте [] символы. Таким образом, ключевое слово g[eo]t соответствует get и got ключевым словам. Символ "-" означает диапазон от одного символа до другого. Символ ^ после [ соответствует одиночному символу, который не содержится в скобках.
Например, [a-z] означает все символы от a до z (включительно).[0-9] означает все цифровые символы.
Используйте звёздочку "*" для любого количества любых символов, вроде ^a*.gif$, что означает все файлы, начинающиеся с a и заканчивающиеся на .gif.
Используйте плюс "+" для соответствия предыдущему символу один или более раз. Например, ab+c соответствует "abc", "abbc", "abbbc", и так далее, но не "ac". Другим примером будет ab[0-9]+.htm для соответствия именам файлов типа ab564562.htm или ab1.htm.
Если Вы хотите исключить каталог, вроде /ads/, то не забудьте разместить наклонную черту "/" слева и справа от него. Иначе другие каталоги, вроде /leads/, будут также исключены из загрузки.
Вы можете также определить имя сервера (начиная с http://, ftp://, https://, rtsp://, pnm://, mms:// или mmst://) в ключевых словах каталога.
Вы можете также определить полные URL в ключевых словах имён файлов.
Например, следующее ключевое слова разрешается в Фильтры URL | Имя файла | Произвольная конфигурация: http://www.srv.com/directory/img[0-9]/*.gif Фильтры URL | Каталоги | Произвольная конфигурация может содержать следующие ключевые слова: http://www.zdnet.*/newfiles/
Вы можете также определить ключевое слово для проверки его наличия в имени ссылки (текст между тэгами: link:someword
Это ключевое слово будет работать только в разделе Фильтры URL | Имя файла.
Значок "дерево" рядом с полем ключевых слов показывает карту загруженного сайта для того, чтобы вы могли выбрать в качестве ключевого слова имя файла, каталог или сервер. Примечание: проверка ключевых слов нечувствительна к регистру символов.
Совет: для фильтрации URL, которые заканчиваются наклоненной вправо чертой (имя файла не указано), используйте default.htm в разделе Фильтры URL | Имя файла.
За исключением Протокола фильтров URL, Произвольная конфигурация каждый Фильтр URL содержит список Включить и Исключить, и Вы можете вводить в них любое количество ключевых слов. Если ключевое слово совпадает с соответствующей частью URL в списке Исключить, то файл загружен не будет.
Примеры ключевых слов сервера:
Таблица 1.
Ключевое слово | Соответствующие URL | Не соответствующие URL |
zdnet.com | http://www.zdnet.com/ http://hotfiles.zdnet.com http://zdnet.com.de | http://www.zdnet.de |
www.zdnet | http://www.zdnet.com/ http://my-www.zdnet.de/ | http://hotfiles.zdnet.com http://zdnet.com.de |
w.zd | http://www.zdnet.com/ http://www.zdnet.de/ | http://hotfiles.zdnet.com http://zdnet.com.de |
www.*.com | http://www.zdnet.com/ | http://www.zdnet.de/ |
Примеры ключевых слов каталога:
Таблица 2.
Ключевое слово | Соответствующие URL | Не соответствующие URL |
somedir | http://www.zdnet.com/somedir/file.htm http://files.com.de/somedirectory/ http://zdnet.com.uk/mysomedirs/ | http://www.zdnet.de/someotherdir/ |
/path/dir | http://www.zdnet.com/path/dir/file.htm http://www.zdnet.de/inside/path/directory/ | http://hotfiles.zdnet.com/mypath/dir/file.gif http://zdnet.com.de/path/dir.txt |
^/mydir/$ | http://www.zdnet.com/mydir/file.ext | http://hotfiles.zdnet.com/mydir/path/file.txt http://zdnet.com.de/some/mydir/ |
http://www.s3.*/path | http://www.s3.com/path/file.htm http://www.s3.jp/path/dir/image.jpgfile.htm | http://www.zdnet.com/path/ |
Примеры ключевых слов в имени файла:
Таблица 3.
Ключевое слово | Соответствующие URL | Не соответствующие URL |
somefile | http://www.zdnet.com/dir/somefile.htm http://files.com.de/file.asp?somefile=val | http://www.zdnet.de/someotherfile |
default.htm | http://www.server.com/dir/ http://www.other.com/default.htm | http://www.server.com/file.html |
http://*.zdnet.*/path*/*.cgi | http://www.zdnet.com/path/file.cgi http://www.zdnet.de/path/dir/other.cgi | http://hotfiles.zdnet.com/mypath/dir/file.gif http://zdnet.com.de/path/dir.txt |
/*folder*/*.zip | http://www.srv.com/dir/folder/other/file.zip http://www.other.uk/folder/archive.zip | http://hotfiles.zdnet.com/folder/dir/file.gif http://zdnet.com.de/dir/file.zip |
link:Football | любая ссылка, содержащая слово Football в своём тексте |
Раздел Протокол - Произвольная конфигурация Фильтров URL позволяет непосредственный выбор или отмену каждого протокола.
Некоторые полезные сочетания клавиш для управления списком ключевых слов в Фильтрах URL:
Ctrl-L - загружает ключевые слова из текстового файла в выбранный текущий список.
Ctrl-M - перемещает все ключевые слова в другое место текущего списка (например, из списка Включаемые в Исключаемые).
Ctrl-S - добавляет начальный сервер, каталог или имя файла в выбранный список ключевых слов. Например, если Вы хотите разрешить загрузку только из начального каталога в Фильтры URL | Каталоги | Произвольная конфигурация.
Ctrl-C - копирует все ключевые слова в буфер обмена Windows.
Ctrl-A - отмечает все ключевые слова в списке.
Ctrl-N - снимает отметку со всех ключевых слов в списке.
Нажмите клавишу F2 на выбранном ключевом слове для быстрой его правки.
Примечание: Настройки Фильтров URL не применяются к файлам, для которых в категории Фильтры файлов не включена настройка "Загружать используя Фильтры URL" в поле Размещение.
Вы можете также использовать макрокоманды URL в ключевых словах Фильтров URL. Например:
filename{:0day}.htm
Совет: для фильтрации URL, которые заканчиваются наклоненной вправо чертой (имя файла не указано), используйте default.htm в разделе Фильтры URL | Имя файла.
Примечание: Offline Explorer Pro пропускает URL, если любая настройка Фильтра URL или Фильтра файлов не разрешает его загрузку (даже если любые другие настройки Проекта разрешают загрузку URL).