Страница 1 из 1

allow_urls для каждой секции

Добавлено: Пт фев 04, 2005 17:01
Ярослав
здравствуйте!

на сколько я понял allow_urls действует глобально для всех секций. (может ошибаюсь, но если их несколько в конфиге, то действует только последний вариант)

хотелось бы сделать исключения только для одной секции, не затрагивая остальные, возможно ли такое?

например
есть секция которая режет баннеры, есть которая режет *.exe
нужно отключить вырезание баннеров для mysite.my но оставить запрет скачивать exe файлы зтого сайта

спасибо

Re: allow_urls для каждой секции

Добавлено: Пн фев 07, 2005 16:32
Slava
Ярослав писал(а):здравствуйте!

на сколько я понял allow_urls действует глобально для всех секций. (может ошибаюсь, но если их несколько в конфиге, то действует только последний вариант)

хотелось бы сделать исключения только для одной секции, не затрагивая остальные, возможно ли такое?
Сейчас можно сделать исключения только для всех секций сразу.
Можно сделать отдельно для каждой секции, но думаю смысла в этом нет.
Ярослав писал(а): например
есть секция которая режет баннеры, есть которая режет *.exe
нужно отключить вырезание баннеров для mysite.my но оставить запрет скачивать exe файлы зтого сайта
А Вы уверены, что баннеры грузятся непосредственно с этого сайта, а не с каких-то других, а на этом сайте только ссылки на них?
При желании, можно изменить правило блокирования exe, с учетом того, чтобы не учитывался конкретный сайт. Смотрите man pcrepattern

Вот кусок:
An assertion subpattern is matched in the normal way, except that it does
not cause the current matching position to be changed. Lookahead assertions
start with (?= for positive assertions and (?! for negative assertions. For
example,

\w+(?=;)

matches a word followed by a semicolon, but does not include the semicolon
in the match, and

foo(?!bar)

matches any occurrence of "foo" that is not followed by "bar". Note that the
apparently similar pattern

(?!foo)bar

Re: allow_urls для каждой секции

Добавлено: Вт фев 08, 2005 18:14
Ярослав
>> А Вы уверены, что баннеры грузятся непосредственно с этого сайта, а не с каких-то других, а на этом сайте только ссылки на них?

извините, плохо объяснил.

я имел в виду, что
имеется сайт mysite.my на котором крутятся баннеры (грузятся эти баннеры из других мест), так же с этого сайта можно скачать exe. так вот, если я напишу allow_urls mysite.my, то у пользователей появится возможность смотреть баннеры которые крутятся на mysite.my (это и нужно) и скачивать от туда exe (что не нужно).

я думаю практическое применение у такой опции найдется
вот еще пример (режутся mp3,exe,banner ...)
сделать исключение для нескольких сайтов с которых разрешить скачивать mp3, но exe и баннеры (которые показываются на этих сайтах) резать

можно кнечно изменить pcre-правила (если режется по ним), но если этих правил пара десятков (с баннерами например) и исключений десяток (наша фирма дает рекламу и хочет ее видеть,а она режется по pcre), то уже не удобно.

imho это помогло бы лучше упорядочить конфиг. исключения по баннерам к баннерам, exe к exe и тд

ps
про pcrepattern почитаю, спасибо

Re: allow_urls для каждой секции

Добавлено: Вт фев 08, 2005 18:20
Serg
Ярослав писал(а):>> А Вы уверены, что баннеры грузятся непосредственно с этого сайта, а не с каких-то других, а на этом сайте только ссылки на них?

извините, плохо объяснил.

я имел в виду, что
имеется сайт mysite.my на котором крутятся баннеры (грузятся эти баннеры из других мест), так же с этого сайта можно скачать exe. так вот, если я напишу allow_urls mysite.my, то у пользователей появится возможность смотреть баннеры которые крутятся на mysite.my (это и нужно) и скачивать от туда exe (что не нужно).

я думаю практическое применение у такой опции найдется
вот еще пример (режутся mp3,exe,banner ...)
сделать исключение для нескольких сайтов с которых разрешить скачивать mp3, но exe и баннеры (которые показываются на этих сайтах) резать

можно кнечно изменить pcre-правила (если режется по ним), но если этих правил пара десятков (с баннерами например) и исключений десяток (наша фирма дает рекламу и хочет ее видеть,а она режется по pcre), то уже не удобно.

imho это помогло бы лучше упорядочить конфиг. исключения по баннерам к баннерам, exe к exe и тд

ps
про pcrepattern почитаю, спасибо
Согласен с Ярославом!
Сталкнулся с подобными проблема!
Было бы не плохо иметь возможность делать allow_urls для конкретной секции конфига.
Да и еще (вообщемто не очень важно но раз уж зашел разговор) почемуто файл allow_urls лежит в /usr/local/rejik3/banlists а индекс allow_urls.cache к нему создаются в /etc/local/rejik3/banlists/banners

Добавлено: Вт фев 08, 2005 18:27
Slava
Если банеры грузятся из других мест, то приписывание в allow_urls сайтов, где они показываются не поможет, так как редиректор получает только урл объекта и не получает информацию, с какой страницы он был загружен.

В Вашем случае, если нужно видеть свою рекламу, то пропишите в allow_urls, баннерные системы, папки или картинки и Ваша реклама будет видна для Вас на любом сайте.

По поводу mp3 и exe. Да, тут проблема, подумаю.
хотя честно говоря не хотелось бы делать для каждой секции, так как это лишние проверки, лишние поиски в списках, что приведет к замедлению работы редиректора.

Я скоро буду новую версию редиректора писать, попробую вставать такие списки, если не сильно затормозит работу, то добавлю.

Re: allow_urls для каждой секции

Добавлено: Вт фев 08, 2005 18:39
Slava
Serg писал(а): Да и еще (вообщемто не очень важно но раз уж зашел разговор) почемуто файл allow_urls лежит в /usr/local/rejik3/banlists а индекс allow_urls.cache к нему создаются в /etc/local/rejik3/banlists/banners
Файл, в котором перечислены урлы может лежать в любом месте, лишь бы был доступен на чтение пользователю редиректора и был прописан в конфиге.

А вот создать файл в произвольном месте из под пользователя сквиды, это уже вряд ли. Следовательно нужна папка, где этому пользователю разрешено создавать файлы.

Передо мной стоял выбор, взять для этого уже существующую папку, где cache файлы создаются (например папка первой секции прописанной в конфиге) или объяснять каждый раз, что надо дать права на создание в папке нового файла.

PS: наверное, надо будет в каждой папке из ban_dir, размещать файл allow_urls, и там же кеш к нему. так наверное будет понятнее и опция из конфига пропадет.. тока как тогда быть с размещением глобального файла...

Добавлено: Чт фев 10, 2005 12:27
Ярослав
Slava писал(а):Если банеры грузятся из других мест, то приписывание в allow_urls сайтов, где они показываются не поможет, так как редиректор получает только урл объекта и не получает информацию, с какой страницы он был загружен.

В Вашем случае, если нужно видеть свою рекламу, то пропишите в allow_urls, баннерные системы, папки или картинки и Ваша реклама будет видна для Вас на любом сайте.

По поводу mp3 и exe. Да, тут проблема, подумаю.
хотя честно говоря не хотелось бы делать для каждой секции, так как это лишние проверки, лишние поиски в списках, что приведет к замедлению работы редиректора.

Я скоро буду новую версию редиректора писать, попробую вставать такие списки, если не сильно затормозит работу, то добавлю.
понял свою ошибку. в моем случае allow_urls работало для сайтов на которых показывалась реклама потому, что реклама грузилась с того же сайта, вырезание происходило по pcre, для баннерной сети это бы не работало. правильно? но _пожелание_ по поводу allow_urls для каждой секции все равно остается. спасибо