обьясните новичку banner.urls и banner.pcre
Добавлено: Ср июн 25, 2008 10:12
Здравсвуйте.
Была поставлена задача по блокировке баннеров и порнухи в моей организации. Погуглив наткнулся на rejik.ru. Попробовал и поставил на ubuntu server 7.10 связку squid+rejik, правда режик компилировался с ошибками, но заработал. Многие популярные сайты типа gismeteo.ru и mail.ru подчищались от рекламы нормально. Но по сайтам челябинской области баннеров в базе небыло. Решил прогнать топ 15 сайтов каждого пользователя интернета в организации. Но встал вопрос о правильности ввода правил в общую базу. И так, по порядку:
Возьмем сайт http://www.chelreal.ru/. На нем все картинки с расширением gif и различными комбинациями названия файлов картинок имеют слово "banner" - везде где есть такая комбинация букв в названия файла является банером. Например 58451_banner2.gif, bannerok3.gif, 58422_BANNER.gif. Как мне добавить в базу это правило? Или в banner.urls, что-то типа http://www.chelreal.ru/files/images/*banner.gif , т.е. все остальные символы я заменил "*". Будет так работать правило правильно? И вообще можно использовать символ "*" или "?" для замены символов в форме добавления url правил? Формы принимаются нормально с этими знаками, но как они потом обрабатываются - мне не понятно. В списках листов таких знаков не наблюдал.
На многих сайтах расположение баннеров в структурах папок и названиях просматриваюстя закономерности, которые можно описать регулярными выражениями или вводить в базу по 10-15 прямых линков на банеры, что не очень удобно.
И второй вопрос. Мне нужна связка squid+havp+rejik+(globax спутникового интернета). Конфиг squid 2.6 такой:
cache_peer 127.0.0.1 parent 8888 0 no-query default
acl ftp proto FTP
acl havp proto HTTP
acl al src 0.0.0.0/0.0.0.0
always_direct allow ftp
always_direct deny al
never_direct allow havp
url_rewrite_program /usr/local/rejik3/redirector /usr/local/rejik3/redirector.conf
Из конфига видно, что все запросы редиректятся на порт havp 127.0.0.1:8888, а сам havp потом редиректится на порт ускорителя глобакс 127.0.0.1. Т.к. havp не поддерживает ftp, то ftp протокол пришлось пустить напрямую в интернет описав протоколы в 2,3 стороках и разделив их в 5,6,7 строках конфига. Тут все ясно. в 8-ой строке указываю squid пользоватся внешним редиректором. Но после ввода 8-ой строки станицы начинают тормозить на баннерах. т.е. не могут подгрузиться, но и страница открывается не польностью, если банеры находятся в начале страницы.
Стоит apache на внутреннем интерфейсе и 1х1.gif открывается с клиентских компьютеров нормально. Если заремить первые 7 строк, то squid хоти в инет напрямую, но рекламма уже заменяется 1-о пиксельным gif нормально и страницы догружаются до конца. Так вопрос тем, кто настраивал такую комбинацию модулей. Как мне прописать в squid.conf, чтобы и havp вирусы лечил и rejik банеры резал?
На форумах отписываюсь с прозьбами помочь очень редко, т.к. на форумах полно решений большинства проблем. Но здесь встал в тупик.
Была поставлена задача по блокировке баннеров и порнухи в моей организации. Погуглив наткнулся на rejik.ru. Попробовал и поставил на ubuntu server 7.10 связку squid+rejik, правда режик компилировался с ошибками, но заработал. Многие популярные сайты типа gismeteo.ru и mail.ru подчищались от рекламы нормально. Но по сайтам челябинской области баннеров в базе небыло. Решил прогнать топ 15 сайтов каждого пользователя интернета в организации. Но встал вопрос о правильности ввода правил в общую базу. И так, по порядку:
Возьмем сайт http://www.chelreal.ru/. На нем все картинки с расширением gif и различными комбинациями названия файлов картинок имеют слово "banner" - везде где есть такая комбинация букв в названия файла является банером. Например 58451_banner2.gif, bannerok3.gif, 58422_BANNER.gif. Как мне добавить в базу это правило? Или в banner.urls, что-то типа http://www.chelreal.ru/files/images/*banner.gif , т.е. все остальные символы я заменил "*". Будет так работать правило правильно? И вообще можно использовать символ "*" или "?" для замены символов в форме добавления url правил? Формы принимаются нормально с этими знаками, но как они потом обрабатываются - мне не понятно. В списках листов таких знаков не наблюдал.
На многих сайтах расположение баннеров в структурах папок и названиях просматриваюстя закономерности, которые можно описать регулярными выражениями или вводить в базу по 10-15 прямых линков на банеры, что не очень удобно.
И второй вопрос. Мне нужна связка squid+havp+rejik+(globax спутникового интернета). Конфиг squid 2.6 такой:
cache_peer 127.0.0.1 parent 8888 0 no-query default
acl ftp proto FTP
acl havp proto HTTP
acl al src 0.0.0.0/0.0.0.0
always_direct allow ftp
always_direct deny al
never_direct allow havp
url_rewrite_program /usr/local/rejik3/redirector /usr/local/rejik3/redirector.conf
Из конфига видно, что все запросы редиректятся на порт havp 127.0.0.1:8888, а сам havp потом редиректится на порт ускорителя глобакс 127.0.0.1. Т.к. havp не поддерживает ftp, то ftp протокол пришлось пустить напрямую в интернет описав протоколы в 2,3 стороках и разделив их в 5,6,7 строках конфига. Тут все ясно. в 8-ой строке указываю squid пользоватся внешним редиректором. Но после ввода 8-ой строки станицы начинают тормозить на баннерах. т.е. не могут подгрузиться, но и страница открывается не польностью, если банеры находятся в начале страницы.
Стоит apache на внутреннем интерфейсе и 1х1.gif открывается с клиентских компьютеров нормально. Если заремить первые 7 строк, то squid хоти в инет напрямую, но рекламма уже заменяется 1-о пиксельным gif нормально и страницы догружаются до конца. Так вопрос тем, кто настраивал такую комбинацию модулей. Как мне прописать в squid.conf, чтобы и havp вирусы лечил и rejik банеры резал?
На форумах отписываюсь с прозьбами помочь очень редко, т.к. на форумах полно решений большинства проблем. Но здесь встал в тупик.