Уточняю вопрос по allow_urls. Хотя может моя "проблема" может быть решена с помощью pcre? Или может кто подскажет, как добавить исключение для правил в pcre?
Я хочу запретить закачку архивов. Логичнее всего это сделать прописав в pcre "запрещенные" расширения. т.е. примерно так:
\/.+\.(zip|rar|arj)$
Но маленькие архивы (прайсы, рефераты) мне сильно трафик не забьют. РЕЖИК, как и любой другой редиректор, не получает сведений о размере файла. Поэтому я хочу разрешить закачку таких архивов, в url которых есть "price", "referat". Что-то вроде
!(referat).*\/.*\.(zip|rar|arj)$ или
.*!(price)\.(zip|rar|arj)$, я не знаю как это сделать правильно.
Тогда мне не нужно будет перечислять все рефератные сайты.
Или как разрешить закачку архивов, например, с lib.ru, если там реклама "lib.ru/KARTINKI/krutilka/имя_картинки", а ссылки lib.ru/_ЖАНР_/_АВТОР_/имя_файла? Мне что, перечислить в allow_urls все жанры и всех авторов? Или ссылки на рефераты
referat.com/0001/, referat.com/0002/, ..., referat.com/9999/
Нелогично и неэстетично.
Другой случай. (см.
http://rejik.ru/700/index400.html)
Цитирую "Не добавляйте пожалуйста правили в pcre группы вида: ^ad\. или \/banner\/. Наличие таких правил приводит к блокированию некоторых легальных сайтов."
Это все правильно, но ВСЕГО ОДНО правило "
ban*er" убивает 72 из 877 ПРАВИЛ(!!!) в urls "стандартного комплекта" банлистов режика. 8% правил!!!. Далее, за ноябрь РЕЖИКом у меня забанено более 186 тысяч url;
правилом "
ban*er" убито более 30 тысяч ссылок -- 16% от ОБЩЕГО ЧИСЛА, а ведь там не только банеры убиты!!!
Стандартным банлистом убито 4316 ссылок -- 2%. Правда, он стоит в конце списка, и убивает то что не добили мои правила.
Это я к тому, что если вдруг попадется ПРАВИЛЬНЫЙ адрес, попадающий под подобное правило? то хотелось бы его прописать именно для данной секции или лучше для конкретного правила pcre.
Может еще какие идеи будут?