Страница 1 из 1

Предложение: Оптимизация списков

Добавлено: Ср фев 18, 2015 13:45
gb03db
Ситуация: проверял список из 100 адресов из web-proxy.
Результат: более 90% доменов снято с регистрации.
Предложение: переложить работу по проверке регистрации доменов на робота.
Плюсы: сокращение бан-листов, что позволит ускорить работу rejik-а и снять с людей работу по проверке этих адресов.

Re: Предложение: Оптимизация списков

Добавлено: Чт фев 19, 2015 15:05
Slava
Удалил из web-mail.urls правила, которых нет в dns, чуть позже запущу робота, который будет делать тоже для всех urls списков.
До сегодняшнего дня робот чистил только porno.urls.

Re: Предложение: Оптимизация списков

Добавлено: Пн мар 23, 2015 14:10
MAGNet
есть мнение, что в списки нужно добавить механизм комментирования и не вычищать роботом старые урлы, а комментить. проверять все подряд, и комменты тоже, если урл оживет, то коммент снимать.
бывает так, что домены банятся или истекает срок регистрации, а через какое-то время снова "размораживаются", а инфа уже потерта безвозвратно..
..а может и специальные системы ротации существуют, которые и рассчитаны на подобных роботов.

Re: Предложение: Оптимизация списков

Добавлено: Пн мар 23, 2015 14:50
Slava
Разумно, что-то похожее я и сделал, алгоритм такой:

Запускаем раз в неделю
{
все правила, которые являются урлом проверяются в dns:
Если в dns нет, то счетчик dns_check для этого правила увеличивается на единицу.
иначе dns_check для этого правила равен 0.

Если dns_check >4, то правило удаляется
}

Проще говоря, правило будет удалено, если доменное имя недоступно более месяца.

Re: Предложение: Оптимизация списков

Добавлено: Пн мар 30, 2015 18:40
fil
Странно что файлы меньше не стали, хотя например porno.urls количество правил уменьшилось на 69337 только 23 марта. Что-то не так.

Re: Предложение: Оптимизация списков

Добавлено: Вт мар 31, 2015 8:49
Slava
Судя по логам, Вы не скачиваете новый лист, как следствие, не видите новые правила.

Re: Предложение: Оптимизация списков

Добавлено: Вт мар 31, 2015 14:23
alexK
Мне кажется метод описаный выше не подходит для оптимизации списка extremism_rf. Он не такой большой чтобы замедлять работу rejik'a, да и наличие или отсутствие урла в списке должно определяться наличием или отсутствием его в списке Минюста, а не доступностью доменного имени.

Re: Предложение: Оптимизация списков

Добавлено: Вт мар 31, 2015 14:27
Slava
alexK писал(а):Мне кажется метод описаный выше не подходит для оптимизации списка extremism_rf. Он не такой большой чтобы замедлять работу rejik'a, да и наличие или отсутствие урла в списке должно определяться наличием или отсутствием его в списке Минюста, а не доступностью доменного имени.
Согласен, отключил чистку для него.
Впрочем, есть сомнения, что он ещё нужен, подобные сайты сейчас на уровне провайдеров блокируют.