У меня вопросик - откуда берутся адреса сайтов в порно-листе, который нужно проверить?
Неу ж то от фонаря, или есть какой-то список?
DBL списки
Re: DBL списки
В базе список, приблизительно на 300 тысяч правил для группы порно. В нем ошибок очень много, но как список для проверки он весьма хорош.anTIDot писал(а):У меня вопросик - откуда берутся адреса сайтов в порно-листе, который нужно проверить?
Неу ж то от фонаря, или есть какой-то список?
PS: выложить это список для общего пользования не могу, слишком много ошибок. По мере проверок правил из порно, он естественным путем станет общедоступным, причем, я надеюсь, с гораздо меньшим количеством ошибок, чем сейчас.
ошибки в списках
При проверке порно списка и его отправке, система вывалила следующее:
"Ваши ответы на контрольные правила не совпадают с заложенными в системе.
Система считает, что Вы ошиблись и Ваш рейтинг понижен. Но возможно ошибка в самих контрольных правилах, перепроверьте их.
Если Вы найдете ошибку в контрольных правилах, Ваш рейтинг будет увеличен на удвоенную сумму штрафа (компенсация за штраф + оплата проверки листа) + множитель * 50 баллов за нахождение ошибки.
Сообщить об ошибке.
в строке 97 надо было ответить "Да" или "Не знаю"
Ваш рейтинг: 242 - 100 = 142
Ваш множитель: 1 - 1 = 0
Ваш баланс: 94"
В 94 строке был указан адрес http://19yearsold.com
и он не порно (тестовая страница Apache)
Я отправил сообщение , что система ошиблась
Мне интересно, как это проверяется?
Если ошибок будет несколько, изменится ли эта строка (http://rejik.ru/cgi-bin/badcontrol.cgi? ... 04&lang=ru)
?
"Ваши ответы на контрольные правила не совпадают с заложенными в системе.
Система считает, что Вы ошиблись и Ваш рейтинг понижен. Но возможно ошибка в самих контрольных правилах, перепроверьте их.
Если Вы найдете ошибку в контрольных правилах, Ваш рейтинг будет увеличен на удвоенную сумму штрафа (компенсация за штраф + оплата проверки листа) + множитель * 50 баллов за нахождение ошибки.
Сообщить об ошибке.
в строке 97 надо было ответить "Да" или "Не знаю"
Ваш рейтинг: 242 - 100 = 142
Ваш множитель: 1 - 1 = 0
Ваш баланс: 94"
В 94 строке был указан адрес http://19yearsold.com
и он не порно (тестовая страница Apache)
Я отправил сообщение , что система ошиблась
Мне интересно, как это проверяется?
Если ошибок будет несколько, изменится ли эта строка (http://rejik.ru/cgi-bin/badcontrol.cgi? ... 04&lang=ru)
?
Re: ошибки в списках
Ответ ушел Вам по почте, для наглядности приведу его ниже:
------------
Здравствуйте,
Вами был послан отчет, о ошибке в контрольном правиле.
При проверке листа, вы указали, что правило "19yearsold.com" не блокирует
порно и Вы правы.
Ваш рейтинг увеличен на 250 баллов (100+100+50).
Лист ответов отредактирован мною вручную - правило "19yearsold.com" заменено
на "sex.ru", ответ на это правило заменен на "да" и лист отправлен в
обработку.
Спасибо, что помогли найти ошибку.
-----------
Нет, строка отправки отчета о ошибке в контрольном правиле содержит только id листа.
------------
Здравствуйте,
Вами был послан отчет, о ошибке в контрольном правиле.
При проверке листа, вы указали, что правило "19yearsold.com" не блокирует
порно и Вы правы.
Ваш рейтинг увеличен на 250 баллов (100+100+50).
Лист ответов отредактирован мною вручную - правило "19yearsold.com" заменено
на "sex.ru", ответ на это правило заменен на "да" и лист отправлен в
обработку.
Спасибо, что помогли найти ошибку.
-----------
Нет, строка отправки отчета о ошибке в контрольном правиле содержит только id листа.
Re: DBL списки
Hi!anTIDot писал(а):У меня вопросик - откуда берутся адреса сайтов в порно-листе, который нужно проверить?
Неу ж то от фонаря, или есть какой-то список?
А чего рожать такой список?
Идем на машину любителя этого дела и на кэш и хистори напускаем скрипт, который из всех текстовых (html, js) файлов выгребает url-ы и обрезает их до домена. Дальше полученный список сортируется, унифицируется и подчищается (проверяется).
При попадении на топ или каталог - получается очень весёлая история
Таким способом набрать 3000-4000 урлов с одного компа - быстро и без проблем. А если напустить скрипт на скидовый кэш - я просто (ес-но, он должен кешировать динамические страницы)
Center