В чём смысл файлов url? Ведь вполне можно функционал этих файлов поместить в pcre.
Пример:
очень много всякого amateure.
Я бы поместил подобную строку amateure.*(pussy|teens|wife|girls).
Строки с girls там нет, ok. Но она ведь может быть? и 99% что этот сайт будет с порно контентом.
Идём дальше.
можно добавлять следующим образом:
amateure.*(ass|babe|pussy|teens|wife|girls|connection).*
и так далее. Это ОЧЕНЬ сократит список.
И еще мысли по списку запретов.
Просто банить слова sex, teen и xxx, с моей точки зрения, неверно. Это могут быть части других слов или вполне нормальных названий. А подобные ложноположительные срабатывания и запреты раздражают пользователей и, как следствие, техническую службу организации.
Очень огорчило наличие в черном списке простого имени Светлана.


Всё поправляемо, согласен. Очень хотелось бы увидеть мнения своих коллег и уважаемого автора.