Вордфильтр

Материал из Lurkmore

Перейти к: навигация, поиск
«

<Henry Kane> О, прикольный тест. Определяет физическую подготовку по сердцполюбиению. <Allgood> по чему? :-о <Henry Kane> сердц е б и ение, блеать... <Henry Kane> Я уже полюбил местный антимат.

»
Bashorgrufavicon.png409398

Вордфильтр (англ. word filter — фильтр слов) — примочка к форумам, чатам и подобным прочим местам, заменяющая нецензурные слова на установленную админом комбинацию символов, например ***. Список запрещенных слов формируется админом.

Также возможно автовыпиливание поста и автоматические действия по отношению к написавшему, например автоматический бан.

b
«Эти слова надо тоже в фильтр добавить»

Содержание

Типы

Судя по всему, делятся на два типа:

  • Заменяющие точно те слова, которые есть в списке запрещенных. Менее эффективно, но более точно.
  • Заменяющая по шаблону все запрещенные комбинации символов, даже если это кусок слова. Типа, чтобы сразу выпилить и само слово, и его формы, и самого автора поста. Такая форма люто доставляет.

Лулзы

Очевидно, что пока в русском языке и прочих расовых мунспиках есть слова типа оскорблять, подстрахуй, колебания, скипидар, команда, потребитель и прочие подобные, вордфильтры второго типа дебильны не могут не давать постоянного притока лулзов, вызванных цензурированием тех или иных нормальных слов.

Таким образом, можно находить мат и лулзы там, где их в помине не было.

Фильтры первого типа настраивать сложнее, ибо список слов должен быть намного больше. Потому зачастую админы просят сочувствующих «обучить» вордфильтр, наполнив его релевантным контентом. Данный процесс приносит ещё ряд лулзов, поскольку в перечне слов наверняка окажутся, в зависимости от аудитории, Путин, Буш Дядя Обама, Леня Космос, Янукович, матан, фамилия директора школы и прочие подобные вещи.

Противоборство

В зависимости от степени долбоебизма стараний быдлокодера, который писал вордфильтр, его с переменным успехом можно обходить. Основные методы включают в себя:

  • Применение б-гмерзких многоточий, звездочек, !@#$% и прочей хуиты.
  • Замену православных РусскихЪ БуковицЪ на идентичные буквы латинского алфавита и арабские цифры. Таким образом, «хуй» превращается в «xYu», «пизда» в «пN3дy», «Лев Николаевич Гумилев» — в «Лeв Hикoлæвич Гyмилeв». Ну вы понели.
  • 1337, 265, etc.
  • Наконец, символы можно представить в кодах. К примеру, «хуй» превратится в брутальное «&#1093;&#1091;&#1081;».

Расстановка точек

Использование быдлофильтров указывает на некомпетентность администратора форума, ибо налицо непонимание оным простых фактов:

  1. В случае выпиливания по регекспам надо либо строить нефиговое выражение, состоящее из матана чуть более, чем полностью, либо мириться с 9000 жалоб пользователей, что фильтр неверно реагирует на слово «оскорблять», но не реагирует на слово «ибацца». Примеры выше намекают.
  2. В случае выпиливания целиком список должен быть таким, что выполнение поиска по нему начнет занимать весьма нехуевое время, что, конечно же, скажется на скорости работы форума.
  3. И в том и в другом случае пользователи все равно обойдут вордфильтр, как ни старайся.

Как следствие можно вывести, что вордфильтр есть очередная неудачная попытка автоматизации работы модератора и де-факто нахуй не нужен, проще найти вахтёра с аллергией на мат.

Есть и еще одно применение вордфильтру — прикрытие задницы владельца. Так, например, на форумах главного сайта РБК запикиваются фамилии Путин, Медведев и Зюганов. Многие согласятся, что слова эти не слишком приличные, но основная причина в том, чтобы некто не мог найти оскорбления вышеозначенных персонажей и выписать соответствующую награду за экстремизм.

И наконец, есть исключительные случаи, когда автозамена изпользуется для лулзов или с целью избавить содержание постов от наиболее употребляемых слов. Например, на 2ch.so слово «школьник» автоматически превратится в сосницкий; а «быдло» — в элита.

См. также