Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

MyDC.ru _ Общалка aka Флуд _ Скрипты API 2. Защита хаба. Базы TTH

Автор: GULAM33 16.6.2012, 23:30

Предлагаю скрипты для PtokaX версий API 2 от 0.4.0.0 и далее...
Главная цель скриптов блокировка спама, флуда и рекламы в чате.

Скрипты для PtokaX антимат-антиспам, антиреклама:
 Anti_mat.spam_V.2.3.mi.rar ( 10.01 килобайт ) : 15
 Tron__Red__Iv_459A.rar ( 9.21 килобайт ) : 15
.

А так же базы хэшей (TTH) файлов порнографического, насильственного, расистского, цензурного характеров.

Для клиента п2п сети - Pelink от версии 5.97, сборки баз TTH (Tiger Tree Hash) файлов: http://mydc.ru/r/?http://yadi.sk/d/LZnT85tvGN7Vi

Для самостоятельной правки и пополнения баз, выкладываю составляющие по категории и расширении файлов.
В архив http://mydc.ru/r/?http://yadi.sk/d/TTwIlu3uGN7WZ входят следующие базы по категориям:
архивные файлы, исполняющие файлы, файлы образов, pdf файлы, torrent файлы, текстовые файлы, url файлы, вирусы,
видео файлы: (avilock-avicod-лохотрон видео, цензура, насилие-суицид-убийства, расизм и анти-религия, пропаганда, эротика+16,
порно+18, возможные фейки видео файлов (by SP Podval), битые видео файлы, не проигрывающиеся видео файлы,
файлы не являющиеся видео файлами), а также базы исключений по категориям: http://mydc.ru/r/?http://yadi.sk/d/6CkRXK6QGN7Vx .

Для исправления выявленных ошибок в БД, пишите TTH файлов, а не названия. Есть ошибки не спорю. Список TTH не являющихся запрещенными для базы PORN.VIDEO +16/+18 - http://mydc.ru/r/?http://yadi.sk/d/NlOAlsMaGN7Wu .
Далее, в этом посте будут ежемесячно выкладываться обновления и найденные ошибки.
Просмотреть все файлы не всегда удается. В сетях их огромное кол-во. И только сообща мы сможем внести вклад. Спасибо за понимание.

Автор: Ksan 17.6.2012, 1:09

Пипец скрипты..
Кто скачает посмотрит, поймёт, о чём я...если вообще понимает что-то в скриптах.
Извините.

И да, автору - комменты, вопросы и пожелания здесь принято писать в теме, а не лезть куда-то в ВК.

Автор: mariner 17.6.2012, 9:25

Когда я открыл код... то у меня появилось чувство диссонанса. По комментарию транса вижу, что не только у меня.

Автор: Saymon21 17.6.2012, 11:51

Цитата
Ранее скрипты были выложены в инете в сыром виде.

А теперь в виде говнокода. :( Простите.
Но к счастью, все скрипты с подобным функционалом, а то и лучше у нас на форуме уже есть.

Автор: ShadoWx 17.6.2012, 12:05

а вот база ттш ...хм ...смутные сомнение терзают ...

Автор: GULAM33 17.6.2012, 23:13

Цитата(Ksan @ 17.6.2012, 1:09) *
Пипец скрипты..
Кто скачает посмотрит, поймёт, о чём я...если вообще понимает что-то в скриптах.
Извините.

И да, автору - комменты, вопросы и пожелания здесь принято писать в теме, а не лезть куда-то в ВК.


Ksan, хорошо secret_smile.gif .

Цитата(mariner @ 17.6.2012, 9:25) *
Когда я открыл код... то у меня появилось чувство диссонанса. По комментарию транса вижу, что не только у меня.

Всё взаимосвязано в этих трёх скриптам, ибо они взаимодополняют друг друга, в этом то и диссонанс. Как чего и что . . .
1-ый скрипт "Tron Red" создавался как полноценный (защита от спама, рекламы, флуда, и т. д.), необходимо стало всё больше вводить допустимые выражения
в маску исключения, что повышало возможность обхода скрипта, плюс нагрузка на единственный скрипт возрастала.
Для этого добавляются ещё два одинаковых по коду скрипта, которые делят между собой свои функционалы,
то есть один сканирует матерные слова и дополняет скрипт "Tron Red", второй сканирует спам, так же дополняя первоначальный скрипт.
Таким образом, исключил маску разрешения для рекламы до ноля.
Всё делалось для того чтобы аккуратно минимизировать скрипт "Tron Red", не допустив конкурирования скриптов между собой.
Было много ошибок, много новых идей - это результат моих трудов, надеюсь не из последних. boss.gif

Цитата(Saymon21 @ 17.6.2012, 11:51) *
А теперь в виде говнокода. :( Простите.
Но к счастью, все скрипты с подобным функционалом, а то и лучше у нас на форуме уже есть.

Saymon21, главное здесь не какой-то код, главное, что реально работает. Пусть и есть подобные скрипты, лучше или хуже, по мне они все "мёртвые".
Скрипты "Tron Red" вместе с антиспамом не блокируют Ваш личный адрес хаба, сайта (номер, а так же доменное имя) и так далее, если юзер напишит его,
Всё достигается путём обхода в скрипте антиспама и "Tron Red". И не заносит их в маску исключения, что не даёт возможности воспользоваться спамеру.

Цитата(ShadoWx @ 17.6.2012, 12:05) *
а вот база ттш ...хм ...смутные сомнение терзают ...

ShadoWx, сразу скажу, базу TTH файлов по крупицам собираю лично, проверяю естественно. Здесь набор TTH видео-файлов от 1 Mb.
Бывали случаи когда TTH порно совпадал с TTH нормального видео = 1 к 1000. Обновления в дальнейшем буду выкладывать. feel_good.gif

Автор: GULAM33 18.6.2012, 20:17

Поподробнее о скрипте Tron Red . Вижу Вас смутило содержимое, опишу как это работает. big_smile.gif
 tron_red___opisanie.txt ( 9.03 килобайт ) : 40

Автор: Saymon21 18.6.2012, 20:22

В содержимом просто кроме говнокода нет ничего. А о захватах, кстати, читай лучше http://mydc.ru/topic266.html

Автор: GULAM33 19.6.2012, 0:19

Цитата(Saymon21 @ 18.6.2012, 21:22) *
В содержимом просто кроме говнокода нет ничего. А о захватах, кстати, читай лучше http://mydc.ru/topic266.html


В данном скрипте захват происходит именно так кавычками "..." или '...', где точки - то что вы захватываете, и никак иначе.
Одна из главнейших особенностей скрипта, является то, что разрешается писать на хабе любому юзеру выражения:
- http:// не указывающий адрес (домен) хаба и/или порно сайта, например легко сможет скинуть ссылку http://mydc.ru/r/?http://vk.com и так далее.
- dchub://адрес вашего же хаба big_smile.gif .

Автор: ShadoWx 20.6.2012, 0:07

ты не понял к чему тебя подвести хотят, то что ты написал "мильон" четыреста слов в скрипте сокращается регулярными выражениями, а то что у тебя в кавычках простой перебор, который выполняется регексами))). Хотя как бы грамотно ты не писал ни регулярные выражения, ни свои фразы в кавычках ложные срабатывания всегда будут ....

P.S. Там сам процент скрипта около 30 строк, а остальное перебор всяких вариантов.
P.S.S. На 1000+ онлайн сколько ваше поделие кушает памяти?

Автор: HOUSE 24.6.2012, 3:23

[quote name='GULAM33' date='17.6.2012, 1:30' post='43788']
Предлагаю скрипты для PtokaX версий API 2 от 0.4.0.0 и далее...
Главная цель скриптов блокировка спама, флуда, рекламы и так далее. Ранее скрипты были выложены в инете в сыром виде.
Эти скрипты взаимодополняют друг-друга: Скрипт антирекламы, антиспама, и антимата.
[attachment=6466:tron__re...iv_1.444.lua] , [attachment=6467:antimat_V_1.0.lua] , [attachment=6468:antispam_V_1.0.lua] .


Переведи на Русский язык эти скрипты

Автор: Артём 1.7.2012, 13:10

extreme_sexy_girl.gif фигасе маска в антирекламе eyes_droped.gif
а "два" других антимата, точнее один и тот же скрипт с разными "масками", не лучше антирекламы.

Цитата
Ранее скрипты были выложены в инете в сыром виде.

а ты добавил извращённые виды масок и посчитал что скрипт стал не сырым? bad_smile.gif

Автор: GULAM33 2.7.2012, 21:54

Маски мата из Tron Red вывел в anti-mat, маски спама добавил в anti-spam.
Плюс убрал ненужные и не правильные маски из Tron Red.
Дбавлены домены и адреса порно сайтов.
Добавлены маски доменов хабов, кроме dchub://triada.mydc и dchub://triada.info, минимизировав до b://triada....
Операции с добавлением масок домена, кроме домена вашего хаба, производится аналогично!
Удалил исключения из Tron Red.

Переведи на Русский язык эти скрипты
[/quote]

Вопроса я не понял. Что именно переводить. Вроде и так всё понятно.

Цитата(ShadoWx @ 20.6.2012, 1:07) *
P.S. Там сам процент скрипта около 30 строк, а остальное перебор всяких вариантов.
P.S.S. На 1000+ онлайн сколько ваше поделие кушает памяти?


Скрипт доводится до ума. Сама программа не трогается. Маски же пополняются, исправляются. Каждому региону, хабу, свойственны различные маски.
Администратор может самостоятельно добавить то, что он считает нужным, или убрать. Но маски близки к идеальности.
Скрипт онлайн ест памяти от 450 до 800 не более.

Автор: Артём 3.7.2012, 0:31

GULAM33, скрипт как скрипт, маска если честно унылая, она для тебя уникальная, пусть для тебя такой и остаётся, но не стоит выкладывать новые версиии с новыми масками. Спасибо! big_smile.gif
Твоя УНЫЛАЯ тысячная маска антирекламы делается в одну - три примера и не парится мозг...

Автор: GULAM33 19.8.2012, 22:04

Удалено, перенесено в первый пост.

Автор: Артём 20.8.2012, 0:30

GULAM33, без обид, но маски "антиспама" и антимата унылые до ужаса beat_brick.gif а точнее маски "антиспама" вообще бредовые и не понятные.

Автор: GULAM33 22.9.2012, 22:46

Удалено, перенесено в первый пост.

Автор: mariner 23.9.2012, 10:32

Какой же унылый скриптина. На форуме есть уже заметно более приятная вещь с Mysql

Автор: Littlemuk 23.9.2012, 14:37

GULAM33, Мастера и маргариту за что порнухой посчитал? big_smile.gif Штук 5 файлов уже из базы удалил, и это за полчаса использования. Пока чищу дальше...

Автор: GULAM33 28.9.2012, 14:54

Удалено, перенесено в первый пост.

Автор: GULAM33 29.9.2012, 19:00

Удалено, перенесено в первый пост.

Автор: Littlemuk 30.9.2012, 12:55

CI4IC7I5IPAFAUROZ3NVUHU2SDWFRHBTM242ERY Воля травит беркову

Автор: GULAM33 5.10.2012, 0:29

Удалено, перенесено в первый пост.

Автор: Артём 5.10.2012, 2:19

GULAM33, без обид, но ничего хорошего не вижу в антимате и антиспаме, ужасный шаблон "составлен" ужасно, куча ненужного фильтра.

Код
string.find(sData, "[0123456789].[123456789][0123456789].[123456789][023456789].[0123456789]") or
это что за ужас, отлов IP адреса?
Да и вообще, он походу дела все слова блокирует bad_smile.gif
P.S. хотя бы к каждой ужасной строчки маски коммент добавил, интересно знать что он вылавливает)))

Автор: GULAM33 5.10.2012, 3:42

Цитата(Артём @ 5.10.2012, 3:19) *
GULAM33, без обид, но ничего хорошего не вижу в антимате и антиспаме, ужасный шаблон "составлен" ужасно, куча ненужного фильтра.
Код
string.find(sData, "[0123456789].[123456789][0123456789].[123456789][023456789].[0123456789]") or
это что за ужас, отлов IP адреса?
Да и вообще, он походу дела все слова блокирует bad_smile.gif
P.S. хотя бы к каждой ужасной строчки маски коммент добавил, интересно знать что он вылавливает)))


Объяснение  obyasnenie.txt ( 6.1 килобайт ) : 19
, Описание скрипта анти-спам  antispam_v.2.1_komenty.txt ( 16.88 килобайт ) : 17
,  isklu4enie_ip_iz_scan_anti_spam.txt ( 11.5 килобайт ) : 6
.

Покажи момент в скрипте - раскоментирую. Коментов много будет судя по кол-ву масок. Так и скрипт не увидишь за коментами.

Автор: Setuper 5.10.2012, 9:19

компактнее написать так:

Код
"[0-9].[1-9][0-9].[1-9][0-9].[0-9]"

Автор: Ksan 5.10.2012, 9:22

GULAM33, вы в самом деле считаете, что ваш скрипт заменяет все другие скрипты антирекламы и антимата? big_smile.gif
Вы вообще изучали другие скрипты, причем, внимательно? Вы хоть старались понять логику шаблонов?
Мне думается, нет.
И ваше "объяснение.тхт" нужно писать тут, а не отправлять читать файл, будет здесь - будет и обсуждение. А копаться в такой унылой помойке (да простит меня сообщество, но так выглядят эти скрипты) не хватает ни терпения, ни желания, ни стеков моей памяти.
Извините..

Автор: Setuper 5.10.2012, 9:28

Не нужно в регулярках брать в квадратные скобки 1 символ, ибо толку мало.

Автор: Артём 5.10.2012, 14:27

amazing.gif посмотрел описание и ещё больше ужаснулся, там вылов IP на сотни строк идёт, это же ужас bad_smile.gif

Цитата
Назойливая писанина в чате с повторяющимися буквами, в обход

та ладно, а настройки в самой птоке зачем?
блин, столько всего лишнего в этих скриптах shocked.gif

Автор: GULAM33 5.10.2012, 16:12

Цитата(Setuper @ 5.10.2012, 10:19) *
компактнее написать так:
Код
"[0-9].[1-9][0-9].[1-9][0-9].[0-9]"

Да я согласен с Вами, но % ошибки будет. Внимательно вникните: допустим, как Вы сказали написать код покомпактнее и привели пример.
Ваш код отловит не все реальные IP адреса.
Смотрите разницу:
реальный IP - 82.34.12.5
не реальный IP - 82.34.12.523
Для этого была выведены развернутые маски, где [a] не может быть значением 0,3,4,5,6,7,8,9. Согласитесь, что противоречит вашему коду [0-9].[1-9][0-9].[1-9][0-9].[0-9].
Маски: "[c].[a][c].[a][b][c].[a][b][c]","[c].[a][b][c].[a][b][c].[b][c]","[c].[a][b][c].[a][b][c].[c]", .
Ваша маска подойдет для анти-спама, в случае "[сС][мМ][сС] [0123456789][0123456789] [н][а] [0123456789][0123456789][0123456789][0123456789]",
"[сС][мМ][сС] [0-9][0-9] [н][а] [0-9][0-9][0-9][0-9]. И также [aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYzZ] на [aA-zZ].

Цитата(Ksan @ 5.10.2012, 10:22) *
[b]GULAM33, вы в самом деле считаете, что ваш скрипт заменяет все другие скрипты антирекламы и антимата? big_smile.gif
Вы вообще изучали другие скрипты, причем, внимательно? Вы хоть старались понять логику шаблонов?
Мне думается, нет.
И ваше "объяснение.тхт" нужно писать тут, а не отправлять читать файл, будет здесь - будет и обсуждение. А копаться в такой унылой помойке (да простит меня сообщество, но так выглядят эти скрипты) не хватает ни терпения, ни желания, ни стеков моей памяти.
Извините..


Да, изучал и другие скрипты. Порой диапазон масок сканируют все, включая лишнее или разрешенное. Скрипты анти-спам и анти-мат сканируют только чат, следовательно они будут дополнением к вашей антирекламе.
Без логики, я думаю врятли можно, что-то сварганить.

Цитата(Артём @ 5.10.2012, 15:27) *
amazing.gif посмотрел описание и ещё больше ужаснулся, там вылов IP на сотни строк идёт, это же ужас bad_smile.gif

та ладно, а настройки в самой птоке зачем?
блин, столько всего лишнего в этих скриптах shocked.gif


Объясните о каких настройка в PtokaX ведёте речь. Что Вы посчитали лишним в скриптах. Мне интересно Ваше мнение.

Автор: Ksan 5.10.2012, 16:57

GULAM33

Цитата
Скрипты анти-спам и анти-мат сканируют только чат, следовательно они будут дополнением к вашей антирекламе.

Моя антиреклама работает и для чата и для привата (по отдельности).
А встроенный антимат приват не трогает.
И, естественно, не идеален, как и любой другой. Нет идеальных антиреклам. big_smile.gif
Но она должна выглядеть хотя бы скриптом, а не менюшкой типа "Меню действий" (ну сложность (в смысле простота) и прямолинейность логики похожи), как у вас.
По вашему скрипту - открытий никаких, намного менее удобен, захваты/шаблоны очень и очень спорны (возможно, вам самим они кажутся идеальными и оригинальными), по устройству - сказал уже выше. Обычно такие скрипты я писал в пору самообучения и делал только под себя (года 4 назад), а стал предлагать другим, когда уже скрипты стали походить на человеческие.

Автор: GULAM33 5.10.2012, 17:34

Ksan. Имею частичные первоначальные навыки в программировании с LUA. С 2008 года вожусь с такого рода скриптами. Когда поставил хаб, уже была задумка контролировать действия юзеров. Пробовал множество скриптов, однако и там, и там были свои минусы и плюсы. Сразу понял, что "строгими" масками, используя везде регулярные выражения, проблемы не решить. Начал создавать интеллектуальные маски, но регулярные выражения отбросил, так как не везде они нужны. Базы составлял вручную самостоятельно, дополнял. Поправлял время от времени. Сами базы переросли в настоящий гигант, что много ело памяти в программе и клиент подтормаживал. Приходилось минимизировать до определенного параметра каждую маску. Но использование рег. выражений всё равно требуется. Поэтому, не судите строго. Вот лучше посоветуйте где и как можно что-то подправить.

Автор: GULAM33 18.1.2013, 23:18

Вышло обновление TTH базы видео файлов порнографического характера.
Исправлены несколько ошибок.
Не смог скинуть БД порно файлов для п2п клиента в расширении *.csv, скинул в *.txt
Администраторы, разрешите пожалуйста эту проблему. Заранее спасибо!

Автор: alex82 19.3.2013, 16:50

Несмотря на тяжелый когнитивны диссонанс, перенесенный от просмотра "скриптов", у меня хватило сил открыть еще и базу TTH. И вот что я скажу, господа. Использовать нельзя даже базу, ибо в нее сваливалось все подряд на протяжении длительного времени. Вот вам пример:

Код
10:35;UTC;LWPNACQDBZRYXW3VHJVCJ64QBZNGHOHHHZWCLNQ;COMMENT;bad file - torrent 1.01.2013
Кто не в курсе - это TTH пустого файла, который, при добавлении в скрипт анттипорно, снесет как минимум четверть юзеров хаба. Дальше просматривать не стал, поскольку тут и так все ясно.

В общем, думайте сами, решайте сами, иметь или не иметь big_smile.gif

Автор: GULAM33 20.4.2013, 8:07

Цитата(alex82 @ 19.3.2013, 17:50) *
//-//-//-


Ошибка исправлена, пожалуйста прочитайте первый пост:

Для исправления выявленных ошибок в БД, пишите TTH файлов, а не названия. Есть ошибки не спорю. Список TTH не являющихся запрещенными для
.
Просмотреть все файлы не всегда удается. В сетях их огромное кол-во. И только сообща мы сможем внести вклад. Спасибо за понимание.

Автор: Prs 23.5.2015, 12:12

Всем доброго времени суток!
Огромное спасибо за базу U3+TTH_PORN.VIDEO_(187952-19.01.2014)! Однако есть замечания.
Получается, что в выше указанной базе смешаны эротика и порнография? Я поднимаю данный вопрос потому, что в хабе пару пользователей скрипт забанил за 24MMHPBTIPSBHWL43CURVR44VJSC76AKC6PDV4I (Partycheckerz_-_Baby_I_Love_Your_Way.mpg), что на поверку является эротикой.
Далее 26U7RXDAPYGDEGX3WLQVPTDUFNGL7T56S7POMXY на поверку оказался Дурная ночь (артхаус, драма, 1985, реж.Гас Ван Сент).avi. Бегло просмотрев видеоряд ничего относящегося к порнографии или даже к эротике не увидел. Быть может это редкие исключения?
Хотелось бы использовать базу только порнографии (без прочего).

Автор: Артём 23.5.2015, 19:03

Prs, так в чём дело? Удали лишние ТТН да и всё.

Автор: Prs 23.5.2015, 22:35

Цитата(Артём @ 23.5.2015, 19:03) *
Prs, так в чём дело? Удали лишние ТТН да и всё.

После многочисленных банов невинных пользователей. :( Это никуда не годиться: нужно каждую минуту быть у компа.

Автор: Артём 24.5.2015, 14:51

Prs, внимательно читай, удали ИЗ БАЗЫ ТТН, а не юзеров удаляй из банов.

Автор: Prs 24.5.2015, 16:41

Цитата(Артём @ 24.5.2015, 14:51) *
Prs, внимательно читай, удали ИЗ БАЗЫ ТТН, а не юзеров удаляй из банов.

В базе более 180 тысяч TTH! Как я их все проверю на предмет соответствия теме?

Автор: Артём 24.5.2015, 16:55

Prs, ну, ты же как-то узнал ТТН которые несколькими комментами выше кидал, вот так и остальные, узнаёшь и удаляешь.
А ещё проще, не использовать сее гавницо.
http://mydc.ru/topic5438.html этот скрипт лучше используй.