PWGay
http://pwgay.vipserv.org/

pytanie o spam
http://pwgay.vipserv.org/viewtopic.php?f=20&t=3110
Strona 1 z 1

Autor:  nowy [ 11 lip 2011, o 09:55 ]
Tytuł:  pytanie o spam

Zauważyłem, że ostatnio pojawia się sporo spamu na forum. Co robicie ze spamem - czy jest on bezpowrotnie usuwany, czy też oznaczacie tylko danego posta jako spam i nie jest on usuwany, a tylko nie jest wyświetlany i pozostaje w bazie danych. Byłbym mega zachwycony gdyby jednak pozostawał w Waszej bazie danych. Powiedzmy że mam w dalszych planach (bo mam sporo obecnie innych ciekawiących mnie rzeczy do nauki) z uwagi na zwiększającą się efektywność spam robotów coraz skuteczniej sobie radzących z zabezpieczeniami typu kod obrazkowy rozpoczęcie badań nad nowym mechanizmem eliminacji spamu wykorzystującym mechanizmy matematyczne. Obecnie jestem na etapie poszukiwania serwisu, który udostępniłby mi dane z bazy danych będące spamem - jednak w większości przypadków spam jest niestety bezpowrotnie usuwany. :(

Autor:  mithnae [ 11 lip 2011, o 10:34 ]
Tytuł:  Re: pytanie o spam

o ile wiem to spam jest bezpowrotnie kasowany (w przeciwieństwie do wątków / postów moderowanych z innych powodów)
w tej chwili poza captcha przy zakładaniu profilu - która działa tak sobie - nie ma innych mechanizmów zabezpieczających. problem spamu nie jest chyba aż na tyle uciążliwy, żeby chciało się adminom dodawać odpowiedni plugin klasyfikujący i eliminujący problem u źródła.
ale: jakby ci się chciało napisać na przykład implementację filtru Bayesa osadzanego w bazie danych, i potem podpiętego triggerem pod tabelę z postami, to czemu nie :-)
poza tym wydaje mi się, że głównym mechanizmem pozwalającym na masowe obchodzenie captcha jest nie tyle udoskonalenie algorytmów, ile dostępność hurtowego rozpoznawania captcha interfejsem białkowym przez tanią siłę roboczą w Indiach

Autor:  nowy [ 11 lip 2011, o 12:15 ]
Tytuł:  Re: pytanie o spam

Rozpocząłem już jakiś czas temu implementację naiwnego klasyfikatora Bayesa w celu uczenia maszynowego do rozpoznawania spamu, zatrzymałem jego rozwój w momencie gdy nie byłem w stanie zweryfikować jego skuteczności w związku z brakiem odpowiedniej ilości danych do przeprowadzenia testów oraz ponieważ miałem jeszcze inne ciekawe pomysły niezwiązane z klasyfikacją. Obecnie w ogóle mój rozwój intelektualny i zapał się wyczerpał w związku z intensywnym poszukiwaniem chłopaka. Szukam chłopaka, który sprawi, że znów wróci mi zapał i natchnienie do działania.

Autor:  Chlopiec [ 11 lip 2011, o 12:22 ]
Tytuł:  Re: pytanie o spam

nowy pisze:
Obecnie w ogóle mój rozwój intelektualny i zapał się wyczerpał w związku z intensywnym poszukiwaniem chłopaka.
Dlatego nie lubię szukać chłopaka, bo się człowiek wtedy przestaje koncentrować na innych ważnych sprawach i marnuje energię na ludzi, którzy po średnio 3 miesiącach sobie znikną.

Autor:  nowy [ 11 lip 2011, o 12:23 ]
Tytuł:  Re: pytanie o spam

Chłopiec widać nie trafiłeś na właściwych :tuli: :pocieszacz:. Eh... Chłopiec.

Autor:  mithnae [ 11 lip 2011, o 13:12 ]
Tytuł:  Re: pytanie o spam

7z9 pisze:
(...) Nie sądzę też, żeby provider zgodził się na ładowanie jakichś obcych modułów do bazy.

Ależ zgadzam się - "lecz nie o to chodzi by załapać króliczka, ale by gonić go". Natomiast z tego co widzę to operator ma bardzo otwartą politykę wsadzania do bazy różnych rzeczy i sporo tam domyślnie już jest. A jakby nowy miał ochotę napisać coś plsql to by się mógł intelektualnie rozwinąć i przestać myśleć o poszukiwaniu zaspokojenia^H^H^H^H^H^H^H^H^H^H^H^H chłopaka.
7z9 pisze:
najlepszą metodą weryfikacji byłby test Turinga, choć i tak zapewne byłby jakiś odsetek false-negatives :)

lepsze w tym wypadku to niż false-positives. :-P

Strona 1 z 1 Strefa czasowa UTC+1godz. [letni]
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/