PWGay

Politechnika Warszawska w kolorach tęczy
Dzisiaj jest 12 lis 2019, o 06:28

Strefa czasowa UTC+1godz. [letni]




Nowy temat Odpowiedz w temacie  [ Posty: 6 ] 
Autor Wiadomość
 Tytuł: pytanie o spam
Nieprzeczytany post: 11 lip 2011, o 09:55 
Offline
Czarownica nie z tej Ziemi

Rejestracja: 3 kwie 2011, o 16:09
Posty: 663
Zauważyłem, że ostatnio pojawia się sporo spamu na forum. Co robicie ze spamem - czy jest on bezpowrotnie usuwany, czy też oznaczacie tylko danego posta jako spam i nie jest on usuwany, a tylko nie jest wyświetlany i pozostaje w bazie danych. Byłbym mega zachwycony gdyby jednak pozostawał w Waszej bazie danych. Powiedzmy że mam w dalszych planach (bo mam sporo obecnie innych ciekawiących mnie rzeczy do nauki) z uwagi na zwiększającą się efektywność spam robotów coraz skuteczniej sobie radzących z zabezpieczeniami typu kod obrazkowy rozpoczęcie badań nad nowym mechanizmem eliminacji spamu wykorzystującym mechanizmy matematyczne. Obecnie jestem na etapie poszukiwania serwisu, który udostępniłby mi dane z bazy danych będące spamem - jednak w większości przypadków spam jest niestety bezpowrotnie usuwany. :(


Na górę
 Wyświetl profil  
 
Nieprzeczytany post: 11 lip 2011, o 10:34 
Offline
Czarownica z tej Ziemi
Awatar użytkownika

Rejestracja: 23 gru 2009, o 00:55
Posty: 773
Lokalizacja: Warszawa Żoliborz
o ile wiem to spam jest bezpowrotnie kasowany (w przeciwieństwie do wątków / postów moderowanych z innych powodów)
w tej chwili poza captcha przy zakładaniu profilu - która działa tak sobie - nie ma innych mechanizmów zabezpieczających. problem spamu nie jest chyba aż na tyle uciążliwy, żeby chciało się adminom dodawać odpowiedni plugin klasyfikujący i eliminujący problem u źródła.
ale: jakby ci się chciało napisać na przykład implementację filtru Bayesa osadzanego w bazie danych, i potem podpiętego triggerem pod tabelę z postami, to czemu nie :-)
poza tym wydaje mi się, że głównym mechanizmem pozwalającym na masowe obchodzenie captcha jest nie tyle udoskonalenie algorytmów, ile dostępność hurtowego rozpoznawania captcha interfejsem białkowym przez tanią siłę roboczą w Indiach

_________________
Obrazek


Na górę
 Wyświetl profil  
 
Nieprzeczytany post: 11 lip 2011, o 12:15 
Offline
Czarownica nie z tej Ziemi

Rejestracja: 3 kwie 2011, o 16:09
Posty: 663
Rozpocząłem już jakiś czas temu implementację naiwnego klasyfikatora Bayesa w celu uczenia maszynowego do rozpoznawania spamu, zatrzymałem jego rozwój w momencie gdy nie byłem w stanie zweryfikować jego skuteczności w związku z brakiem odpowiedniej ilości danych do przeprowadzenia testów oraz ponieważ miałem jeszcze inne ciekawe pomysły niezwiązane z klasyfikacją. Obecnie w ogóle mój rozwój intelektualny i zapał się wyczerpał w związku z intensywnym poszukiwaniem chłopaka. Szukam chłopaka, który sprawi, że znów wróci mi zapał i natchnienie do działania.


Na górę
 Wyświetl profil  
 
Nieprzeczytany post: 11 lip 2011, o 12:22 
Offline
Chłopiec
Awatar użytkownika

Rejestracja: 19 mar 2004, o 00:56
Posty: 4986
Lokalizacja: Elka
nowy pisze:
Obecnie w ogóle mój rozwój intelektualny i zapał się wyczerpał w związku z intensywnym poszukiwaniem chłopaka.
Dlatego nie lubię szukać chłopaka, bo się człowiek wtedy przestaje koncentrować na innych ważnych sprawach i marnuje energię na ludzi, którzy po średnio 3 miesiącach sobie znikną.

_________________
Chłopiec pełen magii

count your blessings now
'fore they're long gone


Na górę
 Wyświetl profil  
 
Nieprzeczytany post: 11 lip 2011, o 12:23 
Offline
Czarownica nie z tej Ziemi

Rejestracja: 3 kwie 2011, o 16:09
Posty: 663
Chłopiec widać nie trafiłeś na właściwych :tuli: :pocieszacz:. Eh... Chłopiec.


Na górę
 Wyświetl profil  
 
Nieprzeczytany post: 11 lip 2011, o 13:12 
Offline
Czarownica z tej Ziemi
Awatar użytkownika

Rejestracja: 23 gru 2009, o 00:55
Posty: 773
Lokalizacja: Warszawa Żoliborz
7z9 pisze:
(...) Nie sądzę też, żeby provider zgodził się na ładowanie jakichś obcych modułów do bazy.

Ależ zgadzam się - "lecz nie o to chodzi by załapać króliczka, ale by gonić go". Natomiast z tego co widzę to operator ma bardzo otwartą politykę wsadzania do bazy różnych rzeczy i sporo tam domyślnie już jest. A jakby nowy miał ochotę napisać coś plsql to by się mógł intelektualnie rozwinąć i przestać myśleć o poszukiwaniu zaspokojenia^H^H^H^H^H^H^H^H^H^H^H^H chłopaka.
7z9 pisze:
najlepszą metodą weryfikacji byłby test Turinga, choć i tak zapewne byłby jakiś odsetek false-negatives :)

lepsze w tym wypadku to niż false-positives. :-P

_________________
Obrazek


Na górę
 Wyświetl profil  
 
Wyświetl posty nie starsze niż:  Sortuj wg  
Nowy temat Odpowiedz w temacie  [ Posty: 6 ] 

Strefa czasowa UTC+1godz. [letni]


Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 1 gość


Nie możesz tworzyć nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz dodawać załączników

Szukaj:
Przejdź do:  
cron
Powered by phpBB® Forum Software © phpBB Group