Odkrycie wiedza
/ Knowledge Discovery >> Odkrycie wiedza >> tech >> komputer >> bezpieczeństwa komputerowego >>

Jak mogłem algorytm spot trolle w Internecie?

Award oraz Wydziału Badań Google) przeprowadziła badania, aby zobaczyć, czy mogą użyć środków ilościowych do wykrycia antyspołeczne użytkowników. Zyskały dostęp do komentarzy użytkowników obsługiwanych przez Disqus dla tych terenów Breitbart.com, CNN.com i IGN.com, obejmujących 18 miesięcy od marca 2012 do sierpnia 2013. Dane składał się z około 1,75 miliona użytkowników (prawie 49.000 z nich zakazane), 1,26 mln i 39 mln wątki postów (prawie 838 tysięcy z nich usunięte i 1,35 mln z nich zgłaszane). Zwęziły one zakazane dane użytkownika w dół do około 12.000 użytkowników, którzy przystąpili miejsc po marcu 2012 roku, miał co najmniej pięć posty i zostały zakazane na stałe do czegoś innego niż spamowanie adresy URL [Źródło: Cheng]. Największa

Naukowcy przechwycone dane w tym treści postu, aktywności użytkownika, odpowiedzi i działaniach wspólnotowych moderatora. Porównano wiadomości użytkowników, którzy nigdy nie zostały zakazane do wiadomości użytkowników, którzy na stałe zakazanych, i spojrzał na zmiany zachowań zakazanych użytkowników nad ich czas. Zespół odkrył, że posty przyszłych zakazanych trolle mają zazwyczaj następujące cechy:

  • ubogich pisowni i gramatyki Największa
  • Więcej wulgaryzmów
  • więcej negatywnych słów Największa
  • mniej ugodowe lub niepewny język Największa
  • niższe odczyty zrozumiałość na podstawie kilku testów czytelności (w tym Automated czytelność Index), który dostał gorsze ku czasie zakazu Największa
  • korzystanie z różnych funkcji i żargonu słów od osób spoza społeczności Największa zakazane
  • dygresja od tematu Największa
  • znacznie wyższa liczba etatów komentarz niż przeciętnego użytkownika Największa
  • tendencję do koncentracji ich odpowiedzi w poszczególnych wątków
  • tendencja sprowokować więcej odpowiedzi od innych Największa
  • gorsze zachowanie się w czasie w wyniku swoich postów coraz bardziej usuniętych przed zakazu

    Na CNN.com, przeciętny użytkownik raczej odpowiedzieć około 22 postów w okresie 18 miesięcy, podczas gdy przyszli użytkownicy napisali wokół zakazano 264 razy przed zakazane [Źródła: Cheng, Collins]. Wspólnota była również mniej skłonni tolerować troll w czasie. Największa

    Za pomocą wymiernych wyników, naukowcy byli w stanie opracować algorytm (zestaw kroków używany w celu rozwiązania problemu lub wykonania zadania), które wykorzystywane jako mało jak pięć komentarzy do ustalenia, kto będzie zakazane w przyszłości z dokładnością 80 procent. Z 10

    Page [1] [2] [3] [4]