Microsoft walczy ze spamem w wyszukiwarkach

Specjaliści z Microsoft Research opracowali nową metodą do walki z odmianą spamu wykorzystującą silniki wyszukiwarek do pozycjonowania stron.

Narzędzie Strider Search Defender identyfikuje spamerskie adresy URL, które są publikowane na blogach i serwisach typu social-networking. Search Defender pozwala zapobiec indeksowaniu podejrzanych stron stron przez wyszukiwarki, wyjaśniał Yi-Min Wang, specjalista zajmujący się projektem Strider w firmie Microsoft.

Narzędzie Strider Search Defender wykorzystuje elementy technologii wcześniej opracowanych przez Microsoft Research, w projektach takich jak HoneyMonkey, URL Tracer czy TypoPatrol. Potrafi wyszukiwć fora na obecność fałszywych spamerskich adresów URL i usuwać je, zanim zostaną zindeksowane przez wyszukiwarkę. Co bardzo ważne, narzędzie potrafi również rozróżniać adresy URL prowadzące do prawdziwych stron od tych przygotowywanych przez spamerów.

Zależy im [spamerom - przyp. red.], żeby ludzie wchodzili na ich stronę. Zamieszczają więc odnośniki do niej na wszelkich możliwych forach czy księgach gości - wyjaśnia Wang. Silniki wyszukiwarek widzą, że odnośniki do tej strony są wszędzie, więc musi być popularna. A tak naprawdę nie powinna znaleźć się w czołówce wyników wyszukiwania, bo zawiera bezwartościowe treści.

Spamerzy zamieszczają swoje strony na znanych serwisach takich jak Blogger.com czy MySpace.com. Najczęściej używają w tym celu tzw. doorway pages, które przekierowują ruch na witrynę spamera. Powszechnie używane są techniki cloakingu (maskowania), dzięki którym oszukiwane są silniki wyszukiwarek, które "widzą" inną treść witryny, niż internauta odwiedzający stronę. Spamerzy wykorzystują opisane techniki, ponieważ serwisy takie jak Blogger czy MySpace są wysoko indeksowane w rankingach najpopularniejszych wyszukiwarek.

Oprócz dodawania komentarzy z odnośnikami na blogach czy stronach, takich jak MySpace, spamerzy wysyłają posty z adresem URL na możliwie największą liczbę forów internetowych. W związku z tym, że odnośniki pojawiają się na forach uważanych powszechnie jako legalne i zaufane witryny, adresy URL do których prowadzą są wysoko indeksowane przez wyszukiwarki takie jak Google, Yahoo czy MSN, wyjaśniał Wang.

Strider Search Defender działa na innej zasadzie niż obecnie wykorzystywane mechanizmy antyspamerskie. Nie dokonuje analizy treści. Microsoft proponuje podejście kontekstowe, bazujące na analizie odnośników URL, które przekierowują na inne witryny. Pomysł badaczy Microsoftu, polega m.in. na analizie ruchu do stron docelowych, do których następują przekierowania z witryn typu "doorway pages" oraz prowadzą do nich odnośniki z for internetowych.

Blogi z odnośnikami do witryn spamerskich nazywa się potocznie Splog (od Spam Blog).

Narzędzie opracowane przez Microsoft nie jest jeszcze dostępne. Wang wyraża jednak nadzieję, że niebawem znacząco przyczyni się ono do walki ze spamem w wyszukiwarkach.

Więcej na temat Strider'a, można znaleźć w raporcie, który zawiera ilustracje, oraz analizy konkretnych przypadków walki ze spamem. (ang.).