Nowy pomysł NetSprinta: wyszukiwarka z megapanelem

Polska spółka zajmująca się tworzeniem mechanizmów wyszukiwawczych NetSprint.pl opracowała nowy algorytm, który ma zapewnić dostarczanie lepszych wyników wyszukiwania i jednocześnie przeciwdziałać nieuczciwemu pozycjonowaniu stron. Nowe rozwiązanie bazuje na megapanelowym badaniu internetu realizowanym przez Gemius SA.

Jak wskazują przedstawiciele NetSprinta, dotychczas mechanizm wyszukiwania opracowany przez spółkę bazował na analizie odnośników do strony, sprawdzając ich liczbę i źródło. W tej sposób witryny najczęściej polecane przez inne serwisy były prezentowane wyżej w wynikach wyszukiwania (tym samym na pierwszej stronie wynikowej znajdowały się te strony, które miały jednocześnie dużo odnośników prowadzących do nich z innych witryn oraz zawierały treści bezpośrednio związane z zapytaniem użytkownika).

Nasilające się zjawisko sztucznego zawyżania pozycji stron w wynikach wyszukiwania oraz rosnący udział spamu w wyszukiwarkach był dla NetSpritna bodźcem do stworzenia nowego rozwiązania.

Algorytm stworzono przy wykorzystaniu badania internetu prowadzonego przez Gemius SA - megapanel PBI. Nowe rozwiązanie NetSprint oprócz dotychczasowych czynników (badania odnośników oraz sprawdzania treści serwisu) bierze pod uwagę dane o oglądalności strony, liczbę jej użytkowników, czas spędzany na witrynie oraz tzw. lojalność użytkowników.

Naszym zadaniem było znalezienie odpowiedniej skali premiowania serwisów o wysokim współczynniku Traffic Index - wyjaśnia Piotr Kozłowski, szef zespołu IT w Netsprint.pl - Mieliśmy świadomość, że istnieje bardzo wiele wartościowych serwisów, które nie posiadają jeszcze dużej i lojalnej widowni. Tymczasem to właśnie te serwisy często dostarczają wartościowsze informacje niż znane portale. Ostatecznie podjęliśmy decyzję, że ruch z wyszukiwarek otrzyma mniejszą wagę od ruchu wygenerowanego poprzez odwołanie bezpośrednie czy odsyłacze z innych stron WWW, ale będzie jednak uwzględniany w Traffic Index.

Opracowywanie i testowanie nowego rozwiązania trwało kilka miesięcy.

Zależało nam, żeby nowe rozwiązanie stanowiło wyraźną alternatywę dla dotychczasowych mechanizmów wyszukiwawczych, dlatego na jego dopracowanie poświęciliśmy dużą część energii i potencjału firmy - zaznacza Artur Banach, prezes spółki - Wykorzystaliśmy do realizacji projektu też naszą współpracę z pionem technologii informatycznej Wirtualnej Polski, wdrażającą w swoich mechanizmach wyszukiwawczych nasze rozwiązania. Pracownicy portalu pełnili funkcje doradcze w projekcie, pomagając w podjęciu optymalnych decyzji dotyczących założeń funkcjonowania algorytmu.

Zdaniem przedstawicieli firmy Index Traffic pozwoli na wyszukiwanie wartościowych serwisów i wyeliminuje spam w wynikach wyszukiwania.

Nie wiadomo jednak, jak w wynikach wyszukiwania wypadną serwisy niebadane w megapanelu. Badanie obejmuje analizę zachowań panelistów uczestniczących w badaniu - wskazuje NetSprint - Na tej podstawie Gemius generuje dla nas listę w sumie kilkuset tysięcy domen, które zostały chociaż raz odwiedzone przez panelistę w danym okresie czasu. Tak, więc jest to zdecydowanie bardziej rozbudowana lista niż ta publikowana w badaniu megapanel.

Ciekawym zagdanieniem jest również pytanie, czy przy tak skonstruowanych miarach odpowiadających za pozycję serwisu w wynikach wyszukiwania (liczba użytkowników, czas spędzony przez nich na witrynie, kategoria lojalności) nie przyczyni się to do zalania wyników odnośnikami do podserwisów Onetu, czy ogólnie portali. Zapytaliśmy o to Artura Banacha, prezesa NetSprinta. Oczywiście, żeby strona sie pojawiła w wynikach wyszukiwania musi być nie tylko wartościowa, ale też jej treść musi odpowiadać precyzyjnie zapytaniu użytkownika - wyjaśnia przedstawiciel NetSprint.pl - Zmianie ulega jedynie sposób określania wartości danego serwisu w naszej wyszukiwarce. Obie miary (dopasowanie treści strony do zapytania użytkownika oraz wartość strony) są mnożone przez siebie, a więc na górze wyników są strony, które są zarówno cenione przez użytkownikow, ale też odpowiadają na jego zapytanie. Dodatkowo, ruch na serwisie jest ważny, ale tylko jeden z czynników, jaki uwzględniamy przy określeniu obiektywnej wartości serwisu. W dalszym ciągu brane są rownież pod uwagę analizy linków, czas obecności serwisu w sieci, charakter serwisu i wiele innych. Ważne jest też inne traktowanie przez nas ruchu na serwisie generowanego przez wyszukiwarki. Uwzględniamy go, ale w znacznie mniejszym stopniu niż np. ruch, jaki generuje użytkownik, wchodząc bezpośrednio na daną stronę WWW.

Zarówno nowy algorytm jaki i nowy serwis NetSprinta dostępny będzie od wtorku 20 września.

Aktualizacja: 19 września 2005 12:02

Dodaliśmy wypowiedzi przedstawicieli NetSprinta, wyjaśniające wykorzystanie megapanelu w mechanizmach wyszukiwania.