Inteligencja w wyszukiwarce?

Gdyby przyjąć modną terminologię, można by powiedzieć, że nadszedł czas wyszukiwarek 2.0 - mechanizmów, które próbują odgadnąć kontekst zapytania. Z kolei w języku marketingowym można być mówić o "inteligentnej" wyszukiwarce. Jakkolwiek by jej nie nazwać, powinna dawać wyczerpującą odpowiedź na zapytanie. Netsprint postanowił odświeżyć swój mechanizm i uporządkować polskie zasoby sieciowe. Cel: wyścig z Google o krajowego odbiorcę. Na ile jest to jednak gonienie konkurenta a na ile innowacja? Osobną kwestią jest pytanie, czy dedykowane bądź spersonalizowane wyszukiwarki będą w stanie uszczknąć trochę udziałów rynku korporacji Brina i Page'a.

Inteligencja w wyszukiwarce?
Tradycyjne wyszukiwanie polega na zwracaniu dużej liczby stron, które zawierają informacje z zapytania i do których prowadzi najwięcej odnośników. I to przestaje już nas satysfakcjonować, zwłaszcza jeżeli poszukujemy specjalistycznych informacji i musimy się przedrzeć przez masę bezużytecznych odnośników, zanim dobrniemy do źródła. Nic więc dziwnego, że pojawia się presja, by mechanizm zmienić tak, aby wyszukiwarka "odpowiadała" na określone pytania. I to oczywiście jak najbardziej precyzyjnie.

Takiej formuły trzyma się rozwiązanie przygotowywane przez Prokom. Hakia ma pełnić rolę "inteligentnego" przewodnika, któremu zadaje się nie tyle jedno czy kilkuwyrazowe zapytanie, ale właśnie całe pytania. Wyszukiwarka jest wyposażona w translator zdań. Sam translator nie zadecyduje jednak o sukcesie. Mechanizm musi "rozumieć" sens pytania, żeby móc na nie właściwie odpowiedzieć. I to jest najtrudniejsze.

Hakia ma uwzględniać znaczenie i konteksty wpisywanych zapytań. Przedstawiciele zapewniają, że rozwiązanie ma być rewolucyjne, bo będzie zwracać precyzyjne odpowiedzi, uniezależniając się od potrzeby użycia słowa z zapytania w wynikach wyszukiwania. Działanie mechanizmu Hakii opisują na podstawie przykładu: jeżeli wpiszemy w wyszukiwarkę hasło "jaki lek pomaga na ból głowy?", otrzymamy m.in. odpowiedź: "Aspiryna leczy migrenę"(w odpowiedzi nie ma słów zawartych w zapytaniu).

NetSprint ma trochę inną koncepcję "inteligentnej" wyszukiwarki. Głównym założeniem firmy jest uporządkowanie polskich zasobów sieci i wykorzystanie baz wiedzy swoich partnerów. Chcemy dostarczać użytkownikom precyzyjne odpowiedzi na większość ich zapytań jeszcze na stronie wynikowej - wyjaśnia Artur Banach, prezes NetSprint.pl - Mechanizm wykorzystywany w koncepcji "inteligentnej wyszukiwarki" umożliwia przeszukiwanie uprzednio zebranych i przygotowanych przez nas we współpracy z partnerami informacji, które mają zaspokajać docelowo wszystkie potrzeby internauty zadającego dane zapytanie. Przewagą tego rozwiązania ma być użyteczność dla polskiego odbiorcy, a nie "unikalność" technologiczna, co oczywiście nie znaczy, że jest to proste rozwiązanie od strony technologicznej. Mówiąc szerzej, mechanizm będzie starał się rozpoznawać intencje użytkownika. Oczywiście mamy świadomość, że od tej wizji dzieli nas jeszcze sporo pracy, ale myślę, że już wersja zaprezentowana we wrześniu zaspokoi potrzeby większości

polskich użytkowników.

Mechanizm NetSprinta podobnie jak Google korzysta m.in. z Wikipedii oraz serwisów informacyjnych, dając użytkownikowi możliwość zapoznania się z najnowszymi wiadomościami na dany temat. Wdrożenie to stanowi pierwszy krok na drodze do zrealizowania koncepcji nowej jakości wyszukiwania - wskazuje Artur Banach - W tej chwili występują jeszcze pewne niedoskonałości, wyniki nie zawsze są zwracane poprawnie dla żądanych zapytań, ale to tylko kwestia czasu. W czasie wakacji chcemy intensywnie rozbudowywać funkcjonalność narzędzia. Wyszukiwarka nie zawsze radzi sobie dobrze też m.in. z podpowiedziami po błędnym wpisaniu zapytania. Sama lista wyników jest za to wiele dłuższa. Zamiast klasycznie 10 odnośników - na jednej stronie pojawia się aż 100.

W tej chwili działanie NetSprint.pl w nowej firmie można przetestować na kilku bazach: aktorzy i filmy (zobacz wyniki dla Al Pacino - porównaj także z Google), sportowcy (wyniki dla zapytania o Zidane), kluby sportowe (np. Zabrze), miasta (Warszawa), kraje (Turcja), oprogramowanie (Winzip czy Emule), marki i modele samochodów (Ford czy Ford Escord)

Porządkowanie polskiego internetu NetSprint rozpoczął z partnerami. Przede wszystkim z największym, czyli Wirtualną Polską. W przygotowywaniu trafnych wyników wyszukiwania pomagać mogą i inni. Jesteśmy otwarci na wszelkie propozycje współpracy z potencjalnymi partnerami, którzy dysponują unikalnymi bazami wiedzy - dodaje prezes NetSprint.pl.

Wyszukiwarka przez następne dwa miesiące będzie rozbudowywana o nowe kategorie zapytań. We wrześniu ma pojawić się wersja finalna. To, co Netsprint osiąga, przypomina jednak już dostępne osiągnięcia Google.

Dobrze i szybko

Konkurencja nie śpi

Czy NetSprint ma szansę zdobyć dzięki swojemu nowemu pomysłowi większe udziały w rynku?

Radosław Kucko, dyrektor ds Badań i Analiz w Onet.pl: Powiększenie udziałów rynkowych jest funkcją czasu, który może być krótszy lub dłuższy w zależności od kilku co najmniej czynników. Pierwszy z nich to oczywiście sam mechanizm - jego skuteczność rozumiana jako postrzeganie zaspokojenia potrzeby użytkownika. Sam mechanizm jednak nie wystarcza - nikt nie korzysta z wyszukiwarki jeżeli o niej nie wie, nawet jeżeli jest najlepsza. Dochodzi więc drugi czynnik, jakim jest poinformowanie i namówienie użytkownika, żeby spróbował go wykorzystać - czyli komunikacja. Trzecim elementem jest działanie konkurencji na rynku i wprowadzane przez nią zmiany w ich wyszukiwarkach. Brak działań konkurencyjnych dawałby duże szanse na poprawienie pozycji rynkowej - wiemy jednak, że zarówno Net Sprint jak i inne wyszukiwarki takie jak Google czy wyszukiwarka Onetu, prowadzą ciągłą pracę nad poprawą algorytmów wyszukiwania. Przy tak dużej konkurencyjności, a szczególnie silnej pozycji Google'a, będącego odpowiednikiem Internet Explorera wśród przeglądarek, zmiana postaw użytkowników jest na pewno bardzo trudna do uzyskania, a przynajmniej w krótkim okresie czasu.

Innym trendem w wyszukiwaniu są rozwiązania dedykowane przeszukujące specyficzne bazy danych. Ciekawym przykładem jest GoPubMed - mechanizm pomagający precyzyjnie wyszukiwać dokumenty związane z dziedziną biomedycyny. Projekt powstał w ramach współpracy naukowców z Politechniki Dreźnieńskiej, Zoorobotics B.V. z Holandii, City University London i brytyjskiego Medical Research Council oraz Uniwersytetu Cypryjskiego. Zdaniem Michaela Alversa zarządzającego projektem, naukowcy z branży biotechnologicznej i farmaceutycznej spędzają przeciętnie 12,4 godziny tygodniowo na wyszukiwaniu właściwych informacji. I jest to zdecydowanie za dużo. Tym samym wyzwaniem dla twórców wyszukiwarek jest poprawa funkcjonalności mechanizmów, by dotarcie do poszukiwanych treści zajęło użytkownikowi o wiele mniej czasu.

W bazie danych GoPubMed znajduje się ok. 15 mln publikacji związanych z biomedycyną. Wyszukiwarka nie tylko odsyła do publikacji, które zawierają poszukiwane zagadnienie, ale jeszcze dodatkowo klasyfikuje wyniki w odpowiednich kategoriach. Dla przykładu po wpisaniu zapytania: proteina dostajemy wyniki podzielone na kategorie (które są prezentowane w postaci przejrzystego drzewa wiedzy) typu: składnik komórki, proces biologiczny, etc. Każda z kategorii ma swoje podgrupy - przy nich pojawia się informacja, jaka ilość dokumentów znajduje się w tym dziale.

Zdecydowaną zaletą rozwiązań typu GoPubMed jest przejrzystość prezentowanych wyników i oczywiście ich trafność. Sam proces wyszukania odpowiedzi, co prawda, zabiera więcej czasu niż w tradycyjnej wyszukiwarce, ale warto poczekać.

Podobną przejrzystość prezentowania wyników ma mechanizm Carrot. Utworzony został w ramach inicjatywy Carrot2 , która działa na polu zbierania wyników zapytań z różnych mechanizmów wyszukiwawczych, przetwarzania tych danych i ich wizualnej prezentacji.

Jeśli wpiszemy zapytanie w Carrot, możemy wybrać, z jakiej wyszukiwarki chcemy uzyskać wyniki. Same odnośniki posegregowane są według kategorii. I tak dla przykładu po wpisaniu zapytania Madonna, korzystając z ODP, otrzymujemy katalogii odnośników typu: pliki muzyczne, słowa piosenek, bilety na koncert Madonny, wiadomości o Madonnie, etc.

Wedle potrzeb

Obecne wysiłki firm wyszukiwawczych idą przede wszystkim w stronę podawania najtrafniejszych wyników i odsiewania wyszukiwarkowego spamu. Użytkownicy, którzy nie mają czasu, by przeglądać stos linków, by dowiedzieć się, czy pod nimi kryje się odpowiedź na zapytanie, będą z pewnością zainteresowani dedykowanymi rozwiązaniami bądź chociażby katalogami odpowiedzi.

Sam NetSprint myśli o tworzeniu dedykowanych mechanizmów. Widzimy bardzo dużo różnych zastosowań tego mechanizmu, które powinny zdecydowanie podnieść użyteczność naszych rozwiązań korporacyjnych - wskazuje Artur Banach.

Istnieje więc szansa, że rynek, w którym dominuje Google, może trochę się podzielić. Od pomysłów konkurencji, zależy w tej chwili jak bardzo.

Co sądzisz o nowym rozwiązaniu NetSprinta?

NetSprint: będziemy szybciej szukać

Czym jest nowa wyszukiwarka NetSprintu? Jaką rolę w jej przygotowaniach odgrywają użytkownicy?

Artur Banach: Przede wszystkim sama koncepcja "inteligentnej wyszukiwarki" oparta jest o analizę korzystania przez użytkowników z wyszukiwarki. Badając zapytania a także częste problemy internautów z dotarciem do konkretnej informacji, stworzyliśmy listę zasobów, które najczęściej są poszukiwane przez użytkowników. Oczywiście nie chodziło tu tylko o proste stwierdzenie, że polscy użytkownicy np. często szukają marek samochodów. Poszliśmy krok dalej i określiliśmy, jakie są najczęstsze intencje użytkowników, gdy pytają się np. o "fiata". Otóż okazało się, że często poszukują galerii zdjęć, konkretnych modeli, specyfikacji technicznej czy opinii użytkowników itp.

Użytkownicy mają też odgrywać kluczową rolę przy rozwoju mechanizmu. Planujemy współpracę z nimi praktycznie na każdym kolejnym etapie doskonalenia rozwiązania. Duże nadzieje pokładamy również we właścicielach "niszowych", często znakomitej jakości baz informacji, którzy uporządkowali jakiś "kawałek" wirtualnej rzeczywistości. Zapraszamy ich do współpracy, tak by rozwiązanie mogło stopniowo zaspakajać coraz bardzie złożone potrzeby polskich internautów.

Na czym polega innowacyjność rozwiązania?

Innowacyjność tego mechanizmu leży w jego kompleksowości oraz wygodnej dla użytkownika prezentacji informacji niemalże niezależnie od jej charakteru. Jeżeli użytkownik szuka pogody (zapytanie "pogoda warszawa"), poszukuje najczęściej bieżącej informacji i ją dostaje (lub będzie dostawał). Podobnie często jeżeli wpisuje zapytanie "lech kaczyński", to tak naprawdę chce poczytać o tym, co ostatnio zrobił prezydent, zaś jeżeli wpisuje "druk reklamowy warszawa" szuka listy firm oferujących takie usługi w stolicy. Wreszcie użytkownik, który pierwszy raz usłyszał o Trynidad i Tobago, chce raczej się dowiedzieć w przystępny sposób czegoś o tym kraju czy do niedawna poczytać o występach tej reprezentacji na mundialu, a nie brnąc przez morze linków zwracanych przez wyszukiwarkę.

Oczywiście, użytkownicy mogą w inny sposób dotrzeć do tych informacji, ale wyraźnie widać, że duża cześć z nich ciągle nie posiada takich umiejętności lub częściej chciałaby po prostu zaoszczędzić czas.

Naszym celem jest więc, aby niezależnie od potrzeby informacyjnej użytkownik mógł wpisać zapytanie w okno NetSprinta i znalazł tam informacje, których szuka lub precyzyjne wskazanie, gdzie je znajdzie. Tego na pewno przynajmniej obecnie nie oferuje w Polsce Google.

Chyba najważniejsze pytanie przy takiej funkcjonalności mechanizmu, dotyczy tego, w jaki sposób intencje użytkowników są odczytywane przez mechanizm?

Nasz mechanizm łączy rozpoznawanie automatyczne intencji użytkowników z niemalże ręcznym uporządkowaniem bardzo dużej ilości wysokiej jakości informacji.

W zależności od zapytania informacja może pochodzić z uporządkowanych treści statycznych (o charakterze najogólniej encyklopedycznym pochodzących z wielu zróżnicowanych baz informacji przeszukiwanych przez mechanizm NetSprinta); uporządkowanych treści dynamicznych będących wynikiem przeszukiwania zasobów wertykalnych NetSprinta - np. dla zapytania "Izrael" będzie to lista najświeższych aktualności o wojnie, a dla zapytania "hydraulik warszawa" to będzie lista firm spełniających takie kryteria (ta funkcjonalność będzie dostępna lada dzień). Informacja może też pochodzić z uporządkowanych treści dynamicznych pochodzących od innych partnerów - np. pogoda warszawa, czy kurs dolara .

Z jakimi partnerami spółka współpracuje w tej chwili?

Obecnie zasoby prezentowane na NetSprint.pl pochodzą m.in z WP.pl, Wikipedii, IDG i AutoCentrum.pl. Oczywiście, tak jak już mówiłem bardzo liczymy na szybkie zwiększanie się liczby partnerów.

Czym nowa wersja mechanizmu NetSprinta ma być lepsza od Google'a?

Wraz z rozwojem naszego produktu, użytkownik w zdecydowanej większości przypadków szybciej znajdzie szukana informacje w NetSprincie niż w Google.

Warto mierzyć siły na zamiary

Artur Waliszewski, Country Business Manager, Google Polska:

Pomysł NetSprinta nie jest ani nowy ani innowacyjny. Podobne rozwiązania były i są stosowane przez różne wyszukiwarki. Cieszy natomiast, że NetSprint stara się swoją technologię poprawić - to dobrze. W Google zawsze podkreślamy, że konkurencja jest dobra, bo prowadzi do zaoferowania użytkownikom lepszych produktów. NetSprint bardzo często lubi obwieszczać, że zrobił lub zrobi coś lepiej od Google. Dobrze mieć przed sobą ambitne cele, proponuję jednak trochę więcej dystansu do samego siebie i sytuacji rynkowej.