Wyszukiwanie w czasie rzeczywistym

Google potrafi już wyszukiwać informacje z Sieci w chwilę po ich opublikowaniu. W ślady giganta idą kolejne wyszukiwarki. Jak oceniają, co jest ważne, a co nie? I czy ktoś z tego skorzysta?

Wyszukiwanie w czasie rzeczywistym
Eksperci nie mają wątpliwości: prędzej czy później wyszukiwanie w czasie rzeczywistym stanie się standardem. Z pozoru sprawa jest prosta: wystarczy szybciej docierać do nowych treści. W praktyce, zmiany sięgają głębiej.

Z perspektywy zwykłego użytkownika wyszukiwanie w czasie rzeczywistym objawia się w ten sposób, że po wpisaniu frazy w wyszukiwarkę otrzyma on wyniki wyszukiwania wzbogacone o fragmenty rozmów toczących się aktualnie w serwisach społecznościowych. Wyszukiwanie w czasie rzeczywistym (ang. real-time search) opiera się na założeniu, że internauci potrafią lepiej niż sztuczne algorytmy ocenić przydatność aktualnych informacji. Użytkownicy Sieci są więc wykorzystywani nie tylko do generowania treści, ale także do ich oceny.

Załóżmy, że chcesz się dowiedzieć o tym, kto prowadzi w trwającym teraz meczu. Wpisujesz w wyszukiwarkę frazę "mecz Polska - Niemcy". Wyszukiwarka powinna znaleźć najnowsze wpisy z mikroblogów (np. Twitter, Śledzik) i serwisów społecznościowych oraz najświeższe artykuły z portali internetowych. Ważne jest to, co dzieje się tu i teraz, a nie odnośnik do Wikipedii.

Taką właśnie usługę oferuje od niedawna wyszukiwarka Google. Wciąż jest jeszcze ona rozwijana, ale możesz zobaczyć jej działanie na żywo, wchodząc na stronę Google Trends. Wpisz szukaną frazę w formularz u dołu strony (More Hot Topics), możesz też kliknąć jeden z listy gorących tematów (Hot Topics), w kolumnie po lewej stronie. Na liście z wynikami wyszukiwania pojawi się pole ze statusami z Twittera, wpisami z blogów i artykułami z serwisów informacyjnych. Uaktualniają się one automatycznie co sekundę, nie musisz odświeżać strony. I chociaż jest to tylko wycinek napływających w każdej chwili informacji, już po minucie ekran zapełniony jest nowymi wiadomościami.

Poza Twitterem, Google śledzi zasoby także innych liczących się serwisów społecznościowych: Facebooka, MySpace'a, FriendFeeda oraz mało znanego w Polsce Jaiku. Na razie przeszukiwane są tylko strony anglojęzyczne, ale z czasem można spodziewać się dodania także polskich serwisów.

Gdzie tu rewolucja? Przecież zamiast szeregować wyniki wyszukiwania po ich jakości, wystarczyłoby posortować je od najnowszych do najstarszych. To nie takie proste. Po pierwsze, nowe informacje muszą zostać pobrane z tysięcy serwerów, co nie odbywa się natychmiastowo. Po drugie, należy je w jakiś sposób filtrować, żeby wykluczyć spam. A jak ocenić jednozdaniowy wpis na mikroblogu, który ukazał się sekundę temu? Te dwa problemy udało się ostatnio rozwiązać.

Skąd wziąć informacje

Wyszukiwanie w czasie rzeczywistym

Collecta przeszukuje nie tylko tekst, ale również zdjęcia i zasoby wideo

Obecnie wyszukiwarki czasu rzeczywistego śledzą głównie wiadomości z serwisów społecznościowych. Trudno jednak uznać te strony za jedyne źródła informacji. Co zrobić z tradycyjnymi stronami WWW? Sprawdzona od lat metoda polega na wypuszczeniu do Internetu botów, które co jakiś czas zaglądają do każdego serwisu i sprawdzają czy pojawiło się coś nowego. Nie jest to ani szybkie, ani skuteczne.

Może więc zadziałać w drugą stronę - odpowiednia technologia już istnieje. Kiedy na stronie publikowana jest nowa wiadomość, jej czytelnicy są o tym informowanie za pośrednictwem kanałów RSS (Really Simple Syndication). Jedyne, czego potrzebują, to czytnik RSS. Nic nie stoi na przeszkodzie, aby te same informacje wysyłać bezpośrednio do wyszukiwarki.

Jako że każda informacja pochodząca z kanału RSS oznaczona jest datą publikacji, idealnie nadaje się do umieszczenia w aktualnych wynikach wyszukiwania. Wiele wskazuje na to, że Google mogłoby wdrożyć taką funkcję. Firma ta jest właścicielem serwisu Feedburner, masowo używanego przez twórców stron do publikacji kanałów RSS. Oznacza to, że zanim wiadomość o nowym wpisie na stronie WWW dotrze do czytelników, przechodzi przez serwery Google, a tym samym może zostać dodana do wyników wyszukiwania.

Jak oceniać, co jest ważne

Wyszukiwanie w czasie rzeczywistym

Monitter to narzędzie idealne do śledzenia wielu wątków jednocześnie

Wiadomo skąd pobierać treści, ale jak rozpoznać te, które mają jakąkolwiek wartość? Tradycyjne strony WWW są przez wyszukiwarki internetowe oceniane po tym, jak dużo odnośników do nich prowadzi. Dla wpisów w serwisach społecznościowych za kryterium oceny służy to, ile osób śledzi danego użytkownika oraz kto oznaczył informację jako ciekawą albo dodał ją do ulubionych.

Jednak głosy internautów nie są sobie równe. Internetowi celebryci, których konta w serwisach Twitter lub Facebook śledzą tysiące osób, są bardziej wpływowi niż ktoś, kto zarejestrował się pięć minut temu. Oprócz uzyskanego rozgłosu, ważna jest również treść wiadomości. Aby odfiltrować spam, sprawdza się jak dużo tagów zostało użytych (zbyt wiele budzi podejrzenia) i czy odnoszą się do popularnych obecnie tematów.