Jak Google chce przeszukiwać serwisy społecznościowe

W jaki sposób dokonać rozbioru gramatycznego i syntaktycznego krótkiego wpisu na Twitterze? Pięć lat temu takie pytanie wydałoby się niedorzeczne - dziś jest zasadne.

Wydarzenia
20 stycznia 2017

Kampania Adwords stała się nieodzownym elementem strategii marketingowej większości firm. W Google po prostu trzeba być. Jak zrobić to...

Zarejestruj się
W jaki sposób dokonać rozbioru gramatycznego i syntaktycznego krótkiego wpisu na Twitterze? Pięć lat temu takie pytanie wydałoby się niedorzeczne - dziś jest zasadne. To właśnie pytanie intryguje Amita Singhala kierującego pracami Google nad włączeniem w wyniki wyszukiwania w czasie rzeczywistym - przy zachowaniu i rozwinięciu mechanizmów pozycjonowania - zawartości serwisów społecznościowych, a w szczególności wpisów aktualizujących status użytkownika.

Czytaj też:
Każdego roku redaktorzy magazynu MIT Technology Review wybierają 10 niedawno powstałych i szybko rozwijających się technologii, które uznają za przyszłościowe. Oto kilka z opisywanych w tym roku przez nich tematów:

Najtrudniejszym aspektem przeszukiwania wpisów jest analiza ich treści i znaczeń oraz oszacowania ich ważności. Jakość wyników społecznego wyszukiwania powinna być tak samo wysoka, jak jakość wyszukiwania tradycyjnego, bo tego oczekują internauci, ale w przypadku sieci społecznościowych nie działają tradycyjne techniki szacowania ważności strony poprzez m.in. zliczanie prowadzących do niej linków.

Informacje publikowane w sieciach społecznościowych mogą tracić ważność w ciągu kilku godzin, czy minut i Google ma niewiele czasu na ich analizę i ocenę. Do szacowania ważności poszczególnych wpisów używa się m.in. tak narzucających się miar autorytetu użytkowników Twittera, jak liczba śledzących je osób, czy liczba ich wpisów, które są powielane przez innych.

Miarą wartości użytkowników Facebooka zaś jest m.in. liczba znajomych oraz ich znajomych, ale kolejne brane pod uwagę czynniki są już znacznie bardziej subtelne. To, czego szuka Google, to nieoczekiwane odstępstwa od językowego wzorca. Nagłe, nieoczekiwane pojawienie się w strumieniu wiadomości pewnego słowa - np. tornado - może sygnalizować ważne wydarzenie i ze względu na tę informację wpis może zasługiwać na wypromowanie. Pojawienie się we wpisie na często podejmowany temat nietypowej frazy może sygnalizować nową informację lub świeże spojrzenie autora na zagadnienie.

Językowe nieciągłości to nie wszystko. Ważność wpisu może determinować powiązana z nim informacja geograficzna uzyskiwana za pomocą oprogramowania zainstalowanego na smartfonach lub aplikacji, takich jak FourSquare. Informacja o położeniu osoby nadającej strumień wiadomości może mieć ogromne znaczenie; relacja z epicentrum trzęsienia ziemi jest prawdopodobnie znacznie bardziej wartościowa niż informacja nadawana przez kogoś znajdującego się na drugiej półkuli.

Więcej na ten temat
W jaki sposób można analizować nasze dane

Z dr Jerzym Surmą z Kolegium Nauk o Przedsiębiorstwie SGH, kierownikiem Studium Podyplomowego BI rozmawiamy o roli Business Intelligence w czasach powszechnego wykorzystania Internetu.

Kradzież tożsamości w Facebooku - 1,5 mln kont do sprzedania

Internetowy przestępca przedstawiający się jako Killros ma do sprzedania 1,5 mln skradzionych kont użytkowników serwisu społecznościowego Facebook. Ceny zaczynają się od 25 USD za 1000 kompletów login + hasło.

Raport z cyberprzestępczego podziemia

Cyberprzestępcy radzą sobie coraz lepiej z kradzieżą pieniędzy i informacji o transakcjach elektronicznych oraz z organizowaniem nielegalnego przepływu gotówki. Tworzą niewidoczne, bardzo dobrze zorganizowane podziemne struktury. Jak one działają?

Dołącz do dyskusji
Bądź pierwszy i zostaw komentarz.