Polska metodologia robi furorę

W ostatnich dniach światowe serwisy informacyjne obiegła informacja o nowej metodologii pozwalającej na identyfikację użytkowników internetu. Propozycja radzi sobie ze zmiennym IP czy kasowaniem cookie. Renomowany serwis iMedia Connection umieścił entuzjastyczny artykuł, informując o rewolucyjnym paradygmacie badań. Za propozycją stoi dwoje polskich badaczy: Magdalena Urbańska i Tomasz Urbański.

Problem, który od lat spędzał sen z powiek wydawcom internetowym to szacowanie użytkowników. Łatwo policzyć odsłony i czas na serwisie, ale już policzyć użytkowników, czyli konkretne osoby, które tych odsłon dokonują i swój czas spędzają, nie było banalnym zadaniem.

Polacy w dobrym towarzystwie

Brandt Dainow, dyrektor generalny Think Metrics, twórca systemu raportowania o nazwie InSite Web, we wprowadzeniu do artykułu o propozycji polskich naukowców używa takich wyrażeń jak 'przełom', 'zmiana paradygmatu' i przywołuje takie nazwiska jak Darwin, Einstein czy Galileusz. A niedługo potem swojsko brzmiące: Magdalena Urbańska oraz Tomasz Urbański.

Rewolucja szacowania

Wiadomo, że IP nie mówi wszystkiego o użytkownikach. Ich IP może być dynamiczne, a nawet gdy jest przydzielone na stałe, mówi więcej o dostawcy internetu czy komputerach, przy których siedzą jego abonenci niż o samych użytkownikach.

Próbowano szacować liczbę użytkowników na bazie cookie, czyli pliku danych, który każda witryna może zapisać na komputerze odwiedzającego ją użytkownika. Niedawno opisywaliśmy problemy, jakie mają marketingowcy utożsamiając cookie z użytkownikiem. Zachodnim mediom oczy na zagadnienie otworzyły wyniki badań JupiterResearch. Problemy są liczne - ludzie korzystają często z kilku przeglądarek, czyli dla każdej z nich jest przyznawane odrębne cookie, niektórzy kasują cookie i w efekcie ten sam użytkownik ma przyznawane coraz to nowe cookie. Jest jeszcze problem współdzielenia komputera przez różne osoby. Plus wszelkie możliwe kombinacje tych trzech powyższych problemów.

Polska wyciąga pomocną dłoń

Jak się dowiedzieliśmy, Tomasz Urbański wraz z siostra Magdaleną to ex-pracownicy firmy badawczej Gemius S.A. Nietrudno dostrzec pewne podobieństwa ich metodologicznej propozycji do narzędzi wykorzystywanych przez tę firmę chociażby w badaniu Megapanel, którego opis metodologii mogą Państwo znaleźć w tekście "Metodologia badania Megapanel PBI/Gemius w pytaniach i odpowiedziach". Przedstawiciele Gemiusa odmówili komentarza. Kiedy rozpoczął się szum wokół problemu kasowania "ciasteczek" rodzeństwo Urbańskich zgłosiło się do Brandta Dainowa.

Ich podejście pozwalające jak najdokładniej ustalić tożsamość użytkownika opiera się na kilku założeniach i obserwacjach mniej lub bardziej oczywistych, jednak zgrabnie powiązanych: jeśli to samo cookie jest obecne w czasie wielu wizyt mamy do czynienia z tym samym użytkownikiem; w tym samym czasie jedna osoba nie może mieć takich samych cookie; jeśli to samo cookie pojawia się w różnych momentach należy się przyjrzeć adresowi IP; to samo IP może mieć kilka osób; część cookie ze wspólnym IP ale o odległych lokalizacjach geograficznych należy odróżnić jako odrębne osoby; pomóc może też User Agent/klient użytkownika, (aplikacja kliencka HTTP oraz nagłówek przezeń wysyłany podczas komunikacji z serwerem WWW) w kombinacji z IP.

Odnośnik do całość opisu metodologii można odnaleźć w artykule "Web Analytics Breakthrough!". Generalnie metoda oparta jest na serii testów i w tym tkwi jej nowatorstwo. Dotychczas przy próbach identyfikacji użytkowników badacze próbowali się opierać na pojedynczych metodach pomiaru czy szacowania. Obecna metodologia jest długim ciągiem procedur, które pozwalają nie tyle wyliczyć, co bardzo dokładnie oszacować liczbę rzeczywistych użytkowników.

Magdalena Urbańska wraz z Tomaszem Urbańskim zostali zaproszeni do wspólnych badań nad nowym programem przez dyrektora generalnego Think Metrics Brandta Dainowa. Niestety jak dotąd nie udało się nam z nimi skontaktować.