Polska metodologia robi furorę
- .. » Internet » Informacje o Sieci » Statystyki Internetu
- .. » Internet » Informacje o Sieci » Wydarzenia online
- rozwiń
- .. » Biznes » Prawo » Prawo pracy
- .. » Internet » Informacje o Sieci » Badania Internetu
- .. » Biznes » Prawo » Prawo autorskie
- zwiń
TAGI:
metodologia
Magdalena Górak | 2005-08-29 16:30:32
W ostatnich dniach światowe serwisy informacyjne obiegła informacja o nowej metodologii pozwalającej na identyfikację użytkowników internetu. Propozycja radzi sobie ze zmiennym IP czy kasowaniem cookie. Renomowany serwis iMedia Connection umieścił entuzjastyczny artykuł, informując o rewolucyjnym paradygmacie badań. Za propozycją stoi dwoje polskich badaczy: Magdalena Urbańska i Tomasz Urbański.
Problem, który od lat spędzał sen z powiek wydawcom internetowym to szacowanie użytkowników. Łatwo policzyć odsłony i czas na serwisie, ale już policzyć użytkowników, czyli konkretne osoby, które tych odsłon dokonują i swój czas spędzają, nie było banalnym zadaniem.
Polacy w dobrym towarzystwie
Brandt Dainow, dyrektor generalny Think Metrics, twórca systemu raportowania o nazwie InSite Web, we wprowadzeniu do artykułu o propozycji polskich naukowców używa takich wyrażeń jak 'przełom', 'zmiana paradygmatu' i przywołuje takie nazwiska jak Darwin, Einstein czy Galileusz. A niedługo potem swojsko brzmiące: Magdalena Urbańska oraz Tomasz Urbański.
Rewolucja szacowania
Wiadomo, że IP nie mówi wszystkiego o użytkownikach. Ich IP może być dynamiczne, a nawet gdy jest przydzielone na stałe, mówi więcej o dostawcy internetu czy komputerach, przy których siedzą jego abonenci niż o samych użytkownikach.
Próbowano szacować liczbę użytkowników na bazie cookie, czyli pliku danych, który każda witryna może zapisać na komputerze odwiedzającego ją użytkownika. Niedawno opisywaliśmy problemy, jakie mają marketingowcy utożsamiając cookie z użytkownikiem. Zachodnim mediom oczy na zagadnienie otworzyły wyniki badań JupiterResearch. Problemy są liczne - ludzie korzystają często z kilku przeglądarek, czyli dla każdej z nich jest przyznawane odrębne cookie, niektórzy kasują cookie i w efekcie ten sam użytkownik ma przyznawane coraz to nowe cookie. Jest jeszcze problem współdzielenia komputera przez różne osoby. Plus wszelkie możliwe kombinacje tych trzech powyższych problemów.
Polska wyciąga pomocną dłoń
Jak się dowiedzieliśmy, Tomasz Urbański wraz z siostra Magdaleną to ex-pracownicy firmy badawczej Gemius S.A. Nietrudno dostrzec pewne podobieństwa ich metodologicznej propozycji do narzędzi wykorzystywanych przez tę firmę chociażby w badaniu Megapanel, którego opis metodologii mogą Państwo znaleźć w tekście "Metodologia badania Megapanel PBI/Gemius w pytaniach i odpowiedziach". Przedstawiciele Gemiusa odmówili komentarza. Kiedy rozpoczął się szum wokół problemu kasowania "ciasteczek" rodzeństwo Urbańskich zgłosiło się do Brandta Dainowa.
Ich podejście pozwalające jak najdokładniej ustalić tożsamość użytkownika opiera się na kilku założeniach i obserwacjach mniej lub bardziej oczywistych, jednak zgrabnie powiązanych: jeśli to samo cookie jest obecne w czasie wielu wizyt mamy do czynienia z tym samym użytkownikiem; w tym samym czasie jedna osoba nie może mieć takich samych cookie; jeśli to samo cookie pojawia się w różnych momentach należy się przyjrzeć adresowi IP; to samo IP może mieć kilka osób; część cookie ze wspólnym IP ale o odległych lokalizacjach geograficznych należy odróżnić jako odrębne osoby; pomóc może też User Agent/klient użytkownika, (aplikacja kliencka HTTP oraz nagłówek przezeń wysyłany podczas komunikacji z serwerem WWW) w kombinacji z IP.
Odnośnik do całość opisu metodologii można odnaleźć w artykule "Web Analytics Breakthrough!". Generalnie metoda oparta jest na serii testów i w tym tkwi jej nowatorstwo. Dotychczas przy próbach identyfikacji użytkowników badacze próbowali się opierać na pojedynczych metodach pomiaru czy szacowania. Obecna metodologia jest długim ciągiem procedur, które pozwalają nie tyle wyliczyć, co bardzo dokładnie oszacować liczbę rzeczywistych użytkowników.
Magdalena Urbańska wraz z Tomaszem Urbańskim zostali zaproszeni do wspólnych badań nad nowym programem przez dyrektora generalnego Think Metrics Brandta Dainowa. Niestety jak dotąd nie udało się nam z nimi skontaktować.
Polacy w dobrym towarzystwie
Brandt Dainow, dyrektor generalny Think Metrics, twórca systemu raportowania o nazwie InSite Web, we wprowadzeniu do artykułu o propozycji polskich naukowców używa takich wyrażeń jak 'przełom', 'zmiana paradygmatu' i przywołuje takie nazwiska jak Darwin, Einstein czy Galileusz. A niedługo potem swojsko brzmiące: Magdalena Urbańska oraz Tomasz Urbański.
Rewolucja szacowania
Wiadomo, że IP nie mówi wszystkiego o użytkownikach. Ich IP może być dynamiczne, a nawet gdy jest przydzielone na stałe, mówi więcej o dostawcy internetu czy komputerach, przy których siedzą jego abonenci niż o samych użytkownikach.
Próbowano szacować liczbę użytkowników na bazie cookie, czyli pliku danych, który każda witryna może zapisać na komputerze odwiedzającego ją użytkownika. Niedawno opisywaliśmy problemy, jakie mają marketingowcy utożsamiając cookie z użytkownikiem. Zachodnim mediom oczy na zagadnienie otworzyły wyniki badań JupiterResearch. Problemy są liczne - ludzie korzystają często z kilku przeglądarek, czyli dla każdej z nich jest przyznawane odrębne cookie, niektórzy kasują cookie i w efekcie ten sam użytkownik ma przyznawane coraz to nowe cookie. Jest jeszcze problem współdzielenia komputera przez różne osoby. Plus wszelkie możliwe kombinacje tych trzech powyższych problemów.
Polska wyciąga pomocną dłoń
Jak się dowiedzieliśmy, Tomasz Urbański wraz z siostra Magdaleną to ex-pracownicy firmy badawczej Gemius S.A. Nietrudno dostrzec pewne podobieństwa ich metodologicznej propozycji do narzędzi wykorzystywanych przez tę firmę chociażby w badaniu Megapanel, którego opis metodologii mogą Państwo znaleźć w tekście "Metodologia badania Megapanel PBI/Gemius w pytaniach i odpowiedziach". Przedstawiciele Gemiusa odmówili komentarza. Kiedy rozpoczął się szum wokół problemu kasowania "ciasteczek" rodzeństwo Urbańskich zgłosiło się do Brandta Dainowa.
Ich podejście pozwalające jak najdokładniej ustalić tożsamość użytkownika opiera się na kilku założeniach i obserwacjach mniej lub bardziej oczywistych, jednak zgrabnie powiązanych: jeśli to samo cookie jest obecne w czasie wielu wizyt mamy do czynienia z tym samym użytkownikiem; w tym samym czasie jedna osoba nie może mieć takich samych cookie; jeśli to samo cookie pojawia się w różnych momentach należy się przyjrzeć adresowi IP; to samo IP może mieć kilka osób; część cookie ze wspólnym IP ale o odległych lokalizacjach geograficznych należy odróżnić jako odrębne osoby; pomóc może też User Agent/klient użytkownika, (aplikacja kliencka HTTP oraz nagłówek przezeń wysyłany podczas komunikacji z serwerem WWW) w kombinacji z IP.
Odnośnik do całość opisu metodologii można odnaleźć w artykule "Web Analytics Breakthrough!". Generalnie metoda oparta jest na serii testów i w tym tkwi jej nowatorstwo. Dotychczas przy próbach identyfikacji użytkowników badacze próbowali się opierać na pojedynczych metodach pomiaru czy szacowania. Obecna metodologia jest długim ciągiem procedur, które pozwalają nie tyle wyliczyć, co bardzo dokładnie oszacować liczbę rzeczywistych użytkowników.
Magdalena Urbańska wraz z Tomaszem Urbańskim zostali zaproszeni do wspólnych badań nad nowym programem przez dyrektora generalnego Think Metrics Brandta Dainowa. Niestety jak dotąd nie udało się nam z nimi skontaktować.
Ocena:
Twoja ocena:
Komentarze (8)
te odkrywcze etody są wykorzystywane od kilku lat roznych softach do statystyk np http://www.actualscripts.com/products/analyzer/
"ich podejście pozwalające jak najdokładniej ustalić tożsamość użytkownika... "
bzudra najwyzej co mogą ustalić to powiązanie przeglądarki z adresem IP(o ile IP nie jest zmienne).
Już dawno istnieją "uczące" się algorytmy do trackingu userów, które szczacują parwdopodbieństwo że to ten sam użytkownik pomimo tego, że "środowisko", w którym on się porusza uległo gwałtownej zmianie np poprzez usunięcie cookie.
Zachowanie internauty ma to do siebie, że jest schematyczne - często wraca na te same strony, co więcej często wykonuje na nich te same czynności w tej samej kolejności. No wchodzisz na onet, przeglądasz newsy z swiata, potem wiadomości sportowe...
To tylko porsty przykład, natomiast powinien uzmysłowić schematyczność poruszania się po necie - sprawdźcie sami na sobie czy surfujecie schematycznie...
Algorytmy trackingowe, które potrafią śledzić użytkownika w czasie i uczyć się jego zachowań potrafią z dużym prawdopodobieństwem określić że to ten a nie inny użytkownik, ja zakładam że może ono sięgnąc ponad 75% (wszytsko przy odpowiednich założeniach, np użytkownik jest dosyć aktywny, no ale to chyba normalne dla tego rodzaju badań, bo po co interesować się kimś kto korzysta z internetu raz na pół roku).
Ciekawe jest stwierdzenie "przełom". Nie zgadzam się z tym. Ponieważ:
1. Moim zdaniem miara odkrycia jest mniej więcej na tym poziomie , co stwierdzenie 5-latka że w lodówce można zainstalowac jeszcze 4 dodatkowe światełka.
2. "odkrycie" bazuje na znanych od dawna faktach. Identyfikowac można bowiem także po AGENT_LANGUAGE, HTTP_USER_AGENT, COOKIES, IP
Powyzsze "odkrycie" nic nie da w chwili gdy uzytkownicy zaczna dbac o swoja prywatnosc i laczyc sie przez specjalne serwery, gdy http_user agent zostanie wyzerowany itd.
Polskim naukowcom polecilbym zajac sie problemami
"co sie stanie gdy uzytkownicy zaczna nagminnie uzywac oprogramowania blokujacego reklamy?"
"badanie wiarygodnosci ilosci kont pocztowych na o2" (dla niewtajemniczonych - kazy moze jest zakladac tysiacami uzywajac automatów)
"wplyw nowych form reklamy na motywacje uzytkownika do instalacji adblockerów"
"czy skutecznosc reklamy na layerze nie bierze sie z trudnosci w jej zamknieciu"
"perspektywa zalamania sie rynku reklamy internetowej po wyjasnieniu reklamodawcom w jakim celu tworzone sa miliony stron-smietnikow"
:-)
Może się czepiam, ale używane jest niewłaściwe słowo (po raz n-ty).
METODOLOGIA - znawstwo hist., analityczne, krytyczne i normatywne metod badań nauk., budowy systemów nauk., wyrażania i utrwalania osiągnięć nauki. W uproszczeniu - nauka o metodach.
Chodziło raczej o:
METODYKA - zbiór zasad, sposobów wykonywania określonej pracy a. osiągnięcia określonego celu; szczegółowe normy postępowania właściwe danej nauce; (m. nauczania) dydaktyka szczegółowa.
Artykuł ku pokrzepieniu serc.
Dwoje polaków miało jakąś fantazję, zaczepili gościa któremu się spodobało, napisał o tym artykuł (w którym wspomina że żadna firma się tym jakoś nie ma ochoty zainteresować i nawet nie bardzo mają jak zebrać dane w celu solidnego przetestowania metody).
Faktycznie furora.
"jeśli to samo cookie jest obecne w czasie wielu wizyt mamy do czynienia z tym samym użytkownikiem" czyli jesli wspolnie z zona korzystam z jednego komputera - to jestesmy jedno. Dosc biblijne zalozenie :)) A co z kawiarenkami, gdzie na jednym profilu/przegladarce (a wiec i cookie) chodzi dowolna liczba uzytkownikow?
"w tym samym czasie jedna osoba nie może mieć takich samych cookie" Chyba "roznych". A jak taki nieszczesny grafik oglada swiezo zrobiona strone pod dwiema przegladarkami w tym samym czasie, zeby sie upewnic, czy strona dobrze wyglada pod MSIE, Firefoxem i Opera?
Ta "metodologia" opiera sie na mniej lub bardziej oczywistych heurystykach i jak kazda inna nie jest w stanie rozpoznac, czy uzytkownik z tym samym cookie, z tego samego ip, tej samej przegladarki itp. to ta sama osoba, czy nie (czy to ja, czy moja mama?), a zatem nie ma tu zadnego przelomu. W jednym kraju z tej samej przegladarki/komputera moze korzystac srednio 10 osob dziennie, a w innym 1.
Co jednak najwazniejsze, ta metoda nie ma szansy na powodzenie z jednego banalnego powodu: nie jest prosta do wytlumaczenia. Kto bedzie stosowal metode, jesli zapytany, jak liczy uzytkownikow, musialby 10 min tlumaczyc, a i tak malo kto by te heurystyki zrozumial?
W samym artykule "Web Analytics Breakthrough" jest nawet wzmianka, ze domy mediowe, firmy badawcze, ani wyszukiwarki nie byly nia zainteresowane.
Reasumujac: nie ma sie czym podniecac ;)
reklama
Polecane
Prezentujemy raport eCommerce 2011
To piąta edycja naszego raportu. Prezentujemy w nim wyniki naszego - przeprowadzanego do trzech lat - badania polskich sklepów internetowych. W tym roku publikujemy także wyniki innego projektu - zebranych przez Sare opinii użytkowników poczty...
To piąta edycja naszego raportu. Prezentujemy w nim wyniki naszego - przeprowadzanego do trzech lat - badania polskich sklepów internetowych. W tym roku publikujemy także wyniki innego projektu - zebranych przez Sare opinii użytkowników poczty...
© Copyright 2012 International Data Group Poland S.A.
04-204 Warszawa ul. Jordanowska 12
tel.(+4822)321-78-00 fax(+4822)321-78-88
04-204 Warszawa ul. Jordanowska 12
tel.(+4822)321-78-00 fax(+4822)321-78-88