Metodologia badania Megapanel PBI/Gemius w pytaniach i odpowiedziach

BADANIE TYPU SITE-CENTRIC, CZYLI AUDYT SITE-CENTRIC

Na czym polega audyt site-centric?

Jest to pomiar ruchu generowanego na badanych witrynach internetowych, który pozwala określić między innymi: ile osób łączy się w danej chwili z serwerem danej witryny internetowej, ile odsłon poszczególnych stron badanej witryny wykonano w danym okresie (np. miesiącu), jak długo trwały te odsłony itp. Informacje uzyskiwane są dzięki zastosowaniu do audytu site-centric badania gemiusTraffic, bazującego na technologii cookie.

Co to jest cookie?

W uproszczeniu cookie to tekstowy plik danych, który każda witryna może zapisać na komputerze odwiedzającego ją użytkownika. Pliki te, kodujące informacje pod postacią szeregu cyfr, są pasywne i niegroźne dla komputera. Dzięki cookie możliwe jest identyfikowanie internautów (a dokładniej - ich przeglądarek). W szczególności na podstawie cookie można powiedzieć np.: czy użytkownik był już na danej stronie lub kiedy ostatnio na nią wszedł.

Pliki cookie są powszechnie stosowane w internecie. Jako przykład ich użycia można podać sytuację, gdy na niektórych serwisach internetowych mamy możliwość dokonania personalizacji strony (np. wyboru preferowanego przez internautę layoutu lub języka). Dzięki zapamiętaniu takich informacji w cookie, przy następnej wizycie użytkownik domyślnie otrzymuje stronę z oczekiwanymi ustawieniami i nie ma potrzeby ponownego ich podawania. Szacuje się, że około 98% internautów nie blokuje możliwości nadawania plików cookie.

Czy ilość cookie jest taka sama, jak liczba osób, które wchodzą na daną stronę?

Liczba osób odwiedzających daną stronę internetową na ogół nie jest tożsama z liczbą cookies. Przykładowo, na polskich witrynach, korzystających z badania gemiusTraffic, rejestrowanych jest co miesiąc aż 20 mln różnych cookies, podczas gdy wszystkich internautów w Polsce jest dużo mniej. A zatem łączna liczba cookies przewyższa znacznie łączną liczbę internautów.

Posługując się liczbą cookies jako przybliżeniem wielkości widowni danej witryny należy pamiętać o następujących źródłach rozbieżności: kasowanie cookie, korzystanie przez jednego internautę z kilku przeglądarek (komputerów) oraz współkorzystanie z tego samego komputera przez kilka osób. W pierwszym przypadku przy każdej wizycie na witrynie, złożonej po skasowaniu cookie, internauta jest traktowany jako nowy użytkownik (nowe cookie). A zatem, jeśli na przykład codziennie kasuje cookies i codziennie wchodzi na daną witrynę, to miesięcznie podwyższa jej statystyki o 30 użytkowników (cookies). Analogiczny efekt wywołuje korzystanie przez internautę z kilku przeglądarek (komputerów), ponieważ cookie nadawane jest dla każdej przeglądarki oddzielnie.

Natomiast w przypadku, gdy z jednego komputera korzysta więcej niż jedna osoba, a żaden z jego użytkowników nie kasuje plików cookie, ani nie ustawia własnego profilu (taką opcję udostępnia np. system operacyjny Windows XP), to każdy z tych użytkowników jest traktowany jako to samo cookie. W takiej sytuacji liczba cookies może być mniejsza niż liczba faktycznych użytkowników witryny.

Jak można skasować cookie?

Niektóre programy kasują cookie automatycznie, można je też kasować ręcznie, wybierając odpowiednie opcje w ustawieniach przeglądarki.

Jak Gemius szacuje liczbę faktycznych użytkowników witryny?

Precyzyjnie można policzyć jedynie cookies czy odsłony, natomiast rzeczywista liczba użytkowników witryny jest wartością estymowaną. Wskaźnik "liczba użytkowników (real users)", odzwierciedlający rzeczywistą liczbę internautów korzystających z danej witryny, konstruowany jest na podstawie danych dotyczących liczby cookies, całej populacji internautów oraz współoglądalności witryn.

Estymacja liczby użytkowników (real users) opiera się na algorytmie, uwzględniającym po pierwsze fakt, że łączna liczba cookies na danej witrynie jest zaburzona o umyślne lub nieumyślne ich kasowanie. Przede wszystkim należało więc oszacować, ile byłoby cookies, gdyby nikt ich nie kasował. W tym celu Gemius przeanalizował zachowania osób, które kasują cookies oraz tych, które ich nie kasują. Obserwacji podlegały w tej analizie cookies zarejestrowane w miesiącu będącym okresem badania. Dzięki sprawdzeniu, czy dane cookie pojawiło się w miesiącu poprzedzającym i następującym po miesiącu, dla którego wyniki są przygotowywane (właśnie stąd wynika miesięczne opóźnienie w publikowaniu wyników badania), możliwe jest określenie, które z tych cookies nie zostały w danym miesiącu skasowane. Tym sposobem Gemius otrzymuje dwa zbiory cookies: zbiór takich cookies, które nie zostały skasowane przynajmniej w okresie danego miesiąca oraz zbiór wszystkich cookies. Gemius zaobserwował, że statycznie wskaźniki określające wielkość ruchu generowanego przez użytkowników (cookie) z pierwszego zbioru, są proporcjonalnie takie same, jak wskaźniki określające wielkość ruchu przez użytkowników (cookie) z drugiego zbioru. Stosując odpowiednie proporcje uzyskuje się tym samym taką liczbę cookies która odpowiadałaby rzeczywistej liczbie cookies, gdyby użytkownicy internetu nie kasowali cookies. Następnie, wykorzystując dane o liczbie wszystkich polskich internautów (z badania zewnętrznego SMG/KRC), Gemius estymuje ile cookies odpowiada jednemu internaucie i ostatecznie podaje wyniki estymacji liczby użytkowników (real users) dla każdej witryny internetowej.

Skąd się bierze liczba użytkowników (real users) dla witryn, które nie są audytowane site-centric?

W przypadku witryn nieobjętych audytem site-centric za liczbę użytkowników (real users) przyjmuje się tę wartość, która wynika bezpośrednio z badań panelowych. Tak jest np. w przypadku Google czy Yahoo!.