frame top

Zrozumieć istotę kuli, czyli o badaniach i internecie

Internetowa kula śnieżna toczy się coraz szybciej. Google wprowadza nowe produkty częściej niż kiedykolwiek, Facebook rośnie w siłę (65 700 000 odsłon w lutym 2009), a niepozorny na pierwszy rzut oka Twitter zanotował wzrost ruchu o 1380% w porównaniu do poprzedniego roku (Badania Nielsen Online). Pełnoletni już w Polsce internet – pierwszy e-mail na Wydziale Fizyki UW wysłany został w sierpniu 1991 r. - objął swym zasięgiem ponad połowę Polaków. Tym bardziej paradoksalne jest więc to, że mimo zaawansowanej technologii wynikającej z natury medium, mimo dużych badań i licznych statystyk, wciąż niewiele wiemy jaki charakter ma ów „zasięg” oraz, co może najistotniejsze, jaka jest ta „połowa Polaków” i co różni ją od tej drugiej, nie objętej magicznym zasięgiem.

Paradoks ten jest jeszcze bardziej wyraźny, kiedy zajrzymy tam, gdzie odpowiedzi na wymienione pytania można by się spodziewać w pierwszej kolejności - w miejsca, gdzie badania łączą się z internetem. Wydawałoby się bowiem, że internet, umożliwiający (wbrew odchodzącemu w niepamięć przekonaniu o anonimowości w sieci) zbieranie danych na temat odwiedzanych stron, liczby i czasu wejść na dane witryny, śledzenie kliknięć, powracających użytkowników czy zawartości koszyków w sklepach internetowych, jest świetnym nowym polem badań dla badaczy. Z drugiej strony wszystkie cechy internetub- powszechność, niski koszt dotarcia, czy np. możliwości wprowadzania szybkich zmian w treści - sprawiają, że sieć jest świetnym miejscem prowadzenia szybkich, niedrogich i precyzyjnych badań marketingowych np. za pomocą ankiet.

Niestety, sądząc po wnioskach z konferencji Internet w Badaniach (Wrocław, 6 marca 2009 r.) oraz spotkania Klubu Badacza PTBRiO (Warszawa, 18 marca 2009 r.), oba te sposoby patrzenia na internet - jako na źródło ogromnej ilości danych oraz jako na świetne pole do egzekucji niedrogich, a obszernych badań - to coraz bardziej ślepe badawcze uliczki, częściej wąskie i bardziej wyboiste niż na początku sądzono. Okazuje się bowiem, że kłopot zaczyna się już w momencie interpretowania zebranych informacji.

Dane zbierane cyfrowo pochodzą z tzw. cookies – „ciasteczek” zostawianych nam na dysku przez np. odwiedzane witryny. „Ciasteczka” są jak ślady mówiące o tym gdzie byliśmy i czy jesteśmy nowi, czy nie. Kiedy wchodzimy ponownie na tę samą stronę, która wcześniej poczęstowała nas swoim „ciasteczkiem”, wizyta jest odnotowywana, ale nie jesteśmy „liczeni” jako unikalny użytkownik. Strona pamięta bowiem naszą wizytę z tego samego dnia i np. nie serwuje nam reklamy, którą już widzieliśmy. Jednakże cookies są kłopotliwe w badaniach - z jednego komputera korzysta czasem kilka osób w rodzinie. Załóżmy, że każda z tych osób odwiedza ten sam portal - wtedy mamy do czynienia z niedoszacowaniem unikalnych użytkowników: jest ich kilku, a liczeni są jako jeden. Z drugiej strony, coraz więcej osób korzysta z internetu w kilku różnych miejscach, na kilku urządzeniach. Jeśli odwiedzasz tę samą stronę na swoim laptopie pijąc poranną kawę, następnie podczas przerwy na komputerze w pracy, a potem przez telefon łącząc się przez GPRS czy WiFi, to możesz być liczony jako unikalny użytkownik co najmniej trzykrotnie. A to może oznaczać spore przeszacowanie. W świecie twardych danych ilościowych badań i tam gdzie ich wyniki są implementowane, choćby przy zakupie mediów, zapewnienie, że owe przeszacowania i niedoszacowania nawzajem się znoszą nie brzmi zbyt wiarygodnie. Dodatkowo, część użytkowników ma zwyczaj usuwania cookies. Choć niektóre witryny w badaniu Megapanel udostępniają audyt site-centric, co pozwala na wyliczenie korekty uwzględniającej algorytm eliminujący efekt kasowalności „ciasteczek”, to jednak dane, które aspirują do bycia bardzo dokładnymi informacjami tracą część ze swej precyzji już na etapie metodologii ich zbierania.

Nie oznacza to oczywiście, że statystyki pochodzące z Megapanelu PBI/Gemius są mało wiarygodne czy nieprawdziwe, zwłaszcza że badacze są świadomi wszystkich metodologicznych trudności i starają się je statystycznie eliminować. Natomiast fakt, że „cyfrowe” dane pochodzące z panelu badawczego (o badaniach panelowych czytaj dalej) i tak muszą być ręcznie doważane do danych pochodzących z analogowego badania NetTrack MillwardBrown SMG/KRC, by odzwierciedlić w panelu strukturę polskich internautów i móc jako tako estymować dane na populację pokazuje, że silnie obstawiana przez badaczy precyzja po drodze ucieka. Ucieczki te obserwują właściciele dużych witryn, jak Onet.pl, Wp.pl czy Interia.pl, kiedy porównują swoje dane site-centric (także obarczone częścią w/w błędów) do danych Megapanelu PBI/Gemius.

Problem estymowania danych na populację dotyczy zwłaszcza drugiego sposobu patrzenia na internet - jako na świetne pole do przeprowadzania stosunkowo niskim kosztem obszernych badań marketingowych. Badania takie najczęściej również mają charakter panelowy - oznacza to, że firmy badawcze mają pewną ilość rekrutowanych wcześniej respondentów, którzy zgadzają się ujawnić swoje dane demograficzne i odpłatnie brać udział w badaniach on-line. W zależności od tematu i treści badania, spośród respondentów dobiera się próbę uwzględniając kryteria demograficzne. Część firm lubi mówić o takich próbach jako o reprezentatywnych, co zawsze budzi wątpliwość. Dla kogo bowiem mogą być one reprezentatywne: czy dla populacji, tak by dane z badania można było uogólniać na dorosłych Polaków? A może chociaż dla populacji polskich internautów? Wydaje się jednak, że nawet biorąc pod uwagę liczbę panelistów w tego typu badaniach i prawo wielkich liczb, grupa ta może być silnie skrzywiona ze względu na swoje motywacje wzięcia udziału w panelu. Zarówno motywacja finansowej gratyfikacji, jak i motywacja możliwości wpływu na kształt produktu, reklamy czy marki może być zmienną zakłócającą i powodować, że wśród osób biorących udział w panelu mamy nadreprezentację „etatowych klikaczy” oraz „fanatyków brandingu”. Statystyka radzi sobie z outsiderami, jeśli ich wyniki odstają od próby, ale skrzywienie całej próby może wpływać na wyniki, a tym bardziej na możliwość przekładania ich na populację wykraczającą poza próbę.

Oba opisane wyżej podejścia do badania internetu czy badań w internecie mają nadal swoje zastosowania, choć są one mniej nośne i węższe niż sądzono. Badacze pracujący w obu tych podejściach, natrafiając na przeszkody metodologiczne, w istocie osiadają jednak na rafach wspólnego dla tych dwóch podejść paradygmatu. Usiłują pochwycić i uczynić przejrzystymi niezliczone ilości informacji, by móc wskazać na ich podstawie swym klientom kierunki działań marketingowych w świecie realnym i wirtualnym. Używają jednak do tego narzędzi coraz mniej adekwatnych, będących prostym przełożeniem znanych papierowych ankiet, wywiadów grupowych czy testów. W tym paradygmacie przyjęte jest założenie, że działania internautów, ich zachowania w sieci, wybory, jakich dokonują są przekładalne na działania w off-line’owej społecznej rzeczywistości. Założenie to mówi, że jako konsument chcący kupić telewizor mogę poradzić się przyjaciela czy sąsiada, wyrobić sobie opinię na temat marek, pójść do sklepu, porozmawiać ze sprzedawcą, porównać ceny i (będąc „tak naprawdę” pod wpływem reklamy ATL czy POS) dokonać zakupu. Analogicznie, jako konsument internetowy mogę zasięgnąć opinii w odpowiednim serwisie konsumenckim, porównać specyfikacje i ceny w porównywarce, poszperać po forach i dokonać tańszego zakupu (będąc „tak naprawdę” zwiedzionym bannerem czy AdWordsem).

Analogia zakupowa zabija jednak to, co w internecie zdaje się być najważniejsze. Sieć to dziś nierównoległy w stosunku do „realu” liniowy świat, gdzie można stosować proste analogie. Internet jest alternatywną rzeczywistością, mającą niezliczoną liczbę punktów przecięcia z nie-internetem. Dzięki tej rzeczywistości, jako konsumenci, czy coraz częściej członkowie różnych społeczności, uczestniczymy w różnorakich wydarzeniach, doświadczamy całej gamy nowych doznań i wrażeń, jesteśmy świadkami niespotykanych dotąd zjawisk. Komunikujemy się, tworzymy nowe relacje lub zmieniamy formę już istniejących. Internet jest więc dla badaczy źródłem nowych wglądów, nieznanych dotąd informacji o naszych zachowaniach i opiniach. Do tej dynamicznej, nowej i wyjątkowo zasobnej w dane rzeczywistości tradycyjne ankiety, podczas których internauta siedzi i klika, po prostu nie pasują. Jest to dla internetu nienaturalne. Z kolei metodologia, w której mowa o reprezentatywności względem populacji czy średniej miesięcznej liczbie odsłon mierzonej w milionach, zdaje się nie doceniać społeczności badanego medium, rozdrobnienia grup docelowych, do jakich można docierać za pośrednictwem sieci, czy bardzo specyficznych dla tych grup zachowań.

Przejawami zmiany paradygmatu badawczego związanego z internetem są próby przejścia od badań w internecie, czy badań Internetu, do badań internautów i badań sieci internetowych jakie internauci tworzą. Takie sieci to plątanina połączeń przypominająca połączenia między neuronami. Daje to bogactwo informacji: i tych bezcennych, i tych pozbawionych sensu. Badania społeczności internetowych, których prekursorem w Polsce jest dr Jan Zając, pomagają zrozumieć to bogactwo, dając możliwość wykorzystania naturalnych liderów opinii (to ci z dużą liczbą realnych znajomych na Facebooku;-), pozwalając uniknąć błędów wynikających z deklaracyjnego charakteru danych czy umożliwiając badania całych internetowych populacji. Badania społeczności internetowych mogą pomagać w badaniach decyzji zakupowych czy rozprzestrzeniania się trendów i innowacji. Co ważne, prowadzone są one we w pełni zgodnym z naturą internetu paradygmacie, wykorzystując kontekst społeczny zachowań jednostki w sieci. Z kolei badania przeprowadzone przez SWPS i Gazeta.pl w ramach projektu „Diagnoza internetu” pokazują jak, bez aspirowania do reprezentatywności dla całej Polski, można badać złożone i specyficzne zachowania internautów w ich naturalnym środowisku, nie zaprzeczając jednocześnie jego istocie.

Rozwój podobnych projektów badawczych zdaje się być bardzo perspektywicznym kierunkiem dla badań internetu. Powinni zainteresować się nim przede wszystkim duże firmy badawcze, ale także klienci firm badawczych, a nawet klienci agencji reklamowych. Zrozumienie natury internetu, nauczenie się jak wykorzystywać bezcenne informacje zawarte w sieciach społecznościowych, forach czy blogach, poznanie złożoności zachowań konsumentów w sieci z pewnością będzie się bardzo opłacać. By wykorzystać energię toczącej się kuli śnieżnej jaką jest internet, niepotrzebna jest dokładna znajomość jej masy czy średnicy. Nie można także dać się uśpić kuszącej myśli, by pęd i tor ruchu tej kuli kontrolować. Kulę warto, używając odpowiednich metod, próbować zrozumieć w jej dynamicznej istocie.

Bartosz Szymczyk (Search Planner)

frame bottom