oszczesciu.files.wordpress.com · web viewpraca ta poświęcona jest analizie zależności...
TRANSCRIPT
Studium magisterskie
Kierunek: Metody ilościowe i systemy informacyjne
Mateusz Sawka 46396
Struktura sieci społecznej a poczucie szczęścia
Praca magisterskanapisana w Instytucie Ekonometriipod kierunkiem naukowym dr hab. Jakuba Growca
Warszawa 2013
2
STRESZCZENIE
Praca ta poświęcona jest analizie zależności między strukturą sieci społecznej
człowieka a jego poczuciem szczęścia. Celem pracy jest określenie, czy pewne cechy sieci
społecznej mogą przyczyniać się do poczucia szczęścia. Badanie oparto na internetowej
ankiecie, w której respondenci pytani byli o swoje charakterystyki społeczno-demograficzne,
kwestie światopoglądowe i zwyczaje, oraz poczucie szczęścia. Dodatkowo, każdy
ankietowany dołączał plik opisujący sieć połączeń między jego znajomymi na portalu
facebook, na bazie którego wyliczone zostały podstawowe statystyki sieci. Na podstawie tych
danych opracowany został uporządkowany model logitowy, opisujący poczucie szczęścia
respondentów. Wyniki badania wskazują na zależność między poczuciem szczęścia a
gęstością sieci. Nie stwierdzono zależności między innymi miarami sieci a zmienną
objaśnianą.
3
SPIS TREŚCI
Wstęp....................................................................................................................9ROZDZIAŁ I. Szczęście oraz struktura sieci społecznej jako przedmiot badań naukowych: przegląd literatury...........................................................11
I.1 Definicje szczęścia..................................................................................11I.2 Sieć społeczna jako reprezentacja rzeczywistości jednostki...................13I.3 Wpływ interakcji z otoczeniem na postrzeganie szczęścia.....................14I.4 Wyniki wybranych badań empirycznych................................................15I.5 Przegląd wybranych badań dotyczących zależności między strukturą
sieci społecznej a poczuciem szczęścia...................................................17ROZDZIAŁ II. Dane....................................................................................19
II.1 Statystyki służące opisowi sieci wykorzystane w badaniu.....................19II.1.1 Rozmiar sieci (degree).....................................................................................20II.1.2 Rozpiętość sieci (diameter)..............................................................................20II.1.3 Liczba podgrup w sieci (number of components).............................................20II.1.4 Gęstość sieci (density)......................................................................................20II.1.5 Przeciętna długość najkrótszej ścieżki między dwoma kontaktami w sieci
(average shortest path)......................................................................................21II.1.6 Średni wskaźnik grupowania (average clustering coefficient)........................21
II.2 Sposób zbierania danych.........................................................................22II.3 Statystyki opisowe danych......................................................................22
II.3.1 Struktura demograficzna próby........................................................................22II.3.2 Statystyki ankiet...............................................................................................23II.3.3 Statystyki sieci..................................................................................................24
II.4 Zmienna objaśniana – poczucie szczęścia..............................................32ROZDZIAŁ III. Wyniki badania empirycznego........................................37
III.1 Uporządkowany model logitowy – opis formalny..................................37III.1.1 Specyfikacja modelu logitowego i uporządkowanego modelu
logitowego.........................................................................................................37III.1.2 Estymacja metodą największej wiarygodności...................................40
III.2 Wyniki estymacji modelu.......................................................................42III.2.1 Wyniki estymacji modelu...................................................................43III.2.2 Ocena jakości modelu.........................................................................44III.2.3 Interpretacja........................................................................................47III.2.4 Porównanie dopasowania i jakości modeli.........................................51
ROZDZIAŁ IV. Interpretacja wyników.....................................................55IV.1 Wpływ uwzględnienia zmiennych opisujących sieć na wyniki estymacji
55
4
IV.2 Wpływ zmiennych opisujących strukturę sieci na poczucie szczęścia...56IV.3 Wnioski...................................................................................................56
Zakończenie.......................................................................................................58Bibliografia........................................................................................................59Spis tabel............................................................................................................61Spis wykresów....................................................................................................62Spis załączników................................................................................................63
5
WSTĘP
Celem niniejszej pracy jest weryfikacja hipotezy mówiącej o istnieniu zależności
między strukturą sieci społecznej człowieka a jego poczuciem szczęścia. W tym miejscu
należy uzgodnić, co rozumiemy pod pojęciami zależności, sieci społecznych i poczucia
szczęścia.
Zależność rozumiemy tu jako związek przyczynowo-skutkowy, sprawdzamy więc
czy struktura sieci wpływać może w pewnym stopniu na poczucie szczęścia jednostki.
Pamiętać oczywiście należy o możliwości odwrotnej zależności – to osoby szczęśliwe mogą
tworzyć dookoła siebie sieć o pewnej strukturze, innej niż osoby nieszczęśliwe. Wychodzimy
jednak z założenia, że to wykorzystane w analizie zmienne są czynnikami wpływającymi na
poczucie szczęście, a nie odwrotnie.
Sieci kontaktów społecznych analizowane w pracy pochodzą z portalu facebook,
reprezentują połączenia między znajomymi każdego respondenta – informują o
znajomościach wśród znajomych ankietowanego. Nie uwzględniają ewentualnych zależności
pomiędzy sieciami poszczególnych respondentów.
Poczucie szczęścia uczestników badania mierzone było według ich subiektywnych
ocen. W ankiecie odpowiadali na pytanie o swoje ogólne poczucie szczęścia mając do wyboru
cztery opcje odpowiedzi: bardzo nieszczęśliwy(a), raczej nieszczęśliwy(a), raczej
szczęśliwy(a), raczej nieszczęśliwy(a). Podstawowa hipoteza pracy mówi o istnieniu zależności między strukturą sieci
kontaktów respondenta, w tym m. in. surową liczbą znajomych, a jego poczuciem szczęścia.
Na kolejnych stronach, wykorzystując ilościowe metody analizy danych, przedstawiono próbę
jej potwierdzenia.
Dane, na których opiera się analiza zgromadzone zostały za pomocą internetowej
ankiety, do której respondent dołączał plik opisujący sieć jego znajomych na portalu
facebook. Na jego podstawie wyliczona została liczba kontaktów i inne statystyki sieci, takie
jak np. gęstość czy rozpiętość. Ankieta zawierała również szereg pytań dotyczących sytuacji
demograficznej i innych cech indywidualnych, które wzorowano na polskiej wersji pytań z
badania World Values Survey.
6
Badanie opiera się na uporządkowanym modelu logitowym. Wybór tego modelu
wynika z charakteru zmiennej objaśnianej, poczucia szczęścia. Jest to zmienna o charakterze
kategorycznym, w ankiecie respondenci mieli do wyboru cztery opcje odpowiedzi na pytanie
o poczucie szczęścia. Między nimi występuje naturalny porządek – wyższe oceny szczęścia są
oczywiście bardziej pożądane.
Wyniki analizy sugerują istnienie zależności między gęstością sieci społecznej
respondenta a jego poczuciem szczęścia. W przypadku pozostałych analizowanych statystyk
sieci nie stwierdzono ich wpływu na poczucie szczęścia. W szczególności, badanie nie
wskazuje żadnej zależności między liczbą znajomych na portalu a poczuciem szczęścia.
Rozdział pierwszy odnosi się do literatury poświęconej badaniom nad szczęściem
oraz nad strukturami sieciowymi. W rozdziale drugim przedstawiony jest sposób zbierania
danych i opis próby oraz wyników ankiet, ze szczególnym uwzględnieniem danych
dotyczących sieci kontaktów respondentów. Rozdział trzeci poświęcony jest opisowi,
weryfikacji i interpretacji parametrów modelu, zawiera również formalny opis
wykorzystanych metod analitycznych. Rozdział czwarty poświęcony jest interpretacji
wyników badania. Pracę kończy rozdział podsumowujący.
7
ROZDZIAŁ I. Szczęście oraz struktura sieci społecznej
jako przedmiot badań naukowych: przegląd
literatury
I.1 Definicje szczęścia
Szczęście trudno jest zdefiniować, choć wiele osób twierdzi, że jest najważniejsze w
życiu. Arystoteles szczęścia upatrywał w działaniu zgodnie z naturą, Tomasz z Akwinu
szczęściem absolutnym nazywał kontakt z Bogiem, buddyści mawiają, że szczęście to
wyzbycie się pragnień. Nie ma ustalonej definicji szczęścia. Badania nauk społecznych, w
szczególności ekonomii, odwołują się zazwyczaj do indywidualnej oceny szczęścia,
określanej przez badanych na przyjętej skali; nie podają jednak jego definicji, zakładając, że
każdy wie czym ono jest. Niemożliwe tym samym w tego typu badaniach jest uchwycenie
rozbieżności w postrzeganiu szczęścia, a tym samym wyznaczenie uniwersalnej dla
wszystkich granicy między osobą raczej nieszczęśliwą, a raczej szczęśliwą.
Rozważając temat szczęścia warto odnieść się do dzieł filozofów, choćby ze względu
na fakt, iż to oni mają największy udział w badaniu tego zagadnienia. I tak, Tatarkiewicz
(1962) rozróżnia cztery definicje szczęścia, każdą odnoszącą się do nieco innego jego
aspektu.
1. Szczęście jako pomyślność lub powodzenie, jak na przykład „szczęście w kartach”,
czy „szczęście w interesach”. Tatarkiewicz nazywa je „szczęściem obiektywnym”.
W innych językach dla tego typu szczęścia zarezerwowane są często oddzielne
terminy, jak fortuna w łacinie czy luck w angielskim. Ta odmiana szczęścia jest
nieważna z punktu widzenia niniejszego badania, nie dotyczy bowiem odczuć
jednostki, tylko obserwacji pozytywnego biegu zdarzeń.
2. Drugi rodzaj szczęścia Tatarkiewicz opisuje jako subiektywne przeżycie, „stan
intensywnej radości, błogości czy upojenia”. Nazywa je szczęściem w znaczeniu
psychologicznym, podkreśla również że żaden z tych dwu rodzajów nie oznacza „tego
wielkiego dobra i naczelnego celu życiowego, za jaki szczęście uchodzi”.
8
3. Kolejna definicja szczęścia, stawia je na równi z opisywaną przez Greków
eudajmonią, czyli osiągnięciu najwyższych dóbr dostępnych człowiekowi.
Filozofowie nie byli zgodni do tego jakie to mają być dobra. Według jednych
moralne, w opinii innych - hedonistyczne. W tym rozumieniu szczęście-eudajmonia,
szczególnie w rozumieniu stoików, niekoniecznie oznaczać musiało coś przyjemnego,
ponieważ odczucie posiadania tych dóbr jest sprawą nieistotną.
4. Ostatni typ szczęścia wyróżniany przez Tatarkiewicza to „zadowolenie z życia
wziętego w całości”. Od szczęścia w drugim rozumieniu odróżnia je przede
wszystkim to, że dotyczy całego życia, a nie przeżycia.
Badania empiryczne, oparte na koncepcji poczucia szczęścia, mówią przede
wszystkim o dwóch typach szczęścia, odpowiadających drugiej i czwartej definicji (Helliwell,
Layard, Sachs, 2012). Dla drugiego pojęcia stosuje się obecnie często termin szczęście
afektywne (ang. affective happiness), co podkreśla chwilowy jego charakter wynikający z
krótkotrwałych odczuć, natomiast szczęście definiowane zgodnie z czwartym podejściem
nazywane bywa zadowoleniem z życia, lub szczęściem ewaluatywnym (ang. evaluative
happiness). To właśnie ten typ szczęścia najbardziej interesuje ekonomistów i tak też
rozumiemy je w tym badaniu.
Zdefiniowanie szczęścia jest tak popularnym przedsięwzięciem, ponieważ
sformułowanie dokładnej definicji umożliwiłoby podążanie za nią w celu jego osiągnięcia,
podając niejako „wzór na szczęście”. Ale jak pisze Tatarkiewicz:
„Dla zjawiska szczęścia można znaleźć inne jeszcze formuły, np. <<szczęście to
dodatni bilans życia>>. Ta formuła ma tę zaletę, że uwydatnia, iż chodzi w szczęściu
nie o wyłączność, lecz o przewagę przeżyć dodatnich; ale ma też wadę, że sugeruje, iż
można obliczyć szczęście, gdy tymczasem można go tylko doświadczyć.”
Nie możemy szczęścia obliczyć, ale na podstawie indywidualnych ocen szczęścia,
wykorzystując narzędzia matematyczne możemy próbować wskazać czynniki, które na nie
wpływają. Empiryczna definicja poczucia szczęścia, wykorzystywana w części empirycznej
pracy, zdefiniowana zostanie w rozdziale II.4.
9
I.2 Sieć społeczna jako reprezentacja rzeczywistości jednostki
Ostatnie lata to okres gwałtownego rozwoju portali internetowych tworzących
przestrzeń dla ludzkich interakcji, nazywanych mediami społecznościowymi.
Najpopularniejsze medium tego typu to portal facebook, na którym konta ma ponad miliard
użytkowników. Fenomen sukcesu portali społecznościowych jest przedmiotem wielu badań
ekonomicznych i socjologicznych (np. Schwartz i inni, 2013, Deloitte, 2012). Same media
społecznościowe natomiast mogą być olbrzymim źródłem informacji zarówno o
pojedynczych użytkownikach, jak również o sieciach kontaktów jakie tworzą. Wiele portali
społecznościowych stawia sobie za cel ułatwienie komunikacji i stworzenie możliwości
poznawania nowych osób. Specyfika facebooka polega na tym że przede wszystkim
wykorzystywany jest do pielęgnowania kontaktów z osobami znanymi ze świata
rzeczywistego, zatem możemy przypuszczać że stosunkowo wiernie obrazuje sieć
znajomych1.
W badaniu przyjęto założenie, że sieć znajomych na facebooku obrazuje sieć
rzeczywistych kontaktów społecznych respondenta. Nie odzwierciedla ich wiernie, ale
zachowuje większość powiązań i ogólny obraz sieci. Pośrednim potwierdzeniem tej tezy
może być część eksperymentu naukowców z University College London dotyczącego
zależności między wielkością sieci kontaktów w serwisach społecznościowych a strukturą
mózgu. Przeprowadzone przez nich badania wskazują na silną korelację między siecią
kontaktów online i w świecie rzeczywistym (Kanai i inni, 2011). Wyniki wspomnianego
badania oczywiście nie są dowodem na to, że wirtualna sieć kontaktów wiernie odzwierciedla
rzeczywistą sieć powiązań jednostki, są jednak mocną przesłanką ku stwierdzeniu, że oddaje
dobrze jej ogólny obraz.
I.3 Wpływ interakcji z otoczeniem na postrzeganie szczęścia
Koncepcja piramidy potrzeb Abrahama Maslowa określa i porządkuje ludzkie
potrzeby (Maslow, 1943). Jej twórca za najważniejsze uznaje potrzeby fizjologiczne, po
1 „Grono sprzyjało budowaniu relacji - facebook odzwierciedla je” –komentarz eksperta w dziedzinie mediów społecznościowych http://jacekgadzinowski.natemat.pl/61363,fakty-o-grono-net-i-polskim-social-media
10
których zaspokojeniu człowiek dąży do zaspokojenia kolejnych – potrzeby bezpieczeństwa,
miłości i przynależności, szacunku i uznania oraz potrzeby samorealizacji. Teoria bazuje
między innymi na przekonaniu o społecznej naturze ludzi, co ma wyraz przede wszystkim w
potrzebach przynależności oraz szacunku i uznania. Nie da się tego osiągnąć bez interakcji z
innymi, a sieć znajomych jest przestrzenią, gdzie zaspokojenia tych potrzeb możemy
poszukiwać. Jeżeli piramida potrzeb opracowana przez Maslowa jest prawdziwa, tj. opisuje
rzeczywiste potrzeby, które większość ludzi odczuwa, znaczy to, że przynależność do grupy
społecznej jest niezbędna do zaspokojenia potrzeb, a tym samym do osiągnięcia szczęścia.
Sama sieć, a dokładniej jej członkowie wpływają również na szczęście jednostki.
Fowler i Christakis (2009) opisują badania oparte na danych dotyczących wielu aspektów
życia mieszkańców miejscowości Framingham w USA. To co czyni je wyjątkowym, to
długość okresu gromadzenia danych (sięgający 1948 roku) i przede wszystkim dostępność
informacji na temat znajomości w badanej grupie – Framingham to małe miasto, a w badaniu
uczestniczy ponad 5000 osób, co umożliwia określenie znajomości między nimi. Dzięki temu
możliwa była analiza zależności poczucia szczęścia wśród grup znajomych. Wyniki tego
badania wskazują na to że szczęście jest zaraźliwe – w sieci występowały wyraźne skupiska
osób szczęśliwych i nieszczęśliwych. Co więcej, fakt że badanie opiera się na danych
panelowych pozwolił stwierdzić, że grupy takie tworzą się w wyniku rozprzestrzeniania się
szczęścia (czy też nieszczęścia), a nie tylko poprzez zawieranie znajomości przez ludzi
„podobnie szczęśliwych”. Ponadto, badanie wskazuje na dużą wagę geograficznej bliskości w
procesie rozprzestrzeniania się szczęścia – proces zachodzi głównie w przypadku blisko
mieszkających osób.
Teoria Maslowa wskazuje na dużą wagę interakcji z otoczeniem w procesie
zaspokajania potrzeb, który ma wpływ na samopoczucie jednostki, tym samym pośrednio, na
jej szczęście. Wyniki badania mieszkańców Framingham dowodzą, że szczęście może się
rozprzestrzeniać w sieci społecznej na najbliższych znajomych. W kolejnych rozdziałach
przeanalizowana zostanie hipoteza mówiąca o wpływie samej struktury sieci na poczucie
szczęścia.
11
I.4 Wyniki wybranych badań empirycznych
Syntezę badań empirycznych dotyczących determinant poczucia szczęścia z punktu
widzenia ekonomisty prezentują Helliwell, Layard, i Sachs (2012). Autorzy dzielą źródła
poczucia szczęścia na dwie grupy – czynniki indywidualne (osobiste, charakterystyczne dla
jednostki) i czynniki zewnętrzne. Pośród czynników zewnętrznych wyróżniają:
Dochody
Pracę
Społeczność i rządy
Wartości i religię
Czynniki indywidualne dzielą natomiast na:
Zdowie psychiczne
Zdrowie fizyczne
Doświadczenia związane z rodziną
Edukację
Płeć i wiek
Badania psychologów potwierdzają, że wyżej wymienione czynniki mają wpływ na
poczucie szczęścia. Podkreślają oni również wagę trudniejszych do zmierzenia czy w ogóle
opisania cech, takich jak osobowość, cele, czy zdolności adaptacji (Diener i inni, 1999).
Z ciekawszych wyników badań wymienić należy:
Dochody
Jeżeli chodzi o zależność między dochodami a szczęściem, to liczne badania
potwierdzają zależność między dochodem a poczuciem szczęścia – bogatsi członkowie
społeczeństwa są z reguły szczęśliwsi od biednych. Bardziej problematyczna jest kwestia
bogacenia się narodów i wpływu tego faktu na obserwowane poczucie szczęścia obywateli –
nazywana jest ona paradoksem Easterlina. Easterlin (1974) na podstawie wyników badań
empirycznych stwierdził, że powyżej pewnego poziomu, wzrost PKB nie prowadzi do
12
większego średniego poczucia szczęścia w społeczeństwie. Niemniej, istnieją badania
dowodzące niesłuszności tej teorii (DiTella i inni, 1998, Stevenson, Wolfers, 2008).
Praca
Praca nie jest tożsama z dochodami, mimo że zazwyczaj bezpośrednio się z nimi
łączy. Może wpływać na poczucie szczęścia przede wszystkim ze względu na budowane w
niej relacje oraz nadawanie życiu znaczenia. Niektóre badania wskazują, że waga tej cechy
wzrosła wśród kobiet wraz ze wzrostem równouprawnienia i otworzeniem się możliwości
zawodowych (Blanchflower i Oswald, 2004).
Religia
Badania dowodzą, że religijność pozytywnie wpływa na odczuwane szczęście. Co
ciekawe, zależność ta widoczna jest kiedy religijność mierzona jest nie stosunkiem do religii
(np. w pytaniu Jak ważna jest dla Ciebie religia w skali 1-5?) a działaniami, np.
częstotliwością modlitwy lub uczęszczania w nabożeństwach (Diener i inni, 1999).
Zdrowie
Badania wskazują, że zależność między zdrowiem a poczuciem szczęścia widoczny
jest przede wszystkim, gdy jego stan oceniany jest przez badanych. Kiedy zdrowie oceniane
jest przez lekarza lub badacza na podstawie pytań o poszczególne aspekty zdrowotności,
zależność znacznie się osłabia (Diener i inni, 1999).
Płeć i wiek
Wpływ wieku na poczucie szczęścia nie jest jasny – niektóre badania wskazują na
U-kształtną zależność (Blanchflower i Oswald, 2004), wskazując czwartą dekadę życia jako
najmniej szczęśliwą, inne nie potwierdzają tej zależności. Co do wpływu płci na poczucie
szczęścia również nie ma zgody. Badania wskazujące na wyższe oceny szczęścia u kobiet
dotyczą głównie krajów rozwiniętych, podczas gdy zależność w krajach rozwijających się jest
niezauważalna, bądź w ogóle odwrotna. Warto mieć na uwadze również fakt, iż depresja i
inne podobne choroby częściej dotykają kobiety niż mężczyzn.
13
Rodzina
Istnieją liczne analizy wskazujące na pozytywny wpływ małżeństwa na poczucie
szczęścia. Ludzie po ślubie są szczęśliwsi nie tylko niż rozwiedzeni czy owdowiali, ale
również niż single. Na zależność tę wpływa silnie kultura kraju i jego układ społeczny (za
Diener i inni, 1999).
Na koniec warto zwrócić uwagę na fakt rosnącej popularności badań ekonomistów
nad tematem szczęścia. Przyjmując, że to nie wartość zgromadzonych bogactw jest ważna dla
jednostki, ale subiektywnie ocenione poczucie szczęścia, taki stan rzeczy nie powinien
dziwić. Jest to bardziej humanistyczne podejście, odrzucające pieniądz jako uniwersalny
miernik wszystkiego, skupiające się na odczuciach podstawowych członków systemu
gospodarczego – ludzi. Badania nad szczęściem mogą być źródłem wiedzy dla twórców
polityki gospodarczej, a przegląd ekonomicznych zastosowań badań nad szczęściem
publikacji opisują Frey i Stutzer (2002).
I.5 Przegląd wybranych badań dotyczących zależności między
strukturą sieci społecznej a poczuciem szczęścia
Zależność między strukturą sieci społecznej a poczuciem szczęścia była
przedmiotem wielu badań naukowych, zarówno z punktu widzenia jednostki, jak i
społeczeństwa jako całości. Na najwyższym poziomie ogólności można stwierdzić, iż
generalnie, osoby spędzające więcej czasu z ludźmi są szczęśliwsze, niż te stroniące od
towarzystwa (Diener, Seligman, 2002).
Dokładniejszy opis struktury sieci społecznej opiera się często na pojęciu kapitału
społecznego, a właściwie dwóch jego typów – pomostowego (bridging) i wiążącego
(bonding) zdefiniowanych przez Putnama (2000). Kapitał wiążący odpowiada za siłę więzów
wewnątrz jednej grupy społecznej, podczas gdy pomostowy opisuje połączenia między
członkami różnych grup. Putnam twierdzi, że kapitał pomostowy wzmacnia demokrację,
wolności obywatelskie i równouprawnienie płci – czynniki te sprzyjają większemu poczuciu
szczęścia. Ponadto, Granovetter (1973) wskazywał na przydatność słabszych powiązań
społecznych, kojarzonych z kapitałem pomostowym, w poszukiwaniu lepszej pracy. Burt
14
(2005) pisze o pozytywnym oddziaływaniu kapitału pomostowego na zarobki, kreatywność i
szczęście. Z drugiej strony kapitał wiążący, jeżeli przeważa nad kapitałem pomostowym
może mieć negatywne skutki dla społeczeństwa jako całości, ale wiązać się z dużymi
korzyściami dla członków grupy społecznej (Beugelsdijk, Smulders, 2003). Więzy rodzinne,
składające się na kapitał wiążący, generalnie są silniejsze w szczęśliwszych społeczeństwach
(Alesina, Giuliano, 2010). Wpływ kapitału społecznego na poczucie szczęścia nie jest jednak
w pełni określony, a sprawę komplikuje fakt, iż struktura sieci społecznej może być
endogeniczna dla poczucia szczęścia (Growiec i Growiec, 2013). Chistakis i Fowler (2009)
oprócz wskazania “zaraźliwości” szczęścia, dowodzą również, że osoby szczęśliwe znajdują
się bliżej centrum sieci społecznej, podczas gdy osoby deklarujące niższe poczucie szczęścia
na grafie sieci znajdziemy raczej na peryferiach. To cenna uwaga z punktu widzenia tej pracy,
ponieważ ich badania opierały się na dużej, rzeczywistej sieci połączeń społecznych ludzi w
małym mieście, podczas gdy wiele z wyżej wymienionych badań używa różnych
przekształceń do określenia siły kapitału wiążącego i pomostowego.
15
ROZDZIAŁ II.Dane
Rozdział ten poświęcony jest opisowi danych, na których opiera się niniejsza analiza. W
pierwszej części opisane zostały miary struktury sieci, które wyliczone zostały na podstawie
sieci kontaktów uczestników badania. Drugi podrozdział przedstawia dokładnie proces
gromadzenia danych ankietowych. W trzeciej części rozdziału zaprezentowane są statystyki
opisowe zmiennych objaśniających próby na podstawie której przeprowadzono analizę.
Rozdział kończy dokładny opis zmiennej objaśnianej.
II.1 Statystyki służące opisowi sieci wykorzystane w badaniu
Wybrane statystyki służące opisowi sieci opisane są wg podręczników Goyala
(2007), Jacksona (2004) i Wattsa (1971). Przyjęte oznaczenia:
Zbiór N = {1,..,n} oznacza zbiór wierzchołków (węzłów) składających się na sieć. W
kontekście pracy rozpatrywany będzie jako zbiór znajomych na portalu społecznościowym
facebook.
Graf (N, g) składa się ze zbioru wierzchołków N = {1,..,n} i macierzy g, o
wymiarach n x n i wartościach ze zbioru liczb rzeczywistych. Macierz ta, zwana macierzą
sąsiedztwa, opisuje relacje między węzłami i oraz j - czy połączenie między nimi występuje,
czy też nie. Elementy macierzy g mogą wyrażać intensywność (wagę) i kierunek zależności
między wierzchołkami. Jeżeli macierz jest symetryczna, tj. gij = gji, to graf jest nieskierowany
i reprezentuje jedynie informacje dotyczące istnienia relacji między wierzchołkami i oraz j.
Jeżeli natomiast elementy macierzy przyjmują więcej niż dwie wartości (zazwyczaj
przyjmowane są wartości 0 i 1), to macierz niesie ze sobą informacje na temat intensywności
zależności.
W pracy wykorzystane są grafy nieskierowane, bez wag. Są obrazem struktury sieci
znajomych respondentów i reprezentują jedynie powiązania pomiędzy znajomymi każdego z
respondentów z osobna. Jeżeli dwoje znajomych respondenta ankiety, oznaczonych i, j, jest
znajomymi na facebooku, wówczas gij=1, w przeciwnym razie gij=0.
16
II.1.1 Rozmiar sieci (degree)
Zmienna ta opisuje wielkość sieci, czyli liczbę węzłów (wierzchołków) które na nią
się składają. Innymi słowy, jest to liczebność zbioru wierzchołków N. W tym przypadku –
jest to liczba znajomych respondenta na portalu facebook.
II.1.2 Rozpiętość sieci (diameter)
Jest to najdłuższa, spośród najkrótszych ścieżek między dwoma węzłami w sieci.
Ścieżka (ang. path) to dowolna sekwencja unikalnych węzłów połączonych krawędziami,
która łączy dwa węzły. W kontekście pracy zmienna jest miarą opisu rozpiętości sieci
społecznej respondenta, mówi jak bardzo oddalone są od siebie poszczególne grupy do
których należy.
II.1.3 Liczba podgrup w sieci (number of components)
Liczba niezależnych względem siebie grup składających się na sieć. Respondent
tworzy jedyne bezpośrednie powiązanie pomiędzy członkami tych podgrup. W kontekście
pracy, zmienna ta opisuje różnorodność kontaktów respondenta, przynależność do różnych
grup społecznych.
II.1.4 Gęstość sieci (density)
Jest to odsetek połączeń w stosunku do możliwej ich liczby. Zmienna ta różnicuje
respondentów pod względem zależności między ich znajomymi. Jeżeli wielu z nich zna się
wzajemnie i ma to wyraz w znajomościach na facebooku, zmienna przyjmować będzie
wyższe wartości.
II.1.5 Przeciętna długość najkrótszej ścieżki między dwoma kontaktami w
sieci (average shortest path)
Jest to średnia długość najkrótszej ścieżki, wyliczona na podstawie wszystkich par
kontaktów (węzłów) w sieci i najkrótszych możliwych ścieżek między nimi. Wartość ta, w
przeciwieństwie do rozpiętości sieci, odnosi się do wszystkich najkrótszych ścieżek, a nie
tylko najdłuższej z nich.
17
Należy w tym miejscu po raz kolejny podkreślić, iż analizowana sieć kontaktów
respondenta X nie zawiera samego respondenta X. W przeciwnym wypadku ta miara byłaby
równa 1 lub 2 (1 dla znających się osób, 2 w przeciwnym przypadku).
II.1.6 Średni wskaźnik grupowania (average clustering coefficient)
Wartość ta jest średnią z lokalnych wskaźników grupowania γv, wyliczonych dla
każdego z wierzchołków w sieci. Lokalna wersja wskaźnika określa stopień w jakim
wierzchołki będące w sąsiedztwie wierzchołka v połączone są ze sobą. Niech Γ(v) oznacza
sąsiedztwo wierzchołka v, to znaczy zbiór wszystkich wierzchołków z nim połączonych.
Lokalny wskaźnik grupowania wyraża się wzorem:
(1) γv=
|E ( Γv )|
(k v
2 ) ,
gdzie |E ( Γ v )| to liczba połączeń w sąsiedztwie wierzchołka v, natomiast (kv
2 ) to liczba
wszystkich możliwych połączeń w tym sąsiedztwie. Przekładając to na kontekst sieci
kontaktów, określa w jakim stopniu znają się między sobą znajomi danej osoby. Średni
wskaźnik grupowania wyraża się wzorem
(2) γ=1n∑v=1
n
γ v .
Jeżeli γ = 1 oznacza to, że sieć znajomych respondenta jest pełna, tj. każdy zna każdego. Im
wskaźnik jest mniejszy, tym mniejsza skłonność węzłów do tworzenia grup.
II.2 Sposób zbierania danych
Dane do badania zgromadzone zostały za pomocą internetowej ankiety, złożonej z
40 pytań. Wzorowane były one na pytaniach stawianych respondentom w Diagnozie
Społecznej oraz World Values Survey. Pełny tekst ankiety znajduje się w załączniku numer 1.
Ankieta, rozprowadzana głównie za pomocą mediów społecznościowych przeprowadzona
była w dniach 30.05 – 6.06 2013. Respondenci po odpowiedzi na pytania proszeni byli o
załączenie pliku .gml wygenerowanego za pomocą aplikacji NetVizz, który listował
18
połączenia pomiędzy ich znajomymi na portalu facebook. Na podstawie pliku obliczono
wyżej opisane statystyki sieci znajomych każdego z respondentów, wykorzystując do tego
program Gephi. Jest to aplikacja służąca przede wszystkim wizualizacji struktur sieciowych,
umożliwia jednak również obliczanie statystyk analizowanych sieci. Spośród 163 zebranych
wypełnionych kwestionariuszy odrzucono 8 z powodu załączenia błędnego pliku.
Spośród 155 ankiet z poprawnie dołączonym plikiem .gml odrzucono kolejnych 11
plików – tych, gdzie sieć liczyła mniej niż 100 węzłów. Jest to arbitralna decyzja, wynikająca
z przekonania, że osoby które mają mniej niż 100 znajomych na portalu facebook nie starają
się powielać w Internecie wszystkich znajomości z życia codziennego, tym samym grono ich
znajomych na facebooku nie odzwierciedla wiernie rzeczywistej sieci kontaktów jaką tworzą.
II.3 Statystyki opisowe danych
II.3.1 Struktura demograficzna próby
Uczestnikami badania byli przede wszystkim studenci z dużych miast. 85 spośród
144 ankietowanych to kobiety, co stanowi 59% próby. Najliczniejsza grupa wiekowa, osoby
od 20 do 24 roku życia stanowi aż 2/3 próby. Prawie 40% respondentów to studenci,
bezrobotni stanowią jedynie 1% próby. Spośród 61% pracujących osób 31% jest
zatrudnionych na pełen etat, 15% pracuje w niepełnym wymiarze godzinowym, kolejne 15%
pracuje na własny rachunek. Dokładniejsze dane zaprezentowane zostały na wykresie 1.
19
Wykres 1. Struktura demograficzna próby, podział w zależności od miejsca zamieszkania, wieku i sytuacji zawodowej
Źródło: Opracowanie własne
II.3.2 Statystyki ankiet
Pełne wyniki ankiet zaprezentowane są w załączniku. Pobieżnie opisane zostaną
tylko główne spostrzeżenia i ciekawsze obserwacje.
Rozkład oceny zadowolenia z poziomu dochodów jest bardzo zbliżony do rozkładu
oceny satysfakcji z życia (wykresy poniżej)
Większość respondentów lokuje swoje poglądy w centrum politycznej sceny, odsetek
osób o upodobaniach lewicowych jest niewiele większy niż tych, które deklarują
prawicowe poglądy
50% respondentów chodzi do kościoła raz na rok lub rzadziej, z drugiej połowy 15%
chodzi do kościoła jedynie w główne święta. 23% osób uczęszcza w nabożeństwie raz
na tydzień lub częściej.
55% ankietowanych często zastanawia się nad sensem życia, jedynie 2% nie robi tego
nigdy
20
Większość respondentów poświęca czas na aktywność fizyczną, jedynie 10% nie robi
tego w ogóle, 22% ćwiczy 5 lub więcej godzin w tygodniu
42% ankietowanych to single (osoby nie znajdujące się w stałym związku), 39% żyje
w stałym związku bez ślubu, po ślubie jest 15% ankietowanych. Rozwiedzeni i będący
w separacji stanowią około 4% próby
3% respondentów ma wykształcenie średnie, 15% licencjackie, prawie 60%
magisterskie. Blisko 25% ankietowanych ukończyło bądź planuje studia doktoranckie
lub podyplomowe.
Wykres 2. Rozkład i dystrybuanta oceny zadowolenia z dochodów
1 2 3 4 5 6 7 8 9 100.00%
5.00%
10.00%
15.00%
20.00%
0.00%20.00%40.00%60.00%80.00%100.00%
Źródło: Opracowanie własne
Wykres 3. Rozkład i dystrybuanta oceny satysfakcji z życia
1 2 3 4 5 6 7 8 90.00%
5.00%
10.00%
15.00%
20.00%
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
Źródło: Opracowanie własne
II.3.3 Statystyki sieci
Każdy respondent był proszony o udostępnienie pliku z opisem sieci połączeń
między swoimi znajomymi na portalu facebook. Sieć każdego użytkownika traktowana była
jako oddzielna, analiza nie uwzględnia ewentualnych połączeń między uczestnikami badania.
Statystyki opisowe wybranych miar sieci, analizowanych w badaniu streszcza poniższa
tabela. Jedyne dostępne dane do których można je przyrównać pochodzą z analiz Larsa
21
Backstroma i innych pracowników firmy facebook (Backstrom i inni, 2012; Ugander, Karrer,
Backstrom, Marlow, 2011). Dotyczą one jednak nie analizy sieci poszczególnych
użytkowników, a globalnej sieci połączeń wszystkich użytkowników portalu, których liczba
w marcu 2013 przekroczyła 1 110 000 000. To ponad 15% ludzkości.
Tabela 1. Statystyki opisowe miar sieci
degree diameter density components avg_clust clust avg_path avg_degree
Średnia 382,87 7,52 0,07 11,25 0,59 0,56 2,91 24,25
Mediana 344,00 7,00 0,07 9,00 0,59 0,56 2,84 22,54
Odch. Std. 189,03 2,00 0,03 9,94 0,07 0,07 0,54 10,89
Kurtoza 3,19 11,59 2,60 7,67 0,05 0,46 11,08 0,86
Skośność 1,33 2,41 1,19 2,44 - 0,13 - 0,43 2,23 0,81
Zakres 1 124,00 16,00 0,18 59,00 0,40 0,39 4,74 57,07
Minimum 104,00 4,00 0,01 1,00 0,39 0,34 1,57 3,42
Maksimum 1 228,00 20,00 0,20 60,00 0,79 0,73 6,31 60,49
Źródło: Opracowanie własne
Średnia liczba znajomych w analizowanym zbiorze to 382 osoby. To liczba o wiele
wyższa niż średnia dla wszystkich użytkowników portalu, która wg danych z 2012 roku
wynosiła 190. To sukcesywnie rosnąca liczba od 2007 roku wzrosła prawie dwukrotnie. Fakt
iż średnia tej zmiennej w analizowanym zbiorze jest dużo wyższa niż dla całej sieci może
wynikać z istnienia wielu mało aktywnych użytkowników portalu w skali globalnej. Osoby
biorące udział w ankiecie są raczej aktywnymi użytkownikami. Ponadto odfiltrowana została
grupa osób o najniższej liczbie znajomych, o czym wspomniano w podrozdziale II.2.
Wykres 4. Histogram liczby znajomych (degree)
Wykres 9 prezentuje histogram i dystrybuantę empiryczną liczby znajomych
ankietowanych. Łatwo można zaobserwować, że prawie 50% respondentów ma od 200 do
399 znajomych, ponad 60% ankietowanych ma poniżej 400 znajomych. Dwójka
respondentów (1,3%) może szczycić się internetowym kontaktem z grupa ponad 1000 osób.
W szczególności ta liczba, jak i pozostałe statystyki sieci mogą zawierać mały błąd
22
Źródło: Opracowanie własne
wynikający z faktu, iż niektóre profile na
facebooku nie należą do ludzi, lecz zespołów
muzycznych czy firm (mimo istnienia innej
funkcji dla tego typu użytkowników).
W dalszej części rozdziału zaprezentowane zostaną histogramy wraz z dystrybuantami
pozostałych analizowanych zmiennych, oraz
wykresy punktowe, które zestawiają opisywaną
zmienną (oś y) z liczbą znajomych respondenta
(oś x).
Źródło: Opracowanie własne
Wykres 6. Zestawienie gęstości sieci z liczbą znajomych respondentów
0 200 400 600 800 1000 1200 14000
0.05
0.1
0.15
0.2
0.25density
Liczba znajomych
Źródło: Opracowanie własne
23
0,01
-0,0
2
0,02
-0,0
3
0,03
-0,0
4
0,04
-0,0
5
0,05
-0,0
6
0,06
-0,0
7
0,07
-0,0
8
0,08
-0,0
9
0,09
-0,1
0,1-
0,11
0,11
-0,1
2
0,12
-0,1
3
0,13
-0,1
4
0,15
-0,1
6
0,18
-0,1
9
0,19
-0,2
05
1015202530
0.0
0.2
0.4
0.6
0.8
1.0
100-199
200-299
300-399
400-499
500-599
600-699
700-799
800-899
1100-1199
1200-129905
10152025303540
0
0.2
0.4
0.6
0.8
1
Wykres 5. Histogram i dystrybuanta gęstości sieci
Gęstość sieci, tj. stosunek potencjalnej liczby połączeń miedzy znajomymi do
ogólnej ich liczby waha się od 0,01 do 0,20. Dla ponad 2/3 ankietowanych odsetek ten nie
przekracza 8%. Gęstość sieci maleje wraz ze wzrostem liczby znajomych. Wartości dla
grafów poszczególnych użytkowników są oczywiście kilka rzędów wielkości wyższe niż dla
całego portalu, gdzie liczba potencjalnych połączeń jest nieporównanie większa.
Źródło: Opracowanie własne
Wykres 8. Zestawienie liczby niezależnych podgrup w sieci z liczbą znajomych respondentów
0 200 400 600 800 1000 1200 14000
10203040506070
components
Liczba znajomych
Źródło: Opracowanie własne
Liczba niezależnych podgrup w sieciach większości ankietowanych nie przekracza
10 (60% przypadków). Maksimum tej zmiennej to 60, co oznacza, że ankietowana osoba
miała 60 podgrup wśród swoich znajomych kompletnie niezależnych od siebie. 60 to dosyć
duża liczba w tym przypadku – można w dużym uproszczeniu interpretować to jako obracanie
się w 60 różnych środowiskach. W dużym uproszczeniu, ponieważ dwójka znajomych
24
1-10 11-20 21-30 31-40 41-50 51-600
102030405060708090
100
0.00.10.20.30.40.50.60.70.80.91.0
Wykres 7. Histogram i dystrybuanta liczby niezależnych podgrup sieci
respondenta może się znać w rzeczywistości, a nie być „zaprzyjaźnionym” na facebooku,
jednocześnie będąc w sieci ankietowanego.
Źródło: Opracowanie własne
Wykres 10. Zestawienie wskaźnika grupowania z liczbą znajomych respondentów
0 200 400 600 800 1000 1200 14000
0.10.20.30.40.50.60.70.8
clustering coefficient
Liczba znajomych
Źródło: Opracowanie własne
Wskaźnik grupowania możemy rozumieć jako odpowiedź na pytanie: jaki odsetek
moich znajomych zna się ze sobą? Interpretację ułatwi przyrównanie go do skrajnych
przypadków. W grafie w formie gwiazdy, z jednym centralnym węzłem i pozostałymi
25
0,3-0,35 0,35-0,4 0,4-0,45 0,45-0,5 0,5-0,55 0,55-0,6 0,6-0,65 0,65-0,7 0,7-0,7505
101520253035404550
0.0
0.2
0.4
0.6
0.8
1.0
Wykres 9.Wskaźnik grupowania - histogram i dystrybuanta
połączonymi jedynie z nim wskaźnik ten przyjmuje wartość 0, natomiast w przypadku grafu,
gdzie wszystkie węzły są ze sobą połączone jest równy 1.
W analizowanym przypadku średnia i mediana wskaźnika wynoszą 0,56, a wartości
wskaźnika mieszczą się w przedziale <0,39;0,79>. Oznacza to, że dla znacznej części
przypadków w próbie, większość znajomych respondenta się zna.
Wykres 11. Średnia odległość między parą znajomych w sieci
Źródło: Opracowanie własne
Źródło: Opracowanie własne
Średnia długość ścieżki między dwoma losowymi znajomymi respondenta to 2,91.
To znacznie mniejsza liczba niż hipotetyczna długość ścieżki między dwoma losowymi
26
1,5-2 2-2,5 2,5-3 3-3,5 3,5-4 4-4,5 4,5-5 6-6,50
10
20
30
40
50
60
70
80
0.0
0.2
0.4
0.6
0.8
1.0
0 200 400 600 800 1000 1200 140001234567
avg_path
Liczba znajomych
Wykres 12. Zestawienie przeciętnej długości ścieżki z liczbą znajomych respondentów
osobami na świecie, spopularyzowana przez Stanleya Milgrama. Przeprowadzony przez niego
eksperyment (Travers, Milgram, 1969) polegał na wręczeniu przypadkowym osobom
zaadresowanych listów i zleceniu przekazania ich osobom, które w ich mniemaniu, byłyby w
stanie przekazać je adresatom, bądź osobom które ich znają. Na podstawie badania Milgram
stwierdził, że między dwoma dowolnymi osobami istnieje ścieżka złożona z przeciętnie
sześciu osób, prowadząca od osoby A do osoby B. Uzyskana liczba jest również znacznie
mniejsza niż średnia ścieżka między dowolnymi użytkownikami facebooka, szacowana na
4,74 (Backstrom i inni, 2012). Różnica między średnią długością ścieżki w sieci wokół jednej
osoby, a wartością tej statystyki dla całego facebooka nie powinna dziwić – wynika ona z
diametralnej różnicy rozmiarów obu sieci. Fakt, że różnica między tymi wartościami jest
niewielka również nie jest czymś zaskakującym – to właśnie jest efekt małego świata, opisany
przez Milgrama. Wykres 12 pokazuje, że przeciętna długość ścieżki wcale nie wzrasta wraz
ze wzrostem liczby znajomych. To podstawowa cecha sieci nazywanych w małymi światami,
odróżniająca je od sieci losowych (Watts, Strogatz, 1998).
Źródło: Opracowanie własne
27
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2005
10152025303540
0.0
0.2
0.4
0.6
0.8
1.0
Wykres 13. Rozpiętość sieci - histogram i dystrybuanta
Wykres 14. Zestawienie rozpiętości sieci z liczbą znajomych respondentów
Źródło: Opracowanie własne
Rozpiętość sieci w 80% przypadków nie przekracza 8 - oznacza to że w obrębie sieci
najdłuższa, spośród najkrótszych ścieżek między dwoma znajomymi liczy 8 krawędzi. Liczba
ta nie wskazuje większej zależności z rozmiarem sieci (współczynnik korelacji 0,18).
Źródło: Opracowanie własne
28
0 200 400 600 800 1000 1200 14000
5
10
15
20
25diameter
1-6
6-11
11-1
6
16-2
1
21-2
6
26-3
1
31-3
6
36-4
1
41-4
6
46-5
1
51-5
6
56-6
1
05
101520253035
00.10.20.30.40.50.60.70.80.91
Wykres 15. Przeciętna liczba wspólnych znajomych - rozkład gęstości i dystrybuanta
Wykres 16. Zestawienie przeciętnej liczby wspólnych znajomych z liczbą znajomych respondentów
0 200 400 600 800 1000 1200 14000
10203040506070
avg_degree
Źródło: Opracowanie własne
Średnia liczba wspólnych znajomych respondenta i jego znajomych to 24 osoby.
Liczba ta rośnie wraz ze zwiększaniem się liczby węzłów w sieci (współczynnik korelacji
0,56). Zależność ta może wynikać z faktu, iż osoby które mają dużą liczbę znajomych, należą
do (licznych) grup społecznych, wewnątrz których wiele osób zna się wzajemnie.
II.4 Zmienna objaśniana – poczucie szczęścia
Zmienną objaśnianą w modelu jest deklarowane szczęście respondenta. Pierwsze
pytanie w ankiecie brzmiało:
Czy ogólnie rzecz biorąc, uważa Pan(i), że jest:
Bardzo szczęśliwy(a) Raczej szczęśliwy(a) Raczej nieszczęśliwy(a) Bardzo nieszczęśliwy(a)
Na samym końcu ankiety respondenci byli natomiast proszeni o odpowiedź na pytanie:
Ogólnie rzecz biorąc, w jakim stopniu, jest Pan(i) ostatnio zadowolony(a) ze swojego życia? Proszę ocenić na skali od 1 do 10, gdzie 1 oznacza, że jest Pan(i) całkowicie niezadowolony(a), 10 – całkowicie zadowolony(a) *
Taka forma pytań o poczucie szczęścia i zadowolenie z życia wykorzystywana jest w World
Values Survey od kilkudziesięciu lat. Odpowiedzi na oba pytania są silnie skorelowane, ale
nie zawsze są zbliżone – zdarzają się przypadki osób nieszczęśliwych ale zadowolonych z
życia, zdarzają się również przypadki odwrotne. Nie potraktowano takich odpowiedzi jak
29
błędów (którymi mogą być), ponieważ taka sytuacja jest możliwa w rzeczywistości. Pytanie o
poczucie szczęścia ludzie interpretują raczej jako pytanie o ich samopoczucie w danym
momencie, lub ostatnich kilku dniach, podczas gdy pytanie o zadowolenie z życia rozumiane
jest raczej jako refleksja nad ogółem wszystkich doświadczeń i przeżyć respondenta (Gamble,
Gärling, 2012). Osoba nieszczęśliwa (na przykład ze względu na zawód miłosny bądź śmierć
kogoś bliskiego) może być mimo zadowolona z życia ze względu na wspaniałe przeżycia w
przeszłości. Tak samo osoba bardzo szczęśliwa, może z życia być niezadowolona, choćby
przez błędy młodości. Tabela 1 zestawia odpowiedzi na oba pytania.
Tabela 2. Zależności między odpowiedziami na pytania o poczucie szczęście i satysfakcję z życia, liczebności podgrup
Ocena zadowolenia z życia
1 2 3 4 5 6 7 8 9 10 Suma
Ocena poziomu szczęścia
Bardzo nieszczęśliwy(a) 1 1 1 3
Raczej nieszczęśliwy(a)
1 1 5 3 2 1 13
Raczej Szczęśliwy(a)
1 2 6 20 24 17 10 3 83
Bardzo Szczęśliwy(a) 1 1 12 15 16 45
Suma 2 0 2 8 9 22 26 30 26 19 144
Źródło: Opracowanie własne
30
Rozkład odpowiedzi na pytanie o zadowolenie z życia jest bardzo zbliżony do
rozkładu tej zmiennej prezentowanego w wynikach European Social Survey i Gallup World
Poll, przytaczanych w World Happiness Report. Poniższe wykresy przedstawiają rozkład tej
zmiennej w niniejszym badaniu i analizie ESS i GWP. Należy zwrócić uwagę na fakt iż
badania te opierają się na 11 stopniowej skali, a nie 10 stopniowej. Nie powoduje to jedna
różnic w ocenie zależności i graficznej interpretacji. Warto podkreślić, że analiza GWP opiera
się na tzw. drabinie Cantrila – skali, w której kolejne szczeble drabiny określają wyższy
poziom zadowolenia z życia a respondenci mają wybrać szczebel na którym siebie widzą.
ESS stawia pytanie nieomalże identyczne z WVS.
Wykres 17 Rozkład zmiennej Zadowolenie z życia w Europie, wg danych Instytutu Gallupa
Źródło: World Happiness Report
31
Wykres 18 Rozkład zmiennej Zadowolenie z życia w Europie wg danych European Social Survey
Źródło: World Happiness Report
Wykres 19 Rozkład zmiennej Ocena poziomu zadowolenia z życia wśród 144 ankietowanych
1 2 3 4 5 6 7 8 9 100.00%
5.00%
10.00%
15.00%
20.00%
25.00%
Źródło: Opracowanie własne
Rozkład zmiennej wśród ankietowanych osób jest zbliżony do rozkładów w wyżej
wymienionych badaniach. Jest nieco bardziej spłaszczony, co wynika ze względnie małej
liczby respondentów. Tak jak w przytoczonych badaniach daje się zauważyć gruby ogon z
lewej strony – więcej osób wybiera odpowiedź najniższą niż przedostatnią w danej skali.
Podobieństwo rozkładu odpowiedzi wśród ankietowanych z wynikami analiz
międzynarodowych instytucji potwierdza heterogeniczność próby, która mimo małego
zróżnicowania demograficznego prezentuje całe spektrum zadowolenia z życia i oceny
poczucia szczęścia.
W dalszej części badania skupiono się na modelowaniu poczucia szczęścia wśród
badanych. Ze względu na bardzo niską liczebność grupy osób, które określiły się jako bardzo
32
nieszczęśliwe, w procesie modelowania połączono tę grupę z grupą wyższą, w które
udzielano odpowiedzi raczej nieszczęśliwy(a). Rozkład zmodyfikowanej zmiennej, na której
opiera się badanie prezentuje poniższy wykres. Warto dodać w tym miejscu, że skale badania
poczucia szczęścia są różne w zależności od badania. W Word Values Survey, na której
wzorowane jest niniejsze badanie są to cztery poziomy, w European Social Survey
wykorzystywana jest skala 11-stopniowa (tak jak w pytaniach o zadowolenie z życia), ale np.
badania Uniwersytetu w Chicago, General Social Survey, przeprowadzane w latach 1972-
1994 opierały się na 3 odpowiedziach na pytanie: Ogólnie rzecz biorąc, ostatnimi czasy jesteś
bardzo szczęśliwy, całkiem szczęśliwy, czy niezbyt szczęśliwy?“. Dlatego też uznano że taka
modyfikacja nie wpłynie negatywnie na wyniki badania.
Wykres 20 Rozkład zmiennej objaśnianej - poczucia szczęścia - w wersji oryginalnej i zmodyfikowanej
Bardzo nieszczęśliwy(a)
Raczej nieszczęśliwy(a)
Raczej szczęśliwy(a)
Bardzo szczęśliwy(a)
0
10
20
30
40
50
60
70
80
SzczęścieSzczęście - modyfikacja
Źródło: Opracowanie własne
33
Rozdział IV.Wyniki badania empirycznego
Rozdział ten poświęcony jest opisowi metody modelowania wykorzystanej w badaniu oraz
prezentacji i interpretacji wyników opracowanego modelu. W części pierwszej rozdziału
zaprezentowano specyfikację modelu logitowego i uporządkowanego modelu logitowego.
Dalej przytoczono opis metody estymacji parametrów w analizie – metody największej
wiarygodności. Druga część rozdziału zajmuje się prezentacją uzyskanych wyników, oceną
jakości modelu i interpretacją uzyskanych parametrów. W ostatnim podrozdziale
zaprezentowany model porównany został z alternatywnymi wersjami, w tym, modelami
uwzględniającymi jedynie zmienne opisujące sieci znajomych badanych.
IV.1.1 Specyfikacja modelu logitowego i uporządkowanego modelu
logitowego
Ustalenie, które cechy, spośród opisanych w ankiecie, wpływają na poczucie
szczęścia respondenta, oparto na interpretacji wyników estymacji uporządkowanych modeli
logitowych. Modele takie stanowią z kolei naturalne rozszerzenie modeli logitowych, które
wykorzystuje się przede wszystkim w analizie zmiennych binarnych, gdzie objaśniana
zmienna często oznacza fakt posiadania jakiejś cechy bądź nie, zakup produktu, czy
rezygnację z dalszego wykonywania usługi. Modelowana zmienna jest natomiast ciągła, w
związku z czym interpretuje się ją jako skłonność do posiadania cechy, zakupu, czy
rezygnacji. Zmienną taką nazywa się zmienną ukrytą ponieważ w rzeczywistości nie możemy
jej zaobserwować ani zmierzyć – odnotować możemy za to np. fakt zakupu. Obserwowana
zmienna (y) przyjmuje więc wartości 0 lub 1.
34
Model logitowy uporządkowany (opis za Maddala, 2006, Gruszczyński 2012) opiera
się na założeniu, że analizowany model regresji zmiennej ukrytej jest postaci
(3) y i¿=x ' i β+ui,
gdzie:
y i¿ to nieobserwowana zmienna ukryta,
xi to wektor obserwacji wartości zmiennych dla i-tej obserwacji,
β❑ to wektor parametrów strukturalnych modelu,
ui to błąd szacunku dla i-tej obserwacji.
W przypadku modelu logitowego, obserwowalna zmienna objaśniana y może przyjmować
dwie wartości – y = 0, gdy cecha nie występuje, lub y = 1 jeżeli występuje. Zakładając, ze
prawdopodobieństwo P(y i=1)=pi❑ , a
P ( y i=0)=1−pi❑a rozk ł ad zmiennej marozkład Bernoulliego, to funkcja
prawdopodobieństwa ma rozkład:
(4) f ( y i)= piy i(1− pi) p1− y i
W modelu logitowym pi traktujemy jako funkcję zmiennych objaśniających X, tworzących
wektor xi, zatem
(5) pi❑=F ( x i
' β ),
gdzie β to wektor parametrów funkcji. W modelu logitowym funkcja powyższa jest
dystrybuantą rozkładu logistycznego:
(6) pi❑=F ( x i
' β )=Λ (x i' β )=
exp ( x i' β )
1+exp( x i' β )
= 11+exp (−x i
' β)
Przyjmując Zi❑=xi
' β oraz pi❑=F (Z i
❑) ,funkcję odwrotną do F możemy przekształcić do
uproszczonej postaci
(7) x i' β=F❑
−1 ( pi )=lnp i
1−pi
35
Dzięki czemu możemy modelować pi jako liniową funkcję zmiennych X.
W uporządkowanym modelu logitowym modelowana ukryta zmienna może
przyjmować więcej niż dwie wartości (w przypadku bieżącego badania będą to 3 wartości w
przypadku zmiennej objaśnianej poczucie szczęścia lub 10 poziomów w przypadku zmiennej
zadowolenie z życia), które możemy uporządkować od najniższego do najwyższego.
Modelowaną zmienną nieobserwowalną y* przekształca się do postaci pierwotnej zmiennej,
dzieląc zakres wartości y* na J przedziałów. Do wyznaczenia granic między tymi
przedziałami potrzeba J+1 wartości. Wektor tych wartości, zwanych punktami odcięcia
(ponieważ tną zakres wartości zmiennej na mniejsze przedziały) oznaczamy jako k . Kiedy
zmienna nieobserwowana przyjmuje wartość z j-tego przedziału, czyli między kj-1 a kj, to
zmienna objaśniana y przyjmuje wartość j. Zapisujemy to jako
(8) y i¿= j ↔ k j−1< y i
¿≤ k j
Wartości wektora k to kolejne parametry które muszą być oszacowane – nie są znane,
ponieważ nie obserwujemy zmiennej y❑¿ . Zmienna ta, jako może przyjmować dowolne
rzeczywiste wartości, zatem możemy założyć, że:
(9) k 0=−∞ oraz k j=+∞
co zmniejsza liczbę parametrów koniecznych do oszacowania o 2. Wstępną specyfikację
modelu uzyskujemy zapisując:
y i=1 ↔−∞< y i¿≤ k1
(10) y i=2 ↔ k1< y i¿≤ k2
…
y i=J ↔kJ −1< y i¿≤+∞
W takiej postaci specyfikacja zawiera wciąż zmienną ukrytą y*, którą wyeliminować możemy
następującymi przekształceniami, zgodnie z wyżej wymienionymi wzorami:
k j−1< y i¿≤ k j
(11) k j−1< x 'i β+ui≤ k j
k j−1−x ' i β<ui ≤ k j−x ' i β
36
Otrzymujemy dzięki temu postać modelu bez ukrytej zmiennej y*, tylko wartości zmiennych
objaśnianych, które obserwujemy oraz oszacowane parametry:
y i=1↔−∞<u i≤ k1−x 'i β
(12) y i=2 ↔ k1−x ' i β<ui ≤ k2−x 'i β
…
y i=J ↔kJ −1−x 'i β<ui≤+∞
Warto zauważyć, że opisany wyżej model nie uwzględnia stałej w wektorze zmiennych
objaśniających, ponieważ wiązałoby się to z nieidentyfikowalnością modelu. Wynika to z
faktu iż w powyższe równania można byłoby wtedy zapisać w postaci:
(13) k j−1−x ' i β−β0<u i≤ k j−x ' i β−β0
w której nie byłoby możliwe oszacowanie odrębnie parametrów k j oraz β0.
W tym miejscu należy wspomnieć również o ograniczeniach związanych z
wnioskowaniem w takiej analizie. Przede wszystkim istnieje problem identyfikacji i kierunku
wnioskowania. Wartości zmiennych objaśniających w badanym modelu mogą być w istocie
wynikać z poziomu poczucia szczęścia, a nie je tłumaczyć. Przykładowo - to nie większe
dochody sprzyjają większemu poczuciu szczęścia, ale szczęśliwe osoby generują większe
dochody. Ponadto badanie opiera się na internetowej ankiecie, w której odpowiedź na wiele
pytań zależy od indywidualnych miar i wartości. Tych indywidualnych cech nie sposób
uwzględnić w modelu, co powinna uwzględniać interpretacja wyników estymacji.
IV.1.2 Estymacja metodą największej wiarygodności
Wyprowadzenie estymatorów opiera się na metodzie największej wiarygodności
(przytoczony niżej opis metody pochodzi z podręcznika Gruszczyńskiego, 2012). W tym celu
ustalamy najpierw wartość funkcji wiarygodności dla poszczególnych obserwacji, która jest
funkcją nieznanych parametrów i zmiennych objaśniających. Oznaczmy
prawdopodobieństwo przyjęcia wartości j przez zmienną y (spośród J poziomów) jako pij,
oraz wskaźnik d ij określający, czy zmienna w próbie rzeczywiście przyjęła wartość j.
37
(14) pij = P(yi=j)
(15) d ij={ 1, gdy y i= j0 ,w pozosta ł ych przypadkach
Prawdopodobieństwo, że zmienna objaśniana przyjmie tę wartość co w próbie to
wiarygodność pojedynczej obserwacji, którą zapiszemy jako Li(yi|xi) = pij, gdy yi=j.
Wykorzystując wskaźnik d ij możemy uniknąć wykorzystania sformułować warunkowych we
wzorze na wiarygodność obserwacji:
(16) Li(yi|xi) = pi 1di 1 pi 2
d i2 … p ijdij=∏
j=1
J
pijdij
Gdy yi = k, dla j≠kd ijjest równe zeru, a wyrażenie pijdij równa się 1. Natomiast d ij=1, zatem
pijdij=pij
❑. Tym samym dochodzimy do faktu, iż Li(yi|xi) = pik, gdy yi=k.
O ile wskaźniki d ij wyznaczamy w oparciu o próbę, to nie obserwujemy prawdopodobieństw
pij❑. Konieczne tym samym jest ustalenie formuły na te wartości, zależną od wartości
zmiennych objaśniających X i parametrów im przypisanych. Wykorzystując definicję pij❑ i
specyfikację modelu logitowego możemy zapisać:
pij = P(yi=j) = P(k j−1< x 'i β+ui≤ k j)=
(17) P(k j−1−x ' i β<ui ≤ k j−x ' i β) =
P(ui ≤ k j−x'i β¿−P ¿)=
F(k j−x 'i β)-F(k j−1−x '
i β),
gdzie F to dystrybuanta składnika losowego u, która odpowiada funkcji gęstości f. Model
logitowy zakłada, że rozkład ten jest logistyczny. Kierując się tym założeniem i
wykorzystując powyższe wzory, możemy przedstawić wiarygodność każdej obserwacji w
postaci funkcji zmiennych objaśniających i nieznanych parametrów im przypisanych:
(18) Li( yi|xi;β,k1, …, kj-1) ¿∏j=1
J
p ijdij=∏
j=1
J
[ F(k j−x 'i β)−F (k j−1−x '
i β )]❑dij
Wychodzimy z założenia, że obserwacje są niezależne, tym samym mogąc zapisać funkcję
wiarygodności dla próby jako iloczyn wiarygodności kolejnych obserwacji:
38
(19) L(y | x; β, k1 ,…,k j−1) ¿∏i=1
n
Li( y i∨x i; β , k1, …, k j−1)=
∏i=1
n
∏j=1
J
[F (k j−x 'i β )−F (k j−1−x '
i β)]❑d ij
Oraz logarytm tej funkcji:
(20) lnL(y | x; β, k1 ,…,k j−1) = ∑i=1
n
∑j=1
J
d ij ln [F (k j−x 'i β)−F(k j−1−x '
i β )]❑❑
Na tej podstawie możemy oszacować nieznane parametry metody największej wiarygodności.
Przyjęliśmy, że rozkład składnika losowego u ma rozkład logistyczny, tj. wyraża się wzorem:
(21) F(u )=exp (u)
1+exp (u) ,
zatem wzór na prawdopodobieństwo przyjęcia wartości j przez zmienną y przyjmie postać:
(22) pij= exp (k j−x '
i β)1+exp (k j−x'
i β)−
exp (k j−1−x'i β)
1+exp (k j−1−x 'i β )
IV.2 Wyniki estymacji modelu
W rozdziale tym zaprezentowany jest model opisujący poczucie szczęścia
respondentów sformułowany i wyestymowany zgodnie z wyżej opisanymi metodami. Kolejne
podrozdziały posłużą ocenie jakości modelu, jego interpretacji oraz porównaniu do
alternatywnych modeli opracowanych na podstawie ankietowych danych.
Głównym celem analizy była weryfikacja czy struktura sieci respondenta ma
związek z jego subiektywna oceną poczucia szczęścia. Tym samym skupiono się przede
wszystkim na weryfikacji, czy statystyki sieci, przeanalizowane w podrozdziale II.3.3 są
istotnymi zmiennymi objaśniającymi w modelach oraz jaki jest ich wpływ na objaśnianą
zmienną.
39
W przypadku większości analizowanych statystyk, nie dostrzeżono statystycznie
istotnej zależności między nimi a oceną poczucia szczęścia. Jedną z ciekawszych
analizowanych zależności, a zarazem najłatwiejszych do interpretacji jest wpływ liczby
znajomych na portalu na poczucie szczęścia. Zgromadzone dane zdecydowanie nie
potwierdzają, by większa liczba znajomych mogła być kojarzona z lepszą oceną poczucia
szczęścia niż gdy liczba znajomych jest mała. Wyniki dotyczące pozostałych zmiennych
opisane są w podrozdziale III.2.4.
Jedyna statystyka opisująca sieć, która wykazuje istotność statystyczną w szeregu
modeli to gęstość sieci. Przypomnijmy, że jest to stosunek obserwowanej liczby krawędzi
(połączeń) między znajomymi respondenta w stosunku do potencjalnej ich liczby w pełnym
grafie. Interpretacją tej zależności zajmiemy się w rozdziale III.2.3.
IV.2.1 Wyniki estymacji modelu
Wybrany model opiera się na następujących zmiennych objaśniających:
ln_density – logarytm naturalny gęstości sieci
doch_zad – ocena zadowolenia z poziomu zarobków w gospodarstwie domowym na
mieszkańca w skali od 1 do 10
zdrowie_bdobry – zmienna binarna przyjmująca wartość równą 1 gdy respondent
ocenił swój stan zdrowia na bardzo dobry ( najwyższa ocena w 4-stopniowej skali)
miejsc0 – zmienna binarna, równa 1 gdy respondent mieszka na wsi
ue_BIN – zmienna binarna przyjmująca wartość 1 gdy ankietowany zgadzał się ze
stwierdzeniem „czuję się członkiem Unii Europejskiej”
kosciol_czesciej_MOD – zmienna binarna równa 1, jeżeli respondent stwierdził, że
chodzi do kościoła raz w tygodniu lub częściej
Zmienna objaśniana modelu, poczucie szczęścia, w ankiecie miała cztery poziomy.
Bardzo niska liczebność grupy, która zaznaczyła odpowiedź Bardzo nieszczęśliwy (3 osoby)
wiązała się z koniecznością połączenia jej z grupą wyższą o jeden poziom, w której
respondenci odpowiadali Raczej nieszczęśliwy.
Oryginalny zbiór zmiennych objaśniających posiadał 38 zmiennych opisujących
różne cechy i aspekty życia respondentów – (odpowiedzi na pytania ankiety przytoczonej w
załączniku 1). Zbiór ten poszerzono o 6 zmiennych opisujących charakterystyki sieci.
Zaprezentowany model uzyskano metodą general to specific, eliminując kolejne nieistotne
40
zmienne ze zbioru zmiennych objaśniających. Alternatywne wersje modelu, stanowiące
sprawdzian odporności wyprowadzonych wyników na zmiany specyfikacji, zaprezentowano
w osobnym podrozdziale III.2.4.
Uzyskany model, wraz z miarami dopasowania prezentuje tabela 3:
Tabela 3. Uporządkowany model logitowy opisujący poczucie szczęścia
Ordered logistic regression 0 0 Number of obs = 144
LR chi2(6) = 57,51 0 0 0
Prob > chi2 = 0 0 0 0 0Log likelihood=-104,47325 0,00 R2 = 0,22szczescie_MOD Coef. Std. Err z P>|z|ln_density -0,87 0,45 -1,92 0,05doch_zad 0,40 0,10 4,07 0,00zdrowie_bdobry 1,33 0,40 3,36 0,00miejsc0 -1,68 0,62 -2,72 0,01ue_BIN -1,29 0,48 -2,72 0,01kosciol_czesciej_MOD 1,44 0,45 3,16 0,00
0,00Measures of Fit for ologit of szczescie_MOD:
0
Log-Lik Intercept Only: -133,23 Log-Lik Full Model: -104,47
D(136): 208,95 LR(6): 57,51
Prob > LR: 0,00 0,00 0,00
McFadden's R2: 0,22 McFadden's Adj R2: 0,16
ML (Cox-Snell) R2: 0,33 Cragg-Uhler(Nagelkerke) R2: 0,39
McKelvey & Zavoina's R2: 0,41 0,00 0,00
Variance of y*: 5,60 Variance of error: 3,29
Count R2: 0,62 Adj Count R2: 0,10
AIC: 1,56 AIC*n: 224,95
BIC: -466,95 BIC': -27,69
Źródło: Opracowanie własne
41
IV.2.2 Ocena jakości modelu
Wyżej zaprezentowany model okazał się być najlepszym spośród badanych, jeżeli
chodzi o szereg miar dopasowania czy kryteria informacyjne. Dokładny opis różnych
wariantów modeli znajduje się w tabeli na końcu rozdziału. Wybrany model cechuje się
najlepszymi wartościami kryteriów informacyjnych Akaike i bayesowskiego (Schwarza),
najwyższym wskaźnikiem dopasowane R2 McFaddena i jednym z najlepszych wyników jeżeli
chodzi o test ilorazu wiarygodności.
Test ilorazu wiarygodności stwierdza łączną istotność wszystkich zmiennych –
wartość testu wynosi 57,51 przy p-value 0,00. Test ten bazuje na różnicy logarytmów
wartości funkcji wiarygodności analizowanego modelu oraz modelu zerowego. Przyjmuje on
postać:
(23) LR = 2(lnLfit – lnL0)
Test ma rozkład chi-kwadrat, gdzie liczba stopni swobody jest równa liczbie szacowanych
parametrów, nie licząc progów oddzielających kolejne poziomy zmiennych.
Dla modelu nie możemy wyliczyć wartości testu Branta, weryfikującego założenie
proporcjonalnych szans (Gruszczyński, 2012). Wynika to z faktu, iż wśród osób
Nieszczęśliwych i Raczej nieszczęśliwych nie było osób chodzących często do kościoła.
Zależność tę oczywiście należy uznać za zupełnie przypadkową, ze względu na niską
liczebność populacji. Po usunięciu tej zmiennej model przechodzi test, przyjmujemy
założenie proporcjonalnych szans.
Współczynnik R kwadrat na poziomie 0,22 nie budzi zastrzeżeń w przypadku
danych ankietowych. Przyczyną tej zależności jest między innymi fakt, iż zazwyczaj modele
ekonometryczne oparte na szeregach czasowych dotyczą kategorii zagregowanych, jak ma to
miejsce w modelach makroekonomicznych. Dane zagregowane wyjaśnia się z reguły łatwiej
niż mikrodane, ponieważ nie przekazują informacji na temat każdej jednostki objętej
badaniem, które to wprowadzają do danych więcej szumu, wynikającego z indywidualnych
cech jednostki (Gruszczyński 2012,). Prezentowany model osiąga najwyższą wartość
współczynnika determinacji wśród modeli, w których wszystkie zmienne są istotne
statystycznie na poziomie p=0,05.
Poza najpopularniejszym wskaźnikiem dopasowania R2, do porównania modeli
między sobą i wyboru najlepszej specyfikacji posługujemy się wskaźnikami pseudo-R2,
takimi jak na przykład R2 McKelveya i Zavoiny (1975), który wyraża się wzorem:
42
(24) R2MZ =
Var ( y¿)Var ¿¿
Wskaźnik ten najbliższym koncepcyjnie wskaźnikiem dopasowania do klasycznego R2.
Symbol σ 2oznacza wariancj ę sk ł adnikalosowegou, który w modelu logitowym równy jest
π 2
3, czyli wariancji w rozkładzie logistycznym. Wartość wskaźnika na poziomie 0,41
świadczy o stosunkowo dobrym dopasowaniu modelu do danych w porównaniu do innych
modeli opisanych w tabeli na końcu rozdziału.
Modele między sobą możemy porównać również za pomocą wskaźników R2
opierających się nie na wartościach teoretycznych zmiennej objaśniającej, a na funkcji
wiarygodności. Ich wartości zawierają się również w przedziale [0,1], ale nie mają ustalonej
interpretacji. Nie mogą tym samym służyć ocenie konkretnego modelu, a jedynie porównaniu
zestawu modeli. Możemy je rozumieć jako wskaźniki mówiące o tym, na ile poprawiło się
dopasowanie modelu po dodaniu zmiennych objaśniających do modelu zerowego. Jednym z
takich wskaźników jest skorygowany wskaźnik R2 McFaddena, teoretycznie przyjmujący
wartości z przedziału [0,1]. Korekta wskaźnika polega na nałożeniu kary za liczbę
szacowanych parametrów modelu (z wyłączeniem progów odcięcia), wskaźnik liczy się ze
wzoru:
(25) R2aF = 1 -
ln Lfit−pln L0
,,
gdzie lnLfit to logarytm funkcji wiarygodności badanego modelu, lnL0 to logarytm funkcji
wiarygodności modelu zerowego, a p to liczba parametrów szacowanego modelu. Pod tym
względem wybrany model również jest najlepszy spośród analizowanych modeli, a
wskaźnik przyjmuje wartość równą 0,16. Niektóre z analizowanych modeli cechowały się
wyższymi wartościami współczynnika, ale po korekcie o liczbę szacowanych parametrów
okazał się wybrany model.
Zdolności predykcyjne modelu możemy ocenić na podstawie zliczeniowego
wskaźnika R2. Można go wyliczyć na podstawie tablicy trafności, dzieląc liczbę poprawnie
obserwacji przez liczbę wszystkich obserwacji. Model poprawnie klasyfikuje 62%
klasyfikacji. Niemniej jednak należy mieć na uwadze również wartość skorygowanego
wskaźnika determinacji, uwzględniającego we wzorze najliczniejszą grupę, do której trafienie
43
jest najbardziej prawdopodobne. Korekta wskaźnika, polegająca na odjęciu od licznika i
mianownika 83, czyli liczebności największej grupy, powoduje spadek wartości do jedynie
0,11. Nawet tak niska wartość uznajemy za akceptowalną w przypadku indywidualnych
danych, mając jednak na uwadze słabą zdolność do trafnej prognozy poczucia szczęścia na
podstawie wybranych cech.
IV.2.3 Interpretacja
Podstawa interpretacja modelu, opierająca się jedynie na kierunkach zależności
określonych przez znaki stojące przed parametrami ogólnie jest zgodna z wynikami wielu
dotychczasowych badań:
1. Ocena zdrowia na najwyższym poziomie pozytywnie wpływa na poczucie szczęścia.
Dobre zdrowie jako czynnik przyczyniający się lepszej ocenie poczucia szczęścia nie
dziwi, jest zgodny z intuicją i potwierdzony w licznych badaniach (opisane np. w
Sachs, 2013). Tylko najwyższa ocena zdrowia wykazywała istność statystyczną w
szeregu analizowanych modeli. Nie stwierdzono natomiast by przewlekłe choroby,
bądź niskie oceny zdrowia negatywnie wpływały na poczucie szczęścia. Należy w tym
miejscu wspomnieć oczywiście o zagrożeniu odwrotnej zależności przyczynowo-
skutkowej, co tyczyć się będzie również innych zmiennych. Rzeczywista sytuacja
może być taka, że osoby szczęśliwe, lepiej oceniają niektóre aspekty swojego życia
niż inni. Kolejnym utrudnieniem interpretacji jest brak określonej skali w wielu
pytaniach gdzie respondenci odpowiadają zgodnie z własną oceną. Jednakowy stan
zdrowia dwoje respondentów może oceniać zupełnie odmiennie – wszystko zależy od
subiektywnych kryteriów jakie przyjmują. Zakłada się jednak, że grupa jest względnie
homogeniczna pod względem kryteriów, a model ma wskazać przede wszystkim
kierunki zależności.
2. Wyższa ocena zadowolenia z poziomu dochodów w gospodarstwie domowym ma
dodatni wpływ na poczucie szczęścia. Zależność ta jest dosyć intuicyjna i dogłębnie
przeanalizowana w literaturze, (por. Easterlin, 1974, DiTella i inni, 1998). Absolutne
poziomy dochodów nie są istotnymi zmiennymi objaśniającymi w modelu, a jedynie
zadowolenie z poziomu dochodów.
3. Osoby chodzące do kościoła nie rzadziej niż raz w tygodniu lepiej oceniają swoje
poczucie szczęścia niż inni. Co ciekawe nie stwierdzono żadnej zależności między
44
odpowiedziami na pytanie „Jak ważna jest religia w Twoim życiu?” a poczuciem
szczęścia. Może wynikać to z faktu, iż deklaracja, że religia jest ważna nie koniecznie
jest jednoznaczna z utożsamianiem się ze wspólnotą religijną i członkostwem w
nabożeństwach, które bardziej przyczyniają się poczuciu szczęścia. Osoby, które
deklarują że religia jest ważna w ich życiu, niekoniecznie muszą rzeczywiście religię
poważnie traktować, a jedynie chcieć żeby tak było. Osoby chodzące do kościoła
należałoby uznać raczej za takie, które dają wyraz temu jak ważna religia jest w ich
życiu. Żadna z osób uczestniczących w badaniu, która chodzi do kościoła
przynajmniej raz w tygodniu nie była nieszczęśliwa.
4. Osoby mieszkające na wsi oceniają swoje poczucie szczęścia gorzej niż mieszkający
w miastach. Warto zwrócić uwagę na fakt, iż zależność ta wyraża się nie tylko w
ujemnym znaku przed zmienną miejsc0 w tym modelu, ale również dodatnimi
znakami przed zmiennymi określającymi zamieszkanie w dużych miastach w
alternatywnych modelach. Możemy interpretować to jako przejaw większych
możliwości jakie stoją często przed mieszkańcami miast, nieporównywalnej ofercie
kulturalnej, lepszym dostępie do wielu zasobów, możliwości kontaktów z szerszym
gronem osób, braku zamknięcia w małej grupie społecznej.
Interpretacja wyżej opisanych zmiennych godzi się z intuicją i nie powinna budzić
większych wątpliwości. Zdumiewać może natomiast parametr przy zmiennej ue_BIN, która
wyraża poczuwanie się do bycia członkiem Unii Europejskiej. Wartość ujemna sugeruje, że
osoby, które czują się członkami UE są mniej szczęśliwe. Interpretując ten parametr należy
mieć na uwadze bieżącą sytuację polityczno-gospodarczą w Polsce i Unii Europejskiej. Unia
europejska wciąż boryka się z następstwami kryzysu, większość krajów strefy euro wciąż
tkwi w recesji, w szczególności gospodarki Włoch, Francji i Hiszpanii, gdzie bezrobocie,
szczególnie wśród ludzi młodych wciąż wzrasta. Między innymi przez to w wielu krajach
członkowskich Wspólnoty rośnie popularność ruchów antyunijnych, które w połączeniu z
niepewną sytuacją gospodarczą przyczyniają się do popularniejszych rozważań na temat
szans UE na przetrwanie i uniknięcie rozpadu. Te i szereg innych czynników mogą być
źródłem zatroskania o losy Unii osób, które czują się jej członkami. Z drugiej strony osoby
które nie czują się członkami Unii, mogą być przeciwnikami członkostwa, albo nie być w
ogóle zainteresowane sytuacją polityczną. Dla nich problemy Unii mogą być mniejszym
zmartwieniem, lub nawet powodem do radości, potwierdzenia swoich poglądów. Tym
niemniej, na uzyskany wynik oszacowania należy jednak patrzeć z dużą ostrożnością.
45
Najważniejsza jednak pozostaje interpretacja parametru odpowiadającego gęstości
sieci respondenta. Przede wszystkim jej istotność widoczna w szeregu modeli pozwala
przypuszczać, iż gęstość sieci społecznej rzeczywiście może w pewnym stopniu przyczyniać
się do poczucia szczęścia, co jest równoznaczne z potwierdzeniem pierwszej hipotezy
postawionej na początku pracy. Samo jednak potwierdzenie zależności nie wystarczy, należy
zastanowić się co to może oznaczać i jakie są tego przyczyny.
Ujemny znak parametru przed logarytmem współczynnika gęstości sieci oznacza, że
mniejsza gęstość wiąże się z większym poczuciem szczęścia. Co może to oznaczać? Gęstość
sieci kontaktów respondentów to stosunek liczby połączeń między znajomymi na portalu
facebook do potencjalnej ich liczby. Jeżeli wskaźnik przyjmowałby wartość równą 1
oznaczałoby to iż graf połączeń między jego znajomymi jest pełny, czyli każdy zna się z
każdym. Sytuacja taka jest bardzo mało prawdopodobna, szczególnie kiedy analizujemy
jedynie grafy powyżej 100 wierzchołków. Gęstość sieci równa 0, oznaczałaby że graf
pozbawiony jest jakichkolwiek połączeń. Niższą gęstość sieci możemy kojarzyć z większą
liczbą peryferyjnych węzłów, takich, które mają bardzo mało lub żadnych wspólnych
znajomych z respondentem (oprócz niego samego). Takie elementy sieci mogą być
przykładem słabych powiązań (ang. weak ties). Niższa gęstość sieci może stanowić o
większej liczbie tego typu relacji niż w sieci gęstszej, która może składać się przede
wszystkim z najbliższych znajomych respondenta (Granovetter, 1983). Słabe powiązania
mogą wiązać się z dostępem do większej liczby źródeł informacji i możliwością w
pośredniczeniu w jej przepływie wewnątrz sieci, przyjmowania roli „brokera informacji”.
Tym samym powiązania takie mogą sprzyjać w wielu sytuacjach – szukaniu pracy,
rozprzestrzeniania informacji do różnych grup, podczas szukania wsparcia.
Gęstość sieci możemy rozumieć jednak na wiele sposobów, a dokładniejsza analiza
tego co możemy rozumieć pod tym pojęciem w kontekście sieci kontaktów społecznych
wykracza poza zakres tej pracy. Należy również podkreślić, że statystyka ta wyliczona została
na podstawie list znajomych na facebooku, a portal ten jest specyficznym przypadkiem pola
interakcji międzyludzkich, niekoniecznie tożsamym z sytuacją w świecie rzeczywistym.
Wyniki badania zdają się jednak sugerować, iż gęstość sieci społecznej jednostki może mieć
wpływ na jej poczucie szczęścia. Nie opłaca się posiadać bardzo gęstej sieci kontaktów,
korzystniej jest pełnić funkcję „mostu” między różnymi grupami społecznymi.
46
Tabela 4. Efekty krańcowe
Zmienna dy/dx Standard Error z P>|z|
95% Confidence
IntervalX
ln_density -0,16 0,08 -1,94 0,05 -0,32 0 -2,75doch_zad 0,07 0,02 4,05 0 0,04 0,11 6,76
zdrowie_bdobry 0,25 0,08 3,34 0 0,1 0,4 0,42miejsc0 -0,2 0,05 -4,01 0 -0,31 -0,1 0,1ue_BIN -0,27 0,11 -2,53 0,01 -0,48 -0,06 0,8
kosciol_czesciej_MOD 0,3 0,1 2,98 0 0,1 0,5 0,23
Źródło: Opracowanie własne
Dokładniejsza interpretacja wartości parametrów opiera się na efektach krańcowych i
ilorazach szans. Efekty krańcowe informują o zmianach prawdopodobieństw przynależności
do różnych kategorii w zależności od zmian wartości zmiennych objaśniających.
Wartość 0,07 odpowiadająca efektowi krańcowemu zmiennej opisującej
zadowolenie z dochodów interpretujemy następująco: wyższa o 1 ocena zadowolenia z
poziomu dochodów powoduje wzrost prawdopodobieństwa wyboru odpowiedzi Bardzo
szczęśliwy o 0,07. Prawdopodobieństwo to zwiększa się o 0,25 jeżeli respondent ocenia swój
stan zdrowia na bardzo dobry, a fakt zamieszkiwania na wsi zmniejsza je o 0,2. Krańcowy
przyrost logarytmu gęstości sieci powoduje spadek prawdopodobieństwa wyboru kategorii
Bardzo szczęśliwy o 0,17.
Tabela 5. Ilorazy szans
szczescie_MODOdds Ratio Standard
Error z P>|z| 95% Confidence Interval
ln_density 0,42 0,19 -1,92 0,05 0,17 1,02doch_zad 1,50 0,15 4,07 0,00 1,23 1,81zdrowie_bdobry 3,80 1,51 3,36 0,00 1,74 8,27miejsc0 0,19 0,12 -2,72 0,01 0,06 0,63ue_BIN 0,27 0,13 -2,72 0,01 0,11 0,70
kosciol_czesciej_MOD4,21 1,91 3,16 0,00 1,72 10,26
Źródło: Opracowanie własne
47
Interpretując ilorazy szans możemy stwierdzić, że osoby oceniające swój stan
zdrowia na bardzo dobry mają o 280% większe szanse na wyższą ocenę swojego poczucia
szczęścia, niż osoby gorzej oceniające swe zdrowie. Ponadto, osoby mieszkające na wsi mają
o 81% niższe szansę na lepszą ocenę poczucia szczęścia, niż osoby mieszkające w małych czy
większy miastach. Osoba, dla której logarytm gęstości sieci jest większy o jednostkę niż w
przypadku innej osoby, nieróżniącej się pod względem pozostałych cech, ma o 58% niższe
szanse na lepszą ocenę dochodu.
IV.2.4 Porównanie dopasowania i jakości modeli
Tabele zamieszczone na końcu rozdziału zestawiają miary dopasowania i wartości
parametrów modeli. Tabela 6 zawiera prezentuje różne warianty wybranego modelu,
uwzględniające różne zestawy zmiennych objaśniających. Tabela 7 przedstawia analogiczne
wyniki uzyskane dla modeli zbudowanych jedynie w oparciu o statystyki sieci.
Opisany wyżej model oznaczony jest w tabeli numerem 3. Tabela w kolumnach
przedstawia kolejne modele, w wierszach zaprezentowane są kolejne statystyki. Górna część
tabeli zestawia miary jakości poszczególnych modeli, wskaźnik pseudo R2, zliczeniowy R2,
dopasowany zliczeniowy R2, R2 McKelvey i Zavoiny, dopasowany R2 Mc Faddena, wartość
ilorazu funkcji wiarygodności, kryteria informacyjne. Dolna część tabeli zestawia zmienne
wykorzystane w modelach. Wartości w nawiasach, to p-value, obok niej wartości
współczynników, gwiazdki zaś oznaczają, że zmienna w modelu nie występuje. Pierwsza
tabela, oprócz zmiennych opisanych wyżej w modelu zawiera zmienne takie jak:
miejsc500k – zmienna binarna, 1 gdy miejsce zamieszkania to miasto 101-500 tyś
mieszkańców
miejsc501k – zmienna binarna, 1 gdy miejsce zamieszkania to miasto powyżej 500
tyś mieszkańców
48
sport_BIN3 - zmienna binarna, 1 gdy respondent uprawia sport min 3 godziny w
tygodniu
ufność - zmienna binarna, 1 gdy respondent twierdzi że Ludziom można generalnie
ufać
doch_num16k - zmienna binarna, 1 gdy zarobki w gospodarstwie na osobę
przekraczają 16 tyś PLN
doch_num8_16k - zmienna binarna, 1 gdy zarobki w gospodarstwie na osobę w
przedziale 8-16 tyś zł
doch_num3_5_8k - zmienna binarna, 1 gdy zarobki w gospodarstwie na osobę w
przedziale 3,5-8 tyś zł
doch_num2_3_5k - zmienna binarna, 1 gdy zarobki w gospodarstwie na osobę w
przedziale 2-3,5 tyś zł
doch_num_1k_2k - zmienna binarna, 1 gdy zarobki w gospodarstwie na osobę w
przedziale 1-2 tyś zł
Ostatni z prezentowanych modeli uwzględnia jako zmienną objaśniającą wysokość
dochodów w przeliczeniu na osobę w gospodarstwie domowym. Zmienne binarne oznaczają
przynależność do grupy osób o określonych dochodach. Wszystkie zmienne okazują się
nieistotne w modelu, zupełnie inaczej niż w przypadku oceny zadowolenia z poziomu
dochodów, istotnej we wszystkich analizowanych modelach. Wpływ dochodów na poczucie
szczęścia jest jednak w literaturze dokładnie opisany (Easterlin, 1974, DiTella, 1998), a fakt,
że na podstawie zgromadzonych danych jej nie obserwujemy nie pozwala postulować braku
tej zależności. Przedziałowa forma pytania wynikała z charakteru badania przeprowadzonego
za pomocą internetowej ankiety, w której należało dodatkowo udostępnić informacje z
facebooka. Bezpośrednie pytanie o dochody mogłoby być przyczyną rezygnacji z ankiety,
dlatego zdecydowano się na taką formę pytania.
Modele 1 i 2 odróżnia brak zmiennych zdrowie_bdobry i ufność w drugim z nich.
Mimo ich braku, miary dopasowania nie ulegają praktycznie zmianie. W modelach 1, 2 i 3
zmienne opisujące miejsce zamieszkania są istotne, zarówno opisujące fakt mieszkania na wsi
jak i zamieszkiwanie w dużym mieście. Co więcej zmienne te mają przeciwne znaki, co może
wskazywać na to, że wielkość miejsca zamieszkania może pozytywnie wpływać na poczucie
szczęścia. Interpretacji takiej zależności jest wiele, najogólniej nazwać je możemy
możliwościami stwarzanymi przez życie w większym mieście.
49
Warto porównać również modele zawierające informacje o gęstości i te z niej
korzystające. W tabeli zaprezentowane są dwie pary tego typu, modele 4 i 5 oraz 6 i 7.
Modele uwzględniające gęstość sieci mają lepsze zliczeniowe wskaźniki dopasowania do
danych R2, ale wskaźniki opierające się na wartości funkcji wiarygodności, R2 McFaddena czy
McKelveya i Zavoiny, wskazują na lepszą jakość modeli uwzględniających zmienną density.
Kryteria informacyjne również wskazują na korzyść modeli 4 i 6. Wyniki takie potwierdzają
w pewnym stopniu zasadność wykorzystania zmiennej lndensity w modelu.
Tabela 6. Wyniki estymacji wybranych modeli, miary dopasowania oraz parametry zmiennych objaśniających
Model 1 2 3 4 5 6 7 8
Pseudo R2 0,23 0,22 0,22 0,19 0,16 0,15 0,13 0,23
Count R2 0,67 0,67 0,62 0,63 0,64 0,61 0,65 0,65
Adj. Count R2 0,23 0,23 0,10 0,13 0,15 0,08 0,18 0,18
McKelvey & Zavoina's R2: 0,44 0,44 0,41 0,37 0,32 0,30 0,27 0,64
McFadden's Adj R2: 0,15 0,15 0,16 0,14 0,12 0,11 0,10 0,11
Log-Lik Full Model: -102,93 -102,93 -104,47 -108,27 -111,72 -113,16 -115,50 -108,70
AIC:
1,58 1,58 1,56 1,60 1,64 1,66 1,67 1,75
BIC: -455,13 -455,13 -466,95 -464,33 -462,40 -459,52 -459,81 -413,77
Współczynniki przy parametrach:
ln_density -0,92 (0,05) -0,92 (0,05) -0,87 (0,05) -1,12 (0,01) * -0,89 (0,03) * -0,86 (0,06)
doch_zad 0,41 (0) 0,41 (0) 0,4 (0) 0,38 (0) 0,37 (0) 0,42 (0) 0,41 (0) 0,36 (0)
zdrowie_bdobry 0,99 (0,02) * 1,33 (0) 1,31 (0) 1,22 (0) 1,09 (0) 1,04 (0) 1,1 (0,01)
kosciol_czesciej_MOD 1,38 (0,01) 1,38 (0,01) 1,44 (0) 1,36 (0) 1,17 (0,01) * * 1,47 (0)
ue_BIN -1,17 (0,02) -1,17 (0,02) -1,29 (0,01) -1,26 (0,01) -0,89 (0,04) -1,13 (0,02) -0,85 (0,05) -1,2 (0,02)
miejsc0 * * -1,68 (0,01) * * * * *
miejsc500k 1,05 (0,05) 1,05 (0,05) * * * * * 1,2 (0,03)
50
miejsc501k 1,06 (0,05) 1,06 (0,05) * * * * * 1,15 (0,04)
sport_BIN3 0,52 (0,06) 0,52 (0,06) * * * * * 0,45 (0,14)
ufność0,64 (0,1) * * * *
* * 0,57 (0,15)
doch_num16k * * * * * * * 14,01 (0,99)
doch_num8_16k * * * * * * * -0,43 (0,65)
doch_num3_5_8k * * * * * * * 0,36 (0,68)
doch_num2_3_5k * * * * * * * 0,81 (0,24)
doch_num_1k_2k * * * * * * * 0,44 (0,5)
Uwaga: w nawiasach podano krytyczne wartości p
Źródło: Opracowanie własne
Tabela 7 jest zestawieniem modeli w oparciu jedynie o zmienne opisujące sieci. W
kolumnach zaprezentowane są kolejne modele z jedną zmienną objaśniającą – wybraną
statystyką sieci. Ostatnia kolumna prezentuje obliczenia dla modelu opierającego się na
wszystkich statystykach sieci. Jak widzimy modele te nie są bardzo źle dopasowane do
danych, czemu wyraz dobrze daje zliczeniowy skorygowany wskaźnik R2 na poziomie 0. Inne
miary dopasowania modeli są na podobnych poziomach. Model uwzględniający wszystkie
obliczone statystyki sieci jako zmienne objaśniające ma podobne wyniki.
Tabela 7. Wyniki estymacji modeli w oparciu o statystyki sieci, miary dopasowania oraz parametry zmiennych objaśniających
Zmienna objaśniająca density clust avg_path degree diameter components Wszystkie sieciowe
Pseudo R2
0,01 0,00 0,00 0,00 0,00 0,00 0,01
51
Count R2 0,58 0,58 0,58 0,58 0,58 0,58 0,58
Adj. Count R2 0,00 0,00 0,00 0,00 0,00 0,00 0,00
McKelvey & Zavoina's R2: 0,02 0,00 0,00 0,00 0,00 0,00 0,03
McFadden's Adj R2: -0,02 -0,02 -0,02 -0,02 -0,02 -0,02 -0,05
Log-Lik Full Model: -132,31 -133,22 -133,13 -133,21 -133,14 -133,10 -131,71
AIC: 270,63 272,44 272,26 272,42 272,28 272,21 279,43
BIC: 3,14 4,96 4,77 4,93 4,79 4,72 26,79
Współczynniki przy parametrach:
density
-7,36 (0,18)
13,91 (0,1)
clust
-0,27 (0,91)
2,39 (0,44)
avg_path
0,13 (0,66)
-0,49 (0,47)
degree
0 (0,84) 0 (0,51)
diameter
0,03 (0,67)
0,07 (0,68)
components 0,01 (0,62) 0,01 (0,76)
Uwaga: w nawiasach podano krytyczne wartości p
Źródło: Opracowanie własne
52
Rozdział V. Interpretacja wyników
W pierwszej części niniejszego rozdziału opisano efekt wykorzystania zmiennych
opisujących sieci w porównaniu do modeli nie uwzględniających tych zmiennych, Drugi
podrozdział poświęcony jest wpływowi gęstości sieci na poczucie szczęścia respondenta.
Ostatnia część rozdziału poświęcona jest rozważaniom na temat znaczenia gęstości sieci
społecznej dla człowieka i wnioskom płynącym z badania.
V.1 Wpływ uwzględnienia zmiennych opisujących sieć na
wyniki estymacji
W pracy badane były zależności między poczuciem szczęścia a statystykami sieci,
wyliczonymi na podstawie zgromadzonych danych. Jedyną zmienną istotną w modelu
opisującym poczucie szczęścia spośród statystyk sieci jest gęstość. Wykorzystywany był
logarytm tej wartości, nieco lepiej funkcjonujący w modelu niż pierwotne wartości zmiennej,
zawężone do małego zakresu [0,01; 0,20]. W poprzednim rozdziale opisano dwie grupy
modeli, jedna uwzględnia szereg cech opisanych w ankietach, druga – wyłącznie na
statystykach sieci internetowych kontaktów respondentów. Opisane w pierwszej grupie
modele zawierające pośród zmiennych objaśniających logarytm gęstości sieci są lepsze ze
względu kryteria informacyjne niż modele bez tej zmiennej, gorzej jednak dopasowują się do
danych według zliczeniowego współczynnika determinacji R2. Modele z drugiej grupy, w
których za pomocą każdej statystyki sieci oddzielnie objaśniano poczucie szczęścia są
nieistotne statystycznie. Jedynie w modelu z ln_density p-value równe jest 0,10.
Wynik taki nie uprawnia do stwierdzenia, że liczba znajomych na facebooku nie
wpływa na poczucie szczęścia użytkowników tego portalu, jednak dostępne dane nie
potwierdzają takiej zależności. Natomiast logarytm gęstości sieci był zmienną istotną w
szeregu modeli, między innymi w modelu uwzględniającym takie zmienne jak zadowolenie z
poziomu dochodów, binarne zmienne określające bardzo dobry stan zdrowia, częste wizyty
kościele, poczuwanie się do członkostwa w UE i fakt zamieszkiwania na wsi.
53
V.2 Wpływ zmiennych opisujących strukturę sieci na poczucie
szczęścia
Jedyną zmienną opisującą strukturę sieci, istotną w szeregu modeli jest logarytm
gęstości sieci. Ujemny znak parametru wskazuje na to, że większa gęstość sieci może wiązać
się z mniejszym poczuciem szczęścia. Stwierdzenie takie jednak nie wystarczy, należy
bowiem zastanowić się nad tym, co może to oznaczać. Gęstość sieci możemy interpretować
jako wskaźnik mówiący o sile powiązań między członkami sieci (Granovetter, 1983). Nie
dysponujemy badaniami zgłębiającymi interpretacje wskaźnika w kontekście sieci na
facebooku. Możemy przyjąć założenie, że mniejsza gęstość sieci kojarzona może być z
większą liczbą silnych powiązań między członkami sieci, a większa z przewagą słabych
powiązań. Wtedy interpretacja parametru prowadziłaby do wniosku, że słabe powiązania
przyczyniają się do poczucia szczęścia jednostki, i im ich więcej, tym lepiej. Rzetelna analiza
tego co jeszcze możemy rozumieć pod pojęciem gęstości sieci, i czy rzeczywiście wielkość ta
ma może mieć wpływ na poczucie szczęścia jednostki wymaga jednak o wiele dokładniejszej
analizy, na dużo większej, reprezentatywnej próbie.
V.3 Wnioski
Badanie miało na celu weryfikację hipotezy mówiącej o zależności między
poczuciem szczęścia a strukturą indywidualnej sieci społecznej. Strukturę sieci opisano za
pomocą statystyk takich jak rozpiętość, liczba węzłów (znajomych), liczba niezależnych
podgrup (komponentów) sieci, przeciętna najkrótsza ścieżka, wskaźnik grupowania i gęstość
sieci. Przyjmując, że sieci kontaktów tworzone na portalu facebook odzwierciedlają
stosunkowo wiernie sieci społeczne w świecie rzeczywistym, na podstawie modeli
mikroekonometrycznych dowiedziono zależności między gęstością sieci a poczuciem
szczęścia, potwierdzając tym samym podstawową hipotezę postawioną na początku badania,
mówiącą o wpływie struktury sieci na poczucie szczęścia. W przypadku pozostałych miar
sieci, w tym liczby znajomych, nie stwierdzono zależności między ich wielkościami a
zadeklarowanym przez ankietowanych poczuciem szczęście. Należy zwrócić uwagę na fakt,
iż próba na której opiera się badanie nie była reprezentatywna i bazowała na wynikach
internetowych ankiet.
54
Wyniki badania sugerują, że większa gęstość sieci może być kojarzona z niższym
poczuciem szczęścia. Gęstość sieci to stosunek obserwowanej liczby połączeń między
węzłami sieci do maksymalnej ich liczby. Gęstość sieci informuje zatem, w jakim stopniu
znajomi respondenta znają się ze sobą (nie w sensie intensywności znajomości, ale liczby
wspólnych znajomych). Wyższą gęstość sieci kojarzyć można tym samym z większymi
skupiskami znajomych, w obrębie których większość osób się zna, lub z mniejszą liczbą
kontaktów, z którymi respondent nie ma wielu wspólnych znajomych. Prowadzi to do
wniosku o pozytywnym wpływie słabych połączeń na poczucie szczęścia. Moc słabych
połączeń potwierdzona jest w badaniach rynku pracy, gdzie wskazano ich pozytywny wpływ
na szanse znalezienia zatrudnienia.
Niska gęstość sieci może świadczyć również o większej liczbie środowisk , grup
społecznych w których obraca się badany. Nie muszą one być zupełnie niezależne, tj.
niektórzy członkowie grup mogą znać się z członkami innej podgrupy, takie przypadki są
jednak w mniejszości. Tym samym można wnioskować, że zróżnicowanie środowisk w
jakich obraca się człowiek może dodatnio oddziaływać na poczucie szczęścia. Możemy
kojarzyć to z mnogością bodźców, idei, sposobów postrzegania świata w różnych grupach w
jakich obraca się człowiek. Są to jednak tylko dywagacje i przypuszczenia, należy podkreślić,
iż badanie wskazało tylko na ujemną zależność między gęstością sieci kontaktów na portalu
facebook a poczuciem szczęścia wśród uczestników badania.
Ostatecznie, należy również mieć na uwadze, iż struktura sieci społecznej człowieka
może wcale nie wpływać na poczucie szczęścia, a wręcz przeciwnie, być jego pochodną.
Sytuację taką łatwo wyobrazić sobie w kontekście tego badania – to szczęśliwi ludzie, będąc
osobami pogodnymi i przyjaznymi mogą tworzyć rozproszone struktury sieciowe, łatwo
nawiązując kontakty z innymi.
55
ZAKOŃCZENIE
Celem pracy było określenie czy istnieje zależność między strukturą sieci społecznej
człowieka a jego poczuciem szczęścia oraz wskazanie cech sieci decydujących o tej
zależności. Cel ten został zrealizowany dzięki opracowaniu uporządkowanego modelu
logitowego, zbudowanego w oparciu o szereg danych indywidualnych uzyskanych za pomocą
internetowej ankiety, oraz statystyk sieci społecznej respondenta, obliczonych na podstawie
danych z portalu facebook.
Badanie potwierdziło postawioną na wstępie hipotezę i wskazując na zależność
między strukturą sieci a poczuciem szczęścia. Niemniej potwierdzenie wysnutych wyżej
wniosków wymaga dalszych badań. Przede wszystkim powinny opierać one się na
większych, reprezentatywnych próbach. Ponadto, należy mieć na uwadze różnice między
rzeczywistą siecią społeczną a sieciami ilustrowanymi w portalach internetowych. Niestety
dokładny opis rzeczywistej sieci powiązań jednej osoby byłby nie lada wyzwaniem, a
zgromadzenie zbioru danych tego typu, niekoniecznie nawet zbioru reprezentatywnego, ale
choćby wystarczającego do budowy modelu byłoby wielkim przedsięwzięciem.
Podstawowym mankamentem danych z facebooka jest ich wybiórczość (nie każda osoba
znajoma jest w sieci znajomych na facebooku, np. przełożony, czy ekspedientka w
osiedlowym sklepie), kolejnym – brak danych o intensywności tych kontaktów,
częstotliwości.
Mimo tych wad, wyniki badania generalnie są zgodne z dorobkiem naukowych
rozważań na temat szczęścia, a jednocześnie łączą rozważania na temat szczęścia z nauką o
sieciach społecznych.
Badanie opierało się na stosunkowo mało liczebnym zbiorze danych – potwierdzenie
uzyskanych wyników na większej próbie pozwoliłoby na stwierdzenie faktycznej zależności
między strukturą sieci społecznej a poczuciem szczęścia. Ponadto, większa próba
umożliwiłaby również analizę satysfakcji z życia, którą przyjęło się określać na większej skali
niż poczucie szczęścia, tym samym zbyt niska liczebność niektórych kategorii uniemożliwiła
taką analizę w tej pracy. Ponadto, większy zbiór danych pozwoliłby również na analizę
wpływu struktury sieci w różnych grupach wiekowych, czy społecznych.
56
BibliografiaKsiążki1. Goyal, S. (2007). Connections - An Introduction to the Economics of Networks. Princeton:
Princeton University Press.
2. Gruszczyński, M. (2012). Mikroekonometria. Modele i metody analizy danych indywidualnych. Warszawa: Wolters Kluwer.
3. Jackson, M. O. (2008). Social and Economic Networks, Princeton: Princeton University
Press.
4. Maddala, G.S. (2006). Ekonometria. Warszawa: PWN.
5. Tatarkiewicz, W. (1962). O szczęściu, Warszawa: PWN.
6. Watts, D. J. (1971). Small Worlds: The Dynamics of Networks between Order and
Randomness, Princeton: Princeton University Press.
Artykuły i studia
1. Backstrom, L., Boldi, P., Rosa, M., Ugander, J., Vigna, S., (2012). Four Degrees of Separation, working paper, arXiv:1111.4570.
2. Blanchflower, D.G., Oswald, A., (2004). Well-Being over Time in Britain and the US. Journal of Public Economics 88(7-8), 1359-1386
3. Christakis, N. A., & Fowler, J. H. (2009). Dynamic spread of happiness in a large social network: Longitudinal analysis of the Framingham heart study social network. British Medical Journal, 338(7685), 23–27.
4. Di Tella, R., MacCulloch, R., Oswald, A., (2003). The Macroeconomics of Happiness. The Review of Economics and Statistics, November 2003, 85(4): 809– 827
5. Diener, E., & Seligman, M. E. P. (2002). Very happy people. Research report. Psychological Science, 13(1), 81–84.
6. Diener, E., Suh, E. M., Lucas, R. E., & Smith, H. L. (1999). Subjective well-being: Three decades of progress. Psychological Bulletin, 125, 276–302
7. Easterlin, R., (1974). Does Economic Growth Improve the Human Lot? Some Empirical Evidence. W: David, P., Reder, R.,: Nations and Households in Economic Growth: Essays in Honour of Moses Abramovitz. New York: Academic Press, Inc.
8. Frey, B., Stutzer, A., (2002). What Can Economists Learn from Happiness Research? Journal of economic Literature, Vol. 40, No. 2. (Jun., 2002), 402-435.
9. Gamble, A., & Garling, T. (2012). The relationships between life satisfaction, happiness, and current mood. Journal of Happiness Studies, 13, 31–45.
10. Granovetter, M., (1973). The Strength of Weak Ties. American Journal of Sociology, Volume 78, Issue 6 (May, 1973), 1360-1380
11. Granovetter, M., (1983). The Strength of Weak Ties: A Network Theory Revisited. Sociological Theory, Vol.1 (1983), 201-233
57
12. Growiec, K., Growiec, J., (2013). Trusting Only Whom You Know, Knowing Only Whom You Trust: The Joint Impact of Social Capital and Trust on Happiness in CEE Countries. Journal of Happiness Studies (w druku)
13. Helliwell, J., Layard, R., Sachs, J., (2012). World happiness report. New York: The Earth Institute, Columbia University.
14. Kanai, R., Bahrami, B., Roylance, R., Rees, G. (2012), Online social network size is reflected in human brain structure, Proceedings of Royal Society B, 279(1732), s. 1327-1334.
15. Maslow, A.H. (1943). A theory of human motivation. Psychological Review, 50(4), 370–396
16. McFadden, D., (1974). Conditional logit analysis of qualitative choice behavior. W Zarembka, P., (ed.), Frontiers in Econometrics. New York: Academic Press.
17. McKevely, R., Zavoina, W., (1975). A statistical model for the analysis of ordinal level dependent variables. Journal of Mathematical Sociology, Vol.4, 103-120
18. Schwartz, H.A., Eichstaedt, J.C., Kern, M.L., Dziurzynski, L., Ramones S.M., i inni (2013). Personality, Gender, and Age in the Language of Social Media: The Open-Vocabulary Approach. PLoS 8(9): e73791. doi:10.1371/journal.pone.0073791
19. Travers, J., Milgram, S., (1969). An Experimental Study of the Small World Problem. Sociometry, Vol. 32, No. 4, 425-443.
20. Ugander, J., Karre, B., Backstrom, L., Marlow, C., (2011). The Anatomy of the Facebook Social Graph, working paper, arXiv:1111.4503
21. Watts, D. J., Strogatz, S. H., (1998). Collective dynamics of 'small-world' networks. Nature, Vol. 393, No. 6684., 409-10
22. Putnam, R. (2000). Bowling alone. Collapse and revival of American community. New York: Simon Schuster
Strony internetowe
1. http://jacekgadzinowski.natemat.pl/61363,fakty-o-grono-net-i-polskim-social-media
2. Measuring Facebook’s economic impact in Europe, Deloitte, 2012,
http://www.deloitte.com/view/en_GB/uk/industries/tmt/media-industry/
df1889a865f05310VgnVCM2000001b56f00aRCRD.htm
Inne źródła 1. Zintegrowany kwestionariusz World Values Survey 10981-2008 z dnia 09-06-2011
58
59
SPIS TABEL
Tabela 1. Statystyki opisowe miar sieci....................................................................................22
Tabela 2. Zależności między odpowiedziami na pytania o poczucie szczęście i satysfakcję z
życia, liczebności podgrup................................................................................30
Tabela 3. Uporządkowany model logitowy opisujący szczęście..............................................41
Tabela 4. Efekty krańcowe.......................................................................................................46
Tabela 5. Ilorazy szans..............................................................................................................47
Tabela 6. Wyniki estymacji wybranych modeli, miary dopasowania oraz parametry
zmiennych objaśniających.................................................................................50
Tabela 7. Wyniki estymacji modeli w oparciu o statystyki sieci, miary dopasowania oraz
parametry zmiennych objaśniających...............................................................51
60
SPIS WYKRESÓW
Wykres 1. Struktura demograficzna próby, podział w zależności od miejsca zamieszkania,
wieku i sytuacji zawodowej..............................................................................20
Wykres 2. Rozkład i dystrybuanta oceny zadowolenia z dochodów........................................21
Wykres 3. Rozkład i dystrybuanta oceny satysfakcji z życia...................................................21
Wykres 4. Histogram liczby znajomych (degree).....................................................................22
Wykres 6. Zestawienie gęstości sieci z liczbą znajomych respondentów................................23
Wykres 5. Histogram i dystrybuanta gęstości sieci..................................................................23
Wykres 8. Zestawienie liczby niezależnych podgrup w sieci z liczbą znajomych
respondentów....................................................................................................24
Wykres 7. Histogram i dystrybuanta liczby niezależnych podgrup sieci.................................24
Wykres 10. Zestawienie wskaźnika grupowania z liczbą znajomych respondentów...............25
Wykres 9.Wskaźnik grupowania - histogram i dystrybuanta...................................................25
Wykres 11. Średnia odległość między parą znajomych w sieci...............................................26
Wykres 12. Zestawienie przeciętnej długości ścieżki z liczbą znajomych respondentów......26
Wykres 13. Rozpiętość sieci - histogram i dystrybuanta..........................................................27
Wykres 14. Zestawienie rozpiętości sieci z liczbą znajomych respondentów..........................27
Wykres 15. Przeciętna liczba wspólnych znajomych - rozkład gęstości i dystrybuanta..........28
Wykres 17 Rozkład zmiennej Zadowolenie z życia w Europie, wg danych Instytutu Gallupa31
Wykres 18 Rozkład zmiennej Zadowolenie z życia w Europie wg danych European Social
Survey................................................................................................................31
Wykres 19 Rozkład zmiennej Ocena poziomu zadowolenia z życia wśród 144
ankietowanych...................................................................................................32
Wykres 20 Rozkład zmiennej objaśnianej - poczucia szczęścia - w wersji oryginalnej i
zmodyfikowanej................................................................................................33
61
SPIS ZAŁĄCZNIKÓW
1. Kwestionariusz ankiety
2. Wyniki ankiety
Badanie szczęścia
Szanowni Państwo,
niniejsza ankieta jest częścią badania prowadzanego w ramach pracy magisterskiej w Szkole Głównej Handlowej. Badam, czy struktura kontaktów, zobrazowana przez sieć znajomych na portalu Facebook, ma wpływ na subiektywną ocenę szczęścia.
Po udzieleniu odpowiedzi na pytania, proszę o załączenie pliku opisującego strukturę sieci Waszych znajomych na Facebooku - jest to kluczowe dla badania. Jeżeli nie korzystają Państwo z tego portalu, proszę o niewypełnianie ankiety.
Ankieta jest w pełni anonimowa i poufna - przesłane informacje nie będą dalej rozprowadzane, posłużą tylko i wyłącznie do zbudowania modelu opisującego szczęście.
Bardzo zależy mi na Państwa opinii, dlatego będę zobowiązany jeśli wypełnią Państwo ankietę internetową, co powinno zająć nie więcej niż 10 minut.
Zwracam się również z uprzejmą prośbą o przesłanie linku do ankiety znajomym i udostępnienie linku do niej na Facebooku'u.
W miarę możliwości proszę o korzystanie z przeglądarek innych niż Internet Explorer, np Chrome, Firefox czy Opera.
Z góry dziękuję za poświęcony czas,
Mateusz Sawka, facebook
Czy ogólnie rzecz biorąc, uważa Pan(i), że jest: *
Bardzo szczęśliwy(a) Raczej szczęśliwy(a) Raczej nieszczęśliwy(a) Bardzo nieszczęśliwy(a)
62
W jakim stopniu jest Pan(i) zadowolony(a) z sytuacji finansowej Pana(i) rodziny (gospodarstwa domowego)? Proszę ocenić na skali od 1 do 10 gdzie 1 oznacza, że jest Pan(i) całkowicie niezadowolony(a), a 10 – całkowicie zadowolony(a). *
Całkowicie niezadowolony(a) 2 3 4 5 6 7 8 9 W pełni
zadowolony(a)
Ocena
Jakie są miesięczne dochody netto (na rękę) na osobę w Pana/Pani gospodarstwie domowym? (Lub Pana/Pani własne dochody jeżeli utrzymuje się sam(a)i nie ma zobowiązań względem innych osób) *
Poniżej 1000 zł 1001-2000 zł 2001-3500 zł 3501-8000 zł 8001-16000 zł
Powyżej 16000 zł Czy pracuje Pan(i) obecnie? Jeśli tak to ile godzin średnio tygodniowo Pan(i) pracuje? Jeśli
ma Pan(i) więcej niż jedno miejsce zatrudnienia pracę proszę podać łączną liczbę godzin. *
Jestem zatrudniony(a) w pełnym wymiarze godzin (30 godzin tygodniowo lub więcej)
Jestem zatrudniony(a) w niepełnym wymiarze godzin (mniej niż 30 godzin tygodniowo)
Pracuję na własny rachunek Nie pracuję, jestem na emeryturze/rencie Nie pracuję,
zajmuję się domem Nie pracuję, jestem studentem/studentką/uczniem/uczennicą Nie
pracuję, jestem bezrobotny Inne (jakie?) Czy w ostatnim roku wykonywał(a) Pan(i) nieodpłatnie jakąś pracę lub świadczył(a) jakieś
usługi dla osób spoza rodziny bądź na rzecz organizacji społecznej? *
Tak Nie Czy ogólnie rzecz biorąc, uważa Pan(i), że: *
Większości ludzi można ufać Nigdy nie jest się zbyt ostrożnym w postępowaniu z ludźmi
Czy jest Pan(i) członkiem jakichś organizacji, stowarzyszeń, partii, komitetów, rad, grup religijnych, związków lub kół? *
Tak Nie
Proszę powiedzieć, w jakim stopniu uważa Pan(i) następujące sprawy za ważne w swoim życiu? *
Bardzo ważne Raczej ważne Niezbyt ważne W ogóle nieważne
Rodzina
Przyjaciele
Czas wolny
Polityka
Praca
63
Proszę powiedzieć, w jakim stopniu uważa Pan(i) następujące sprawy za ważne w swoim życiu? *
Bardzo ważne Raczej ważne Niezbyt ważne W ogóle nieważne
Religia
Czy interesuje się Pan(i) polityką?: *
bardzo się interesuję raczej się interesuję raczej się nie interesuję w ogóle się nie interesuję
Dyskutując o polityce, ludzie mówią o "lewicy" i "prawicy". Gdzie Pan(i) umieścił(a)by swoje poglądy na tej skali? *
Lewica 2 3 4 5 6 7 8 9 Prawica
Ocena
Nie licząc ślubów, chrztów i pogrzebów, jak często chodzi Pan(i) do kościoła? *
częściej niż raz na tydzień raz na tydzień raz w miesiącu w Boże Narodzenie,
Wielkanoc lub w inne święta raz na rok rzadziej niż raz na rok nigdy lub prawie nigdy
Zmieńmy temat. Proszę powiedzieć, jak często zdarza się Panu(i) zastanawiać nad sensem życia? *
Często Czasami Rzadko Nigdy Czy czuje się Pan(i) dumny(a) z tego, że jest Pan(i) Polakiem(Polką)? *
zdecydowanie tak raczej tak raczej nie zdecydowanie nie nie jestem Polakiem (Polką)
Ludzie mają różne wizje samych siebie i swojego miejsca w świecie. Korzystając z karty proszę powiedzieć na ile zgadza się Pan(i) bądź nie zgadza z następującymi stwierdzeniami dotyczącymi tego jak Pani postrzega samego(samą) siebie? *
Zdecydowanie się zgadzam Zgadzam się Nie zgadzam się Zdecydowanie się nie
zgadzam
Czuję się obywatelem świata
Czuję się członkiem mojej lokalnej społeczności
Czuję się członkiem narodu polskiego
Czuję się obywatelem
64
Ludzie mają różne wizje samych siebie i swojego miejsca w świecie. Korzystając z karty proszę powiedzieć na ile zgadza się Pan(i) bądź nie zgadza z następującymi stwierdzeniami dotyczącymi tego jak Pani postrzega samego(samą) siebie? *
Zdecydowanie się zgadzam Zgadzam się Nie zgadzam się Zdecydowanie się nie
zgadzam
Unii Europejskiej
Czuję się indywidualną jednostką
Proszę określić jak bezpieczny(a) czuje się Pan(i) w miejscu zamieszkania: *
Bardzo bezpieczny(a) Całkiem bezpieczny(a) Mało bezpieczny(a) Wcale nie czuję bezpieczeństwa
Czy cierpi Pan(i) na jakieś przewlekłe choroby? *
Tak Nie Ogólnie rzecz biorąc, jak określił(a)by Pan(i) swój obecny stan zdrowia? Jako: *
Bardzo dobry Raczej dobry Średni Zły Ile godzin w tygodniu przeciętnie poświęca Pan(i) na aktywność fizyczną – sport i rekreację
nie zwiazane z pracą? *
0 1-2 3-4 5-6 7 lub więcej Czy pali Pan(i) papierosy? *
Tak, nałogowo Tak, okazyjnie Nie i nigdy nie paliłem/paliłam Nie, ale kiedyś paliłem/paliłam
Czy jest Pan(i) w stałym związku z drugą osobą? *
Tak Nie Czy obecnie jest Pan(i): *
żonaty (zamężna) żyję w stałym związku bez ślubu rozwiedziony (rozwiedziona)
w separacji wdowcem (wdową) kawalerem (panną)
Ludzie korzystają z różnych źródeł informacji na temat wydarzeń w kraju i na świecie. Dla każdego z poniższych nośników informacji, proszę określić czy korzysta Pan(i) z nich do pozyskania informacji codziennie, tygodniowo, miesięcznie, rzadziej czy nigdy? *
codziennie raz w tygodniu raz w miesiącu rzadziej nigdy
Gazety codzienne
Tygodniki
Telewizja
Internet
Rozmowy ze
65
Ludzie korzystają z różnych źródeł informacji na temat wydarzeń w kraju i na świecie. Dla każdego z poniższych nośników informacji, proszę określić czy korzysta Pan(i) z nich do pozyskania informacji codziennie, tygodniowo, miesięcznie, rzadziej czy nigdy? *
codziennie raz w tygodniu raz w miesiącu rzadziej nigdy
znajomymi i współpracownikami
Poziom wykształcenia (jeżeli wciąż się Pan(i) kształci, proszę podać poziom wykształcenia na którym planuje Pan(i) pozostać): *
podstawowe średnie licencjackie magisterskie doktoranckie lub podyplomowe
Ogólnie rzecz biorąc, w jakim stopniu, jest Pan(i) ostatnio zadowolony(a) ze swojego życia? Proszę ocenić na skali od 1 do 10, gdzie 1 oznacza, że jest Pan(i) całkowicie niezadowolony(a), 10 – całkowicie zadowolony(a) *
Całkowicie niezadowolony(a) 2 3 4 5 6 7 8 9 Całkowicie
zadowolony(a)
Ocena
Wiek *
Wprowadź liczbę większą lub równą 15. Płeć *
Kobieta Mężczyzna Czy miejscowość, w której Pan(i) mieszka na stałe, to: *
wieś miasto do 19 999 mieszkańców miasto od 20 tyś. do 49 tyś. mieszkańców
miasto od 50 tyś. do 99 tyś. mieszkańców miasto od 100 tyś. do 499 tyś. mieszkańców
miasto 500 tyś. i więcej mieszkańców
Dziękuję za udzielenie odpowiedzi na wszystkie pytania!
Proszę załączyć teraz plik opisujący strukturę Twoich znajomych z Facebooka postępując zgodnie z poniższymi wskazówkami. Pobierane informacje dotyczą jedynie połączeń między znajomymi. Pozwoli mi to na stworzenie grafu struktury sieci i obliczenie opisujących ją statystyk.
1. Wejdź na stronę snacourse.com/getnet. Jeżeli nie jesteś zalogowany w danym momencie na Facebooku, strona poprosi Cię o zalogowanie.2. Stwórz plik .gml opisujący strukturę Twojej sieci klikając na pogrubione słowo "here" w ostatniej linijce na stronie [nie trzeba zaznaczać opcjonalnych pól].3. Poczekaj aż przetworzone zostaną dane dotyczące wszystkich połączeń między Twoimi znajomymi. 4. Kliknij PRAWYM przyciskiem myszy na pogrubione słowa "gml file" w ostatniej linijce i wybierz opcję 'Zapisz jako'*** [zapisując plik polecam wybrać Pulpit jako miejsce docelowe, by uniknąć problemów ze znaleziem go]5. Załącz poniżej utworzony plik.
*** W przypadku korzystania z niektórych wersji Internet Explorer'a należy zmienić typ zapisywanego pliku na .gml - w przeciwnym razie niemożliwe jest załączenie pliku i złożenie ankiety.
66
W tym celu, po kliknięciu 'Zapisz jako' w polu Zapisz jako typ należy wybrać opcjęWszystkie pliki, a następnie w polu Nazwa Pliku należy dopisać na końcu do nazwy pliku ".gml"
W przeciwnym przypadku załączenie pliku będzie niemożliwe *
STATYSTYKI ANKIET
67
68
69
70
71