Download - Statistica cu SPSS dupa Opariuc-Dan C.pdf
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
1/154
I.3 Prezentare generalSPSSfor Windows
2
SPSS sub Windows reprezint un
pachet de programe interactiv, de utilitate
general, destinat analizelor de date #i in-
clude multiple facilit&i #i tehnici de natur
statistic. Pachetul de programe SPSS sub
Windows reprezint o aplica&ie care folo-se#te ntreaga func&ionalitate a sistemului
de operare Windows, regsind n structura sa
utilizarea mausului, ferestrele redimensionabi-
le #i scalabile, meniuri derulante, casete de
dialog etc. De#i majoritatea utilizatorilor vor fi
complet satisfcu&i utiliznd doar interfa&a
graficpe care SPSS o pune la dispozi&ie, to-
tu#i pachetul de programe dispune #i de un
puternic limbaj de comenzi prin care se pot
realiza activit&i automate (scripturi) ce deter-
2Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucrunu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezintmarcnre-
gistratSPSS Inc.
Figura 1.2 Lansarea programuluiSPSS for Windows
Figura 1.3 Fereastra logoSPSS for Windows
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
2/154
Cristian Opariuc-Dan
31
min eficientizarea ac&iunilor utilizate n mod frecvent sau efectuarea unor
ac&iuni complexe, indisponibile n interfa&a grafic(SPSS, 2001).
Programul SPSS, la fel ca orice altaplica&ie sub sistemul de operareWindows, indiferent de versiunea acestuia, la instalare #i creeazun grup de
pictograme (iconuri) n sec&iunea Programsa meniului Startdin sistemul de
operare Windows. Pentru a putea lansa n execu&ie aplica&ia, va trebui ca mai
nti s efectua&i clic cu maus-ul pe butonul start al desktop-ului Windows,
buton situat de obicei n partea din stnga jos a ecranului. Apoi merge&i la
sec&iunea Programs #i se va deschide o nou list
care con&ine toate programele instalate n calculato-rul dumneavoastr(ei bine, cel pu&in programele la
care ave&i acces dumneavoastr). n aceast list,
cuta&i grupul de programe SPSS for Windows,
grup n care ve&i gsi pictogramele de lansare ale
aplica&iei SPSS. Probabil c a&i identificat deja n
acest grup de programe pictograma numit SPSS
for Windows. Aceasta este imaginea pe care vatrebui sface&i clic pentru a porni aplica&ia.3
SPSS este un program extrem de complex.
Lansarea acestuia debuteaz cu prezentarea unei
ferestre introductive, denumit #i fereastr logo. Ea cuprinde informa&ii
despre versiunea programului (n cazul nostru, SPSS 12.0 Standard), deoare-
ce exist#i versiuni server, mai complexe, versiuni demonstrative (ca aceeape care o pute&i descrca gratuit de la http://www.spss.com) sau student
pentru nv&are etc., precum #i despre posesorul licen&ei de utilizare a acestui
produs informatic. Se cunoa#te faptul c, n conformitate cu legea dreptului
3Desigur, n situa&ia n care SPSS for Windows este deja instalat pe calculatorul dumnea-voastr. Dacnu ave&i instalat SPSS for Windows, pute&i descrca o versiune demonstrativde 30 de zile de pe site-ul http://www.spss.comAsigura&i-vcave&i o conexiune suficient
de rapid#i de stabilla Internet, deoarece fi#ierul este destul de mare (aproximativ 160 MB)
Figura 1.4 Fereastra introductiv
http://www.spss.com/http://www.spss.com/http://www.spss.com/http://www.spss.com/http://www.spss.com/ -
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
3/154
Statisticaplicatn #tiin&ele socio-umane
32
de autor #i protec&ia crea&iilor intelectuale, un produs software poate fi utilizat
doar n cazul n care se posed o licen& de utilizare pentru acesta, altfel
riscndu-se pedepse severe, contraven&ionale sau de naturpenal.Dupcteva secunde, fereastra de prezentare se dezactiveaz, iar apli-
ca&ia prezinto interfa&prietenoasprin care ne invit s trecem la treab.
Putem n aceastetapslansm n execu&ie un program tutorial care ne va
forma abilit&ile de baz n vederea utilizrii acestui pachet informatic com-
plex; de asemenea, putem trece direct la introducerea datelor sau putem rula
o cerere predefinit, se poate crea o noucerere de date sau se poate deschide
o bazde date existent, situa-&ie n care va trebui s preci-
zm loca&ia acesteia. Nu n
ultimul rnd, putem deschide o
bazde date ntr-un alt format,
de exemplu Excel, Statistica
sau SAS, iar SPSS va #ti s
converteasc aceste date pen-tru a le face disponibile.
Exist, de asemenea, n
partea de jos a acestui formu-
lar introductiv, o caset denumitDont show this dialog in the future.
Daco ve&i bifa, ave&i posibilitatea ca, la viitoarea lansare a produsului, s
nu se mai afi#eze formularul, caz n care programul va trece direct n fereas-tra principalSPSS.
Desigur, selectarea unei op&iuni dintre cele prezentate mai sus nu n-
seamn#i executarea acesteia de ctre SPSS. Pentru a lansa n execu&ie op&i-
unea aleas, va trebui apsat, obligatoriu, butonul OK. Apsarea butonului
Cancelindicprogramului ctrebuie sprseascformularul introductiv #i
Figura 1.5 Fereastra principalSPSS
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
4/154
Cristian Opariuc-Dan
33
s lanseze fereastra principal SPSS n modul de lucru configurat pentru o
noubazde date.
n acest moment, nu ne intereseazniciuna dintre op&iunile predefini-te, astfel nct vom apsa butonul Cancel. Iat c formularul prezentat mai
sus a disprut, fcnd loc ferestrei principale SPSS. S privim cu aten&ie
aceastnouinterfa&cu utilizatorul.
Ca orice alt aplica&ie Windows, SPSS posedo barde titlu bara
albastrdin partea de sus a ferestrei , n partea stnga acesteia afi#ndu-se
mesajul Untitled SPSS Data Editor. Acest mesaj ne informeaz c ne
aflm n fereastra de date (editare a datelor) din SPSS #i cbaza de date nu a
fost ncsalvat(n momentul salvrii, textul Untitled este nlocuit cu nu-
mele fi#ierului salvat pe disc). n partea dreapta barei de titlu, avem cele trei
butoane clasice ale oricrei ferestre Windows: butonul de minimizare sau de
transfer al aplica&iei n bara de sarcini, butonul de maximizare extindere a
aplica&iei pe ntregul ecran sau de restaurare a aplica&iei la dimensiunile ini&i-
ale #i butonul de nchidere a aplica&iei, acel buton n formde X.Sub barade titlu, se aflmeniurile, serii de etichete purtnd fiecare un nume (n limba
englez), prin intermediul crora putem comanda SPSS #i putem efectua ope-
ra&iile #i prelucrrile de care acesta este capabil. Nu vom insista acum asupra
explicrii tuturor meniurilor, acest lucru l vom face pe parcursul prezentului
curs. Bara de meniuri este urmatde bara de instrumente mici butoane cu
aspectul unor pictograme care, n general, dubleazanumite func&ii din meni-
uri, func&ii mai des folosite. SPSS prezinto barde instrumente dinamic,adic aspectul butoanelor #i, desigur, func&ionalitatea acestora se modific
rela&ionat contextului n care ne aflm. De exemplu, vom avea anumite bu-
toane n modul de introducere a datelor #i
alte butoane n modul de definire a varia-
bilelor ori n modul de afi#are a rezultate-
lor analizelor de date.Figura 1.6 Sec&iunea de
editare a datelor
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
5/154
Statisticaplicatn #tiin&ele socio-umane
34
Dupbara de instrumente, apare sec&iunea de editare a datelor. Aceas-
ta este format dintr-o parte needitabil, informativ, partea din stnga, n
care se afi#eazn permanen&pozi&ia celulei active (celulpe care am selec-tat-o). Formatul acestui identificator este un numr urmat de doupuncte #i
apoi numele variabilei (spre exemplu, 8:timenseamncsuntem pozi&iona&i
pe rndul 8 a opta nregistrare a variabilei timp). Partea editabil arat
ntotdeauna valoarea acestei variabile n pozi&ia specificat (n cazul nostru,
la rndul 8 al variabilei timp se aflvaloarea 34).
Cea mai mare parte a ferestrei principale SPSS este dedicatsec&iunii
de date. Observm cdatele, n SPSS, sunt organizate tabelar, pe linii #i co-loane, analog altor aplica&ii mai cunoscute, cum ar fi foile de calcul tabelar
(Excel) sau bazele de date (FoxPro sau Access). Liniile (nregistrrile) sunt
identificate prin numere, iar coloanele reprezint variabilele. ntr-o baz de
date goal, toate variabilele sunt denumite implicit var, iar aceast de-
numire este scriscu culoarea gri, reprezentnd faptul cacestea nu au fost
ncdefinite. Navigarea prin baza de date se poate face cu cele doucasete de
derulare (numite #i lifturi sau controale de derulare), situate n partea dreapt,respectiv n partea de jos a ferestrei de date, la fel ca n orice program Win-
dows.
Sec&iunea de date con&ine, n partea din stnga-
jos, doi marcatori de sec&iune foarte importan&i: Data
View #i Variable View. Aceste elemente permit co-
mutarea ntre modul de vizualizare a datelor dintr-obazde date (sec&iunea Data View) #i modul de defini-
re a variabilelor (sec&iunea Variable View).
n partea de jos a programului SPSS, se afl bara de status cu dou
sec&iuni: sec&iunea de informa&ii, n partea stng, unde se afi#eaz scurte
instruc&iuni despre diferitele func&ii ale meniurilor sau ale barei de instrumen-
te, #i sec&iunea de stare a procesorului SPSS unde se afi#eazinforma&ii refe-
Figura 1.7 Marcato-rii de sec&iune
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
6/154
Cristian Opariuc-Dan
35
ritoare la rularea unor sarcini mari consumatoare de timp. n general, ncepe-
rea unei prelucrri statistice se poate face doar n condi&iile n care vede&i
mesajul SPSS Processor is ready n aceastsec&iune.Prsirea programului SPSS se poate face fie apsnd butonul de n-
chidere al aplica&iei X din col&ul din dreapta sus al ferestrei principale, fie
folosind meniul File #i apoi Exit. Daca&i fcut prelucrri de date sau modi-
ficri n baza de date, programul vva solicita mai nti salvarea documentu-
lui, ca msurde protec&ie mpotriva pierderii de informa&ie. Despre salvare,
ns, discutm n subcapitolul urmtor.
I.3.1 Bazele de date creare, salvare, deschidere
Dupce ne-am familiarizat cu interfa&a
programului SPSS, este momentul s vedem
cum putem deschide o baz de date existent
#i care sunt elementele componente ale aceste-
ia. SPSS vine nso&it de o serie de baze de date
demonstrative n scopul facilitrii procesuluide nv&are. Pe parcursul acestor exerci&ii,
vom folosi, din ra&iuni de compatibilitate,
aceste exemple de baze de date oferite de ctre
productorii programului SPSS.
Deschiderea unei baze de date n sco-
pul efecturii prelucrrilor statistice se poate
face prin mai multe metode, rmnnd la lati-
tudinea dumneavoastr#i potrivit experien&ei pe care o ave&i salege&i meto-
da care vconvine mai mult.
Prima metod este aceea prin care apelm la meniul File (Fi#ier) #i
apoi pozi&ionm cursorul maus-ului pe submeniul Open(Deschide). Apare o
listde unde putem deschide o bazde date (Data), o procedurde sintax
Figura 1.8 Deschidereaunei baze de date
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
7/154
Statisticaplicatn #tiin&ele socio-umane
36
(Syntax) o foaie de rezultate (Output), un set de comenzi (Script) sau un alt
tip de fi#ier (Other). Pentru a deschide o baz de date, va trebui selectat
op&iunea Data.Observa&i cfiecare dintre aceste op&iuni este urmatde punc-te de suspensie (). ntotdeauna cnd ve&i ntlni aceste puncte de suspensie
alturi de o comandWindows (nu doar n SPSS, ci #i n orice program Win-
dows), va trebui s#ti&i cacea comandvinvitla dialog. Adicse va des-
chide o noufereastr, de unde va trebui salege&i ceva sau sfurniza&i anu-
mite informa&ii programului pentru a putea executa comanda respectiv.
O altmetodprin care pute&i deschide o bazde date este folosirea
a#a- numitelor taste rapide. De obicei, meniurile sunt nso&ite de combina&iide taste prin care pute&i efectua direct o anumitsarcin. n loc sapelm la
meniul File, apoi Open #i apoi Data, putem pur #i simplu s &inem apsat
tasta Ctrln timp ce apsm tasta O (de la Open). O astfel de combina&ie se
noteazprin Ctrl+O, nota&ie pe care o vom folosi pe ntreg parcursul acestui
curs. Vom observa c aceastcombina&ie are acela#i efect ca #i parcurgerea
primei metode, avantajul fiind acela ceste mult mai rapid.
A treia metod apeleaz la numitele taste fierbin&i (hot-keys). O
tastfierbinte este o tastfolositn combina&ie cu tasta Alt. Dacve&i pri-
vi cu aten&ie meniurile, ve&i putea observa cunele litere sunt subliniate de
exemplu, n meniul File este subliniat litera F. ,innd apsat tasta Alt#i
apsnd apoi tasta F, vom ob&ine deschiderea meniului File, ca #i cnd am
efectua clic pe acesta. n mod analog, notarea acestei combina&ii se face folo-
sind conven&ia Alt+F. Deci, pentru a deschide o bazde date, putem folosicombina&iile Alt+Fdeschiderea meniului File #i apoi Alt+Odeschiderea
submeniului Open, iar, n final, Alt+A accesarea op&iunii Data. Aceasta
este, dacdori&i, o navigare prin meniuri frmaus.
Ultima metod se refer la folosirea barei de instrumente pentru a
deschide o bazde date. Pur #i simplu apsa&i pe primul buton de pe bara de
instrumente, acela care are aspectul unui dosar deschis.
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
8/154
Cristian Opariuc-Dan
37
Indiferent de metoda folosit, efectul va fi acela#i: deschiderea unei
casete de dialog, din care pute&i alege baza de date pe care o ve&i ncrca (v
mai aminti&i nota referitoare la punctele de suspensie?).Sanalizm pu&in aceastnoufe-
reastr. n partea de sus avem o listderu-
lant intitulatLook in: Apsnd sgeata
orientatn jos din partea dreapta acestei
casete, vom putea alege directorul n care
este localizat baza noastr de date. Ob-
servm cdirectorul curent este directorulaplica&iei (SPSS), iar n sec&iunea de sub
aceastcaseteste afi#at con&inutul acestui
dosar. Pute&i astfel selecta orice director n
care ave&i fi#iere recunoscute de SPSS, pentru a le putea afi#a #i/sau deschide.
Alturi de caseta Look in,se aflo serie de butoane care controleaznaviga-
rea prin structura de directoare de pe discul dumneavoastr.Primul buton, cel
de forma unei sge&i orientate n partea stng, permite navigarea la ultimaac&iune efectuat. Dac, de exemplu, din directorul SPSS v-a&i pozi&ionat pe
directorul Windows, apsnd acest buton ve&i reveni din nou n directorul
SPSS. La prima deschidere a acestei casete de dialog, butonul este inactiv,
deoarece nu a&i efectuat ncnici o ac&iune care sfie nregistrat.Al doilea
buton, de forma unui dosar cu o sgeatorientat n sus, permite navigarea
ascendentprin arborele de directoare. La o primapsare, vve&i deplasa n
directorul Program Files, la urmtoarea vve&i situa n directorul rdcinC#i a#a mai departe. Cel de-al treilea butonpermite crearea unui nou director
n directorul curent. Apsnd pe el, ve&i putea crea un nou director, numit
New Folder, denumire pe care o ve&i putea modifica dupdorin&. n sfr#it,
ultimul buton controleaz modul n care se afi#eaz pictogramele n caseta
central. Pute&i alege vizualizarea pictogramelor n format mare, mic, sub
formde listsau listdetaliat.
Figura 1.9 Fereastra de selectare afi#ierului n vederea deschiderii
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
9/154
Statisticaplicatn #tiin&ele socio-umane
38
Fereastra centralafi#eaz, dupcum am men&ionat, structura de sub-
directoare #i fi#iere a directorului curent. Pute&i efectua dublu clic pe numele
unui director pentru a afi#a con&inutul acestuia sau pe numele unui fi#ier pen-tru a-l deschide n mod direct (fra mai apsa butonul Open). Dacefectua&i
doar un simplu clic, numele fi#ierului selectat va fi afi#at n caseta File name
#i va trebui sfolosi&i apoi butonul Openpentru a-l deschide. Caseta derulan-
tFiles of typereprezintun filtru pentru fi#ierele afi#ate. Daco vom des-
chide, efectund clic pe sgeata orientatn jos din partea dreapta acesteia,
vom putea alege ce anume tip de fi#iere s se afi#eze n sec&iunea central.
Observm c, de#i directorul SPSS con&ine mai multe fi#iere, sunt afi#atedoar fi#ierele cu extensia .sav, adicfi#ierele care con&in baze de date SPSS,
deoarece n aceastcasetde filtrare s-a ales extensia .sav. Putem alege alte
extensii de fi#iere care sunt afi#ate, de exemplu formatul Excel (.xls) sau
dBase (.dbf), iar SPSS va afi#a doar fi#ierele ce au aceastextensie.
Deschiderea propriu-zis a unui fi#ier se face fie efectund clic pe
acesta #i apsnd butonul Open,fie efectund dublu clic pe numele fi#ierului.
Spre exemplu, vom ncrca baza de date Cars din directorul implicit SPSS,bazde date ce reprezintun inventar al diferitelor tipuri de ma#ini #i al ca-
racteristicilor acestora.
Dupdeschidere, observm cs-a modificat aspectul ferestrei princi-
pale SPSS. n primul rnd, n bara de titlu a aprut mesajul Cars SPSS Da-
ta Editor, mesaj ce ne informeazcam deschis baza de date Cars #i c
ea este pregtitpentru analiz. De asemenea, constatm cstructura acesteiaeste compusdin opt variabile, fiecare dintre ele reprezentnd o anumitca-
racteristica ma#inilor. Ultima variabil, variabila Filter_$ este o variabil
internfolositde programul SPSS pentru o filtrare anterioara datelor, vari-
abil pe care ne propunem s o #tergem. Cum? Efectund clic pe numele
acesteia. Observm cntregul con&inut al coloanei Filter_$ s-a selectat. n
continuare, apsm tasta Delete, situatpe tastatur, n partea dreapta gru-
pului principal de taste, iar variabila a fost eliminatmpreuncu toate datele
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
10/154
Cristian Opariuc-Dan
39
acesteia. Felicitri. Iat #i prima dumneavoastr interven&ie real n SPSS.
Dup cum bine #tim, orice prim interven&ie ntr-un program nseamn o
#tergere a ceva. Nici noi nu puteam face excep&ie!Baza de date deschisde ctre dumneavoastra fost afi#atn sec&iu-
nea Data view, fapt care ne atrage aten&ia cn acest mod putem afi#a #i ur-
mri con&inutul datelor din baza de date. Dacvom efectua clic pe sec&iunea
Variable view,vom intra n modul de definire a datelor. Dupcum ne spune
#i numele sec&iunii, aici putem vizualiza #i edita denumirea, tipul #i alte in-
forma&ii referitoare la variabile. Ca sfolosim un limbaj mai tehnic, dac n
Data view ne aflm n sec&iunea datelor propriu-zise, n Variable view neaflm n sec&iunea meta-datelor, adicn sec&iunea informa&iilor despre date,
unde putem interveni asupra structurii lor interne. Vom clarifica imediat, prin
cteva exemple, aceste aspecte.
Astfel, prima variabil, denumitmpg este o variabilnumeric, ce
acceptmaximum 4 caractere (adic cifre ntre 0 #i 9999) #i fr zecimale.
Numele mpg nu este nsun nume intuitiv #i nu ne putem da seama cu pre-
cizie la ce se referaceastvariabil. Din pcate, doar versiunile de SPSS de
la 13.0 n sus acceptnume de variabile cu mai mult de 8 caractere, nsnu
se permite includerea spa&iilor sau a altor semne de punctua&ie n denumirea
acestora #i de aceea va trebui sfim foarte restrictivi n momentul n care le
crem. Pentru a n&elege mai u#or la ce anume se refero anumitvariabil,
Figura 1.10 Sec&iunea de definire a variabilelor
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
11/154
Statisticaplicatn #tiin&ele socio-umane
40
avem posibilitatea de a o eticheta, adicde a include un text descriptiv asoci-
at numelui ei. n cazul nostru, eticheta variabilei ne informeazcmpg se
refer la Miles per Gallon, adic la consumul automobilului exprimat ndistan&a pe care acesta o poate parcurge cu un galon de combustibil.
Urmtoarea sec&iune prezintvalorile pe care le putem defini pentru
respectiva variabil. Iat, n cazul variabilei origin, care se referla &ara de
produc&ie a ma#inilor, observm cs-a asociat valoarea 1 pentru ma#inile de
produc&ie american, valoarea 2 pentru cele de produc&ie european#i valoa-
rea 3 pentru cele japoneze.
n spa&iul destinat definirii variabilelor, avem, de asemenea, posibili-
tatea de a controla modul de tratare a cazurilor lips, alinierea datelor n ca-
drul celulelor #i definirea tipului de variabil nominal, ordinal#i scalar.
Efectund clic pe aceste sec&iuni, a&i observat c, uneori, apare n par-
tea dreapta acestora fie un buton cu punctele de suspensie care va deschide
o casetde dialog unde se pot controla parametrii valorilor acceptate, fie un
buton de incrementare/decrementare cu ajutorul cruia pute&i mri, respectivmic#ora o anumitvaloare, fie o casetde selec&ie sgeata orientatn jos
prin care pute&i deschide o list, de unde sselecta&i anumite valori.
Exerciiu practic:
n exerci&iul care urmeaz vom traduce pur #i simplu n romne#te
structura acestei baze de date #i vom salva baza de date sub un nou nume,
Masini (aten&ie, nu folosi&i diacriticele romne#ti n scrierea literelor, prinurmare, n acest caz, nu folosi&i litera #, ci s. Deci nu vom salva cu Ma#ini,
ci Masini), ntr-un director nou creat avnd calea C:\Exercitii SPSS
(aceea#i men&iune referitoare la diacritice).
n cazul primei variabile, numele va rmne acela#i, iar noi vom mo-
difica doar descrierea. Vom da clic n sec&iunea Label, acolo unde se afl
afi#at textul Miles per Gallon #i vom scrie textul Mile per galon.
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
12/154
Cristian Opariuc-Dan
41
A doua variabilse nume#te engine. Vom schimba numele acesteia
n cilindree (ne-am ncadrat n 8 caractere), fcnd clic n coloana Name#i
scriind noul nume. Eticheta va deveni, pentru a doua variabil, Capacitatecilindric, pe care o ve&i modifica dupexemplul primei variabile.
Procedm la fel n cazul variabilelor 2, 3, 4, 5 #i 6, lsnd traducerea
din englez n romn la latitudinea dumneavoastr. Aten&ie, ns, la acel
maximum de 8 caractere cnd redenumi&i o variabil.
Variabila numrul 7 se refer la
&ara de origine a ma#inilor. O vom rede-
numi origine #i vom modifica, desigur,
eticheta. Exist ns, la acest nivel, un
element n plus, #i anume coloana Va-
lues. Vmai aminti&i probabil de ma#ini-
le americane, europene #i japoneze. Da-
cvom da clic pe celula corespunztoare
coloanei Values pentru aceastvariabil,constatm apari&ia unui mic buton cu puncte de suspensie n partea dreapta
celulei. Apsnd acest buton se deschide o noufereastr, fereastra de confi-
gurare a valorilor asociate. Vorbeam anterior despre ma#ini de produc&ie
american, european#i japonez. n aceastcasetvedem lista acestor aso-
cieri n partea de jos. n stnga listei, exist3 butoane: Addcu ajutorul cruia
putem crea o nou asociere, Change prin care putem modifica o asociere
selectat#i Removecare #terge, eliminasocierea selectat. Noi ne-am pro-pus straducem aceaststructurde date n limba romn. Vom efectua clic
pe prima asociere 1 = American. Constatm c, automat, n caseta Valuea
aprut cifra 1, iar n caseta Value Labeltextul American. Putem deduce cu
u#urin& c valorii 1 i s-a asociat textul American(apropo, la ce nivel de
msurare ne aflm aici #i ce fel de variabileste aceasta?). De asemenea, s-a
activat butonul Remove, SPSS presupunnd c dorim s eliminm aceast
asociere din moment ce am selectat-o. Pentru a modifica textul, efectum clic
Figura 1.11 Etichetarea variabilelor denivel nominal #i ordinal
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
13/154
Statisticaplicatn #tiin&ele socio-umane
42
n interiorul casetei Value Label#i scriem n loc de American, America
(mai bine spus, #tergem un n). De data aceasta, se activeaz #i butonul
Change, SPSS depistnd modificarea efectuat#i presupunnd cvom doriso #i aplicm efectiv. Dacve&i apsa acest buton (Change), ve&i constata c
eticheta s-a modificat din 1 = American n 1 = America. Felicitri. A&i reali-
zat prima traducere. Acum proceda&i la fel pentru Europa #i Japonia. De-
sigur, oricnd pute&i include o nouasociere. Tasta&i cifra 4 n caseta Value
(deoarece ar urma 4 n ordine logic) #i textul Romnia n caseta Value
Label,apoi apsa&i butonul Add care a&i observat ca devenit activ. Astfel
a&i asociat valoarea 4 ma#inilor de produc&ie romneasc. n momentul ncare a&i terminat de efectuat toate asocierile, apsa&i butonul OKpentru a le
memora #i a prsi formularul. Re&ine&i capsarea butonului Cancelduce la
prsirea formularului frmemorarea asocierilor.
Apare totu#i o ntrebare. De ce s folosim aceste asocieri n loc de a
scrie pur #i simplu n baza de date America, Europa #i Japonia? n
primul rnd, pentru c este mai u#or. Imagina&i-v c ave&i de introdus un
numr de 3000 de date n baza dumneavoastr de date. n loc s scrie&i defiecare datun text format din 6-8 caractere, ve&i tasta pur #i simplu 1 atunci
cnd vreferi&i la America, 2 cnd vreferi&i la Europa #i 3 cnd vreferi&i la
Japonia. SPSS va #ti, de fiecare dat, n urma asocierilor realizate n etapa
anterioar, la ce anume se refer1, 2 #i 3. n al doilea rnd, de#i 1, 2 #i 3 sunt
doar ni#te etichete pentru America, Europa #i Japonia, se preteazmult mai
bine la prelucrrile statistice ulterioare, fiind date numerice.
Proceda&i la fel #i cu ultima variabil, referitoare la numrul de cilin-
dri ai motorului, pentru ca, n final, sob&ine&i structura completa bazei de
date.
Prin acest exerci&iu, ne-am deprins cu unele elemente ale configurrii
structurii bazei de date. n continuare, vom salva baza de date modificatsub
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
14/154
Cristian Opariuc-Dan
43
denumirea de Masini. Directorul folosit va fi C:\Exercitii SPSS (aten&ie
la diacritice!).
Pute&i alege meniul File #i op&iunea Save sau Save as, pute&i apsacombina&ia de taste Ctrl+S sau Alt+F, Alt+S sau pute&i apsa butonul de
salvare de pe bara de instrumente (acela care are o dischet drept pictogra-
m). Dar aten&ie! Diferen&a dintre op&iunea Save #i Save as este aceea c,
folosind Save,se vor salva modificrile efectuate tot n baza de date ini&ial,
n cazul nostru baza de date Cars. Noi ne-am propus ssalvm baza de date
sub un alt nume #i ntr-un alt loc, deci nu vom putea folosi dect op&iunea
Save as (Salveaz ca). Se va deschidecaseta de salvare a unei baze de date
care are acela#i aspect ca #i caseta de
deschidere a unei baze de date, cu ex-
cep&ia butonului Open, n acest caz
denumirea acestuia fiind Save. Folosind
cuno#tin&ele dobndite anterior, va tre-
bui svpozi&iona&i cu ajutorul caseteiSave in (echivalenta casetei Look in
din fereastra de deschidere a bazei de
date) n directorul rdcinC:\,screa&i un nou director folosind butonul de
creare a unui director din acest formular pe care s-l denumi&i Exerci&ii
SPSS, s efectua&i dublu clic pe acesta pentru a-l deschide #i s introduce&i
numele bazei de date Masinin caseta File name. Apsa&i apoi butonul Save
pentru a salva efectiv fi#ierul pe disc. A&i reu#it, nu-i a#a?
n urma acestor opera&iuni, n bara de titlu SPSS va aprea mesajul
Masini SPSS Data Editor, care ne informeaz c programul a salvat cu
succes baza de date pe disc #i a activat-o.
Reamintim faptul c, la crearea unei noi baze de date, folosirea oric-
ror op&iuni de salvare (meniul File, butonul de pe bara de instrumente sau
Figura 1.12 Fereastra de salvare aunei baze de date
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
15/154
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
16/154
Cristian Opariuc-Dan
45
Dupconstruirea structurii de date, proceda&i la salvarea fi#ierului n
locul precizat.
Folosind cuno#tin&ele teoretice acumulate, preciza&i tipul fiecrei va-riabile create n acest exerci&iu.
Ne propunem n continuare aprofundarea definirii variabilelor n
SPSS. Pentru aceasta, ne vom folosi de baza de date IQ creat#i salvatn
exerci&iul anterior. n sec&iunea Data View, am remarcat deja prezen&a a zece
caracteristici prin care se poate defini o variabiln SPSS. Prima dintre aces-
tea se referla numele variabilei (Name),caracteristicce nu presupune preamulte explica&ii. Numele variabilei reprezintmodul n care aceasta va fi ape-
latn toate prelucrrile efectuate folosind baza de date. Nu putem nssnu
precizm cSPSS impune o serie de restric&ii n denumirea variabilelor (ver-
siunile mai mici de versiunea 13): n primul rnd, numele acestora snu de-
p#easc 8 caractere, variabilele cu nume mai lungi de 8 caractere nefiind
acceptate. Apoi, nu pot fi folosite spa&ii sau semne de punctua&ie n denumi-
rea variabilelor, putnd fi ns folosit linia de subliniere pentru cazurile ncare dorim s abreviem o variabil format din dou cuvinte. De exemplu,
dacavem o variabilcare se referla anul na#terii, o vom putea abrevia de-
numind-o an_naste.Astfel, lungimea ei este de 8 caractere, fiind acceptatde
SPSS, iar cele doucuvinte componente le-am separat printr-o linie de subli-
niere, fapt de asemenea acceptat de SPSS. Nu conteazdacscriem numele
variabilelor cu litere mari sau cu litere mici, deoarece, n final, SPSS le con-
verte#te automat n litere mici. Din punctul de vedere al primei caracteristici,baza noastr de date IQ nu creeaz probleme, fiind definite cinci nume de
variabile: numele, varsta, sexul, scoala #i iq.
A doua caracteristicse referla tipul de date ce va fi stocat n aceste
variabile (Type), caracteristicpe care nu am abordat-o n detaliu n timpul
prezentrii noastre de pnacum. Aceast sec&iune con&ine un buton cu trei
puncte de suspensie, pe care l putem apsa pentru a deschide fereastra de
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
17/154
Statisticaplicatn #tiin&ele socio-umane
46
configurare a tipului de date. Aceasta con&ine o serie de butoane de op&iuni,
dintre care putem selecta tipul de date pe care variabila noastr l va stoca,
dupcum urmeaz:Tipul de date Numeric
se refer la numere. Valorile
acceptate vor fi, deci, numere, n
format standard. Alegnd acest tip
de date, putem stabili #i dimensiu-
nea acestora valoarea maximpe
care SPSS o poate accepta prinprecizarea numrului de caractere
n cmpul Width #i numrul de
caractere dupvirguln cmpul Decimal Places. De exemplu, numrul ma-
xim de caractere 3 #i 2 caractere zecimale nseamncacea variabilpoate
stoca valori numerice de la 0 pnla 999,99. Acest tip de date va scrie valori-
le numerice frnici o separa&ie ntre sute #i mii #i folosind ca separator ze-
cimal separatorul configurat al sistemului. Un exemplu de numr scris nacest format ar fi 78457845.57
Tipul de date Comma se refer, de asemenea, la numere #i pot fi
definite la fel ca tipul anterior, numai c acestea vor fi afi#ate folosindu-se
virgula ca separator ntre valoarea sutelor #i valoarea miilor #i punctul ca se-
parator al valorilor zecimale. De exemplu, o valoare numericn acest format
ar arta astfel: 9,999.89. Este, practic, formatul numeric clasic american.Tipul de date Dot identic cu tipul de date anterior, doar cse in-
verseazrolul punctului #i al virgulei. Relund acela#i exemplu, numrul de
mai sus va fi scris astfel: 9.999,89 n acest caz recunoa#tem formatul rom-
nesc.
Tipul de date Scientific notation se referla modul #tiin&ific de
afi#are a cifrelor, folosind litera E pentru a reprezenta puterile lui 10. Modul
Figura 1.13 Stabilirea tipului de datea unei variabile
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
18/154
Cristian Opariuc-Dan
47
de configurare a dimensiunii variabilei este acela#i, iar un exemplu de numr
folosind aceast reprezentare poate fi 1.23E2 ceea ce semnific de fapt
123.00.Tipul de date Date se refer
la date calendaristice. Alegnd aceast
op&iune, va trebui s configura&i, selec-
tnd din lista ce se va deschide, modul de
afi#are a datei calendaristice dintr-o mul-
&ime de formate care vi se ofer.
Tipul de date Dollar se refe-
rla valori monetare, avndu-se n vede-
re moneda american. Pute&i alege #i particulariza valoarea maximpe care o
poate accepta variabila din lista ce se afi#eazsau pute&i particulariza aceast
valoare, la fel ca n cazul valorilor numerice.
Tipul de date Custom currency permite definirea unor valori
monetare particularizate, valabile pentru alte &ri n afara Statelor Unite. Sepoate defini forma de prezentare a variabilei #i valoarea maximacceptat, la
fel ca la tipul anterior.
Tipul de date String stocheazdoar #iruri de caractere, cu alte
cuvinte texte, frnici o posibilitate de prelucrare statistic. Poate fi definit
#i aici dimensiunea maxim pe care o poate avea variabila din punctul de
vedere al numrului de caractere acceptate. n cazul nostru, variabila nume
este un exemplu excelent de variabilde tip string.
Caracteristica a treia #i caracteristica a patra a unei variabile, respectiv
Width#i Decimalsse referexact la valorile maxime pe care le pot accepta
variabilele #i la numrul de zecimale, elemente pe care le-am discutat anteri-
or, iar aceste doucaracteristici nu fac dect screeze o altposibilitate de
definire a variabilelor sub acest aspect.
Figura 1.14 Tipul de datecalendaristice
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
19/154
Statisticaplicatn #tiin&ele socio-umane
48
n cazul exemplului nostru, constatm cavem o singurvariabilde
tip string, variabila nume care poate accepta maxim 20 de caractere, toate
celelalte variabile fiind de tip numeric; variabilele sexul #i #coala potaccepta doar o singurcifrfrzecimale, iar variabilele varsta #i iq pot
accepta 3 cifre frzecimale. Aceastdefini&ie permite stocarea subiec&ilor cu
numele format din maxim 20 de litere, vrsta poate lua valori de pnla 999,
suficient, deci, pentru scopurile noastre, acela#i lucru fiind valabil #i pentru
coeficientul de inteligen&. Sexul #i nivelul de #colarizare acceptdoar o sin-
gurcifr, deoarece am convenit sasociem valoarea 1 cu sexul masculin #i 2
cu sexul feminin, n mod analog procednd #i cu nivelul de #colarizare. Date-le au fost definite ca numerice pentru a crea posibilitatea interpretrii lor ulte-
rioare, cunoscndu-se faptul cdatele de tip string nu pot fi interpretate sta-
tistic.
Urmtoarea caracteristic, caracteristica Label, permite includerea
unei denumiri mai intuitive a variabilei, prin care spoatfi mai u#or identi-
ficat#i recunoscut. Astfel, variabilei nume i putem da eticheta Numele
subiec&ilor, variabila iq o putem eticheta drept Coeficientul de inteligen-& #i a#a mai departe. Putem include orice etichetdescriptivdorim pentru
numele unei variabile, cu condi&ia ca lungimea acesteia snu dep#easc255
de caractere. Deci aten&ie la scrierea romanelor n descrierea variabilelor!!!
Aceastcaracteristicmai are nso func&ie important; SPSS include etiche-
ta variabilelor n rapoartele finale rezultate n urma prelucrrii datelor. Dac
crea&i un tabel de frecven&, SPSS nu va afi#a numai numele variabilei, de
exemplu iq, ci va include #i descrierea acesteia, Coeficientul de inteligen-&, fcnd astfel mult mai estetice #i mai inteligibile foile de raport.
Caracteristica Valuesam discutat-o pe larg n sec&iunile anterioare #i
nu vom mai reveni asupra ei. Men&ionm doar cea permite clasificri (deci
variabile categoriale) #i asocieri de valori. Spre exemplu, putem asocia valoa-
rea 1 sexului masculin #i valoarea 2 sexului feminin, pentru a putea introduce
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
20/154
Cristian Opariuc-Dan
49
mai u#or datele #i pentru a putea efectua prelucrri statistice la nivel de varia-
bile nominale.
Caracteristica Missingpermite defi-nirea modului n care vor fi tratate valorile
lipsdin cadrul unei variabile. Uneori, este
important scunoa#tem de ce lipsesc valori
dintr-o variabil. Datele lipsse pot datora,
spre exemplu, faptului c subiectul refuz
srspundla o anumitntrebare sau fap-
tului c ntrebarea nu este adresat aceluisubiect. Iatdousitua&ii care ar necesita un
tratament separat al valorilor lips. Datele pe care le ve&i trata n mod explicit
ca date lips pot fi supuse apoi unei analize statistice separate, fiind ini&ial
excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n ches-
tionarele sociologice, se referla codificarea rspunsurilor de tip Nu #tiu/Nu
rspund. Majoritatea cercettorilor codeazaceste variante cu 9 sau 99. Evi-
dent, variantele incerte nu vor face obiectul prelucrrii ini&iale a datelor. Fo-losind aceastsec&iune se pot include aceste valori (9 sau 99) ca valori lips,
SPSS eliminndu-le din analiz. Definirea valorilor lips poate accepta trei
situa&ii. Situa&ia No missing values, cnd comunicm programului c nu
dorim un tratament special pentru valorile lips, acestea fiind tratate ca atare
n cursul fiecrei prelucrri de date pe care o realizm, situa&ia Discrete
missing values,cnd putem defini pn la trei valori care vor fi tratate ca
valori lips n cursul prelucrrilor statistice ulterioare (de exemplu, la unchestionar cu 3 variante de rspuns, dorim ca doar rspunsurile 1 #i 3 sfie
luate n calcul, rspunsul 2 fiind tratat ca non-rspuns. Pentru aceasta, vom
include cifra 2 n prima dintre cele trei casete ale acestei sec&iuni.) #i situa&ia
Range plus one optional discrete missing value, n care putem stabili un
interval pentru care valorile vor fi tratate ca valori lips(spre exemplu, coefi-
cien&ii de inteligen&cuprin#i ntre 10 #i 75), n plus existnd posibilitatea de
Figura 1.15 Tratarea valorilor lips
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
21/154
Statisticaplicatn #tiin&ele socio-umane
50
a include #i o valoare particular (discret), ca #i n situa&ia anterioar. n
exemplul nostru de bazde date, nu avem nici un motiv de a trata n vreun fel
valorile lips, deci nu vom configura aceastcaracteristic.Caracteristica Columns permite specificarea l&imii coloanei n care
se vor afi#a valorile variabilelor n modul Data View. Implicit, coloanele au o
l&ime egalcu 8 caractere. Putem include aici o altvaloare sau putem redi-
mensiona l&imea coloanelor n modul Data View, prin tragerea cu ajutorul
maus-ului a liniei de separa&ie dintre dou coloane. Introducerea diferitelor
valori pentru aceastcaracteristicpermite ajustarea #i redimensionarea pre-
cisa l&imii coloanelor. n cazul nostru, pentru variabila nume, dimensiu-nea implicitde 8 caractere va fi insuficientpentru prezentarea unui subiect
cu numele Popescu Valentin, afi#ndu-se doar primele 8 caractere #i anume
Popescu . Pentru a vedea ntregul nume, fie introduce&i valoarea 16 pentru
caracteristica Columns a variabilei nume, fie trage&i cu ajutorul maus-ului
linia de demarca&ie dintre coloana nume #i coloana varsta, pentru a mri
l&imea coloanei de afi#are a numelui subiec&ilor. Aceastcaracteristic, ca #i
urmtoarea, nu influen&eaz n niciun fel modul de prelucrare a datelor, cidoar aspectul tabelului de date din Data View.
Caracteristica Align controleaz modul n care sunt aliniate valorile
variabilelor n tabelul de date. Pute&i opta pentru o aliniere la stnga, centrare
sau aliniere la dreapta a valorii variabilelor n cadrul coloanelor din Data
View, fr a influen&a n vreun fel modul de prelucrare al variabilelor. Ca
regulgeneral, variabilele de tip string se aliniaz la stnga, iar variabilelede tip numeric sau datcalendaristicse aliniazla dreapta pentru o mai bun
lizibilitate n cadrul tabelelor de date.
Ultima caracteristic, Measure, este n acela#i timp #i una foarte im-
portant, permi&nd alegerea nivelului de msurare al variabilei. Se poate
opta pentru dousau trei niveluri de msurare, n func&ie de tipul de variabil.
Astfel, pentru variabila nume, care este o variabilde tip string, sunt dis-
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
22/154
Cristian Opariuc-Dan
51
ponibile doar nivelurile nominal #i ordinal de msurare. Stocarea numelui #i a
prenumelui are o valoare pur informativ#i nu permite nici mcar o clasifica-
re a acestora. Nivelul de msurva fi deci nivelul nominal. Variabila varstaeste variabila numericprin care se stocheazvrsta subiec&ilor. Aceastva-
riabil are intervale egale, zero absolut #i permite rapoarte n cadrul scalei,
deci poate fi consideratla un nivel de msurare scalar4. Variabila sexul nu
este altceva dect tot o variabilnominal, care nu permite dect o clasificare
a persoanelor n func&ie de genul lor biologic. Variabila scoala poate fi pri-
vitca o variabilnominal, dacinten&ionm doar sclasificm subiec&ii n
func&ie de studiile absolvite, sau se poate accepta un nivel ordinal de msura-re la nivelul acesteia, dac ierarhizm subiec&ii n func&ie de gradul lor de
#colarizare. Vom lua n considerare a doua situa&ie #i o vom accepta ca varia-
bilordinal. n sfr#it, variabila iq este frdiscu&ie o variabilde tip or-
dinal.
Iatc, parcurgnd aceste etape, am reu#it n cele din urmsconstru-
im structura unei baze de date simple n acord cu principiile #i domeniile de
defini&ie ale variabilelor #i cu nivelul lor de msurare.
Un aspect important pe care merits-l men&ionm se referla proce-
sul de codare al variabilelor (proces pe care l-am ntlnit la codarea variabile-
lor sex #i nivel de #colarizare). n general, cercettorii cu experien&cunosc
intuitiv modalitatea de codare optima unei variabile. Pentru a veni n spriji-
nul debutan&ilor, Newton #i Rudestam (1999) propun, n lucrarea Your
statistical consultant, un set de reguli folosite n acest proces (Field, 2005). Toate datele trebuie codate numeric. Pentru a coda, de exemplu,
sexul, am putea folosi #i M pentru masculin, respectiv F pen-
tru feminin. Un asemenea proces de codare ar fi complet eronat,
4 Ca observa&ie, n SPSS, nivelurile de msur de interval #i de raport au fost reunite subdenumirea generic de nivel de msur scalar. Proiectan&ii acestei aplica&ii au renun&at la
distingerea celor dou, reunindu-le sub denumirea de nivel scalar.
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
23/154
Statisticaplicatn #tiin&ele socio-umane
52
deoarece ar limita radical posibilit&ile de prelucrare statistic a
datelor. Recomandarea este aceea c, atunci cnd suntem n astfel
de situa&ii, este de preferat sfolosim, de exemplu, 1 pentru Mas-culin #i 2 pentru Feminin. Aceste cifre nu au dect o valoare de
etichet #i nu reprezint un proces de ierarhizare (nu spunem c
masculinul este mai jos dect femininul deoarece are valoarea
1). La fel de bine putem sscriem 2 masculin #i 1 feminin sau 5
masculin #i 7 feminin. Acest proces de codare poart numele de
codare dummy. Tot ceea ce trebuie sface&i este sre&ine&i codu-
rile atribuite. Fiecare variabil#trebuie s#ocupe o coloan#distinct#n baza
de date i fiecare subiect va ocupa o singur#nregistrare. Este
foarte important ca datele unui subiect socupe un singur rnd n
baza de date SPSS, iar fiecare coloansse refere doar la o singu-
rvariabil. n cazul n care o variabileste msuratde mai mul-
te ori (tipic pentru experimente de tip testare ini&ial testare fina-
l), se vor aloca doucoloane pentru acea variabil, una care sserefere la testarea ini&ial#i una viznd testarea final. De exemplu,
dacavem un experiment prin care, n urma unei tehnici oarecare,
presupunem cmbunt&im memoria, va trebui stestm memo-
ria subiec&ilor nainte de aplicarea tehnicii, s aplicm tehnica #i
apoi s testm din nou memoria subiec&ilor, pentru a vedea dac
au aprut modificri. n acest caz, putem defini cele douvariabile
prin mem_inicare reprezinttestul ini&ial de memorie #i mem_fin
care se referla testul final. Astfel, nu nclcm aceastregul, iar
datele vor fi consistente.
Toate codurile pentru o variabil#trebuie s#fie mutual exclu-
sive. Cu alte cuvinte, nu trebuie sexiste dect un singur numr ce
poate fi stocat ntr-o variabil. n anumite chestionare pot exista
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
24/154
Cristian Opariuc-Dan
53
itemi care permit alegeri multiple (de exemplu, la solicitarea: Bi-
fa&i din urmtoarea listpartidele cu care n mod sigur nu ve&i vo-
ta la urmtoarele alegeri: pot fi variantele de rspuns PSD,PD, UDMR, PNGetc. n acest caz, subiectul poate alege un
singur partid, doupartide sau le poate alege pe toate). O aseme-
nea situa&ie impune crearea unui numr de variabile egal cu vari-
antele de rspuns (de exemplu nu_PSD, nu_PD, nu_UDMR,
nu_PNG) cu categorii dihotomice de genul 0 Neselectat, 1 Se-
lectatcare vor fi analizate ulterior. De obicei, asemenea itemi au
#i o categorie de genulAltul. Care_______prin intermediul creiasubiectul poate s-#i exprime liber op&iunea. n mod normal,
aceast categorie se analizeaz prin alte metode #i nu folosind
SPSS, deoarece variabilitatea rspunsurilor confero valoare sta-
tisticfoarte redus.
Fiecare variabil# trebuie codat# astfel nct s# se ob&in#ma-
ximum de informa&ii.Categoriile sau valorile variabilei nu trebu-
ie sintetizate n prima variant, ci trebuie incluse exact a#a cumapar pe formularele de colectare a datelor. Sintetizarea valorilor #i
cumularea categoriilor poate fi fcutmai trziu, utiliznd func&ii-
le specifice SPSS. De exemplu, se prefer introducerea exact a
valorii pentru vrsta subiectului, n ani, #i nu ncadrarea subiectu-
lui n categorii de vrst(sub 14 ani, ntre 14 #i 20 de ani, peste 20
de ani etc.). Ini&ial, se va proiecta o variabil, varsta, care va stoca
vrsta exacta subiec&ilor. Ulterior, dacse va dori transformarea
acestei variabile scalare ntr-o variabildiscret, ordinal, numit
grup_varsta, se pot folosi tehnici specifice de conversie. Ca idee
general, ntotdeauna cnd este posibil, se vor folosi variabile con-
tinui la un nivel de msurct mai aproape de scala de raport. Este
u#or s transformm o variabil continu ntr-una discret, ns
imposibil strecem de la o variabildiscretla una continu. Du-
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
25/154
Statisticaplicatn #tiin&ele socio-umane
54
pcum #ti&i deja, valoarea informativcea mai ridicato au totu#i
variabilele continui, astfel nct profita&i de ele.
Fiecare subiect trebuie s#aib#o valoare pentru fiecare varia-
bil#.Uneori nu este posibil sincludem valori n fiecare coloan,
fie deoarece subiectul nu a rspuns, fie pentru citemul respectiv
nu i se adreseaz. n acest caz, se recomandslsa&i acea celul
liber, deoarece SPSS este astfel proiectat nct strateze celulele
goale drept cazuri lips. Introducerea altor valori pentru cazurile
lipspoate crea confuzii. Respecta&i ntotdeauna regula ceea ce e
cel mai simplu este #i cel mai bun.
Regulile de codare se vor aplica tuturor subiec&ilor.Acest lucru
nseamn c nu pute&i aplica reguli valabile doar pentru anumi&i
participan&i. De exemplu, dacdori&i ca anumite valori sfie trata-
te ca valori lipspentru un anumit subiect, nu pute&i face acest lu-
cru. Valorile lipsvor fi tratate similar pentru to&i subiec&ii.
Folosi&i coduri n concordancu sensul scalei.Unele chestio-nare presupun tipuri de scale ordinale (de exemplu 1 niciodat, 2
rareori, 3 uneori, 4 deseori, 5 ntotdeauna). De#i scalele pot
fi codate #i invers (1 ntotdeauna, 2 deseori, 3 uneori, 4 ra-
reori, 5 niciodat), se recomand pstrarea sensului natural al
scalei pentru evitarea problemelor ulterioare referitoare la inter-
pretare. Mai u#or asociem niciodat cu 1 dect niciodat cu 5.
Oricum, chiar daculterior existsuficiente posibilit&i de recoda-re a valorilor astfel nct analiza s fie consistent, proiectarea
adecvat a cercetrii #i codrii v poate scuti de bti de cap #i
muncinutil.
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
26/154
Cristian Opariuc-Dan
55
Dupproiectarea bazei de date, se recoman-
d listarea structurii acesteia (a meta-informa&iilor)
n vederea consultrii ulterioare. Dacnu ve&i lucracteva luni cu baza de date, probabil cnu ve&i re&ine
la ce se refer mem_ini sau mpg #i nici de ce tip
este. SPSS prezint o modalitate u#oar de a afi#a
structura bazei de date cu informa&ii complete. Nu
trebuie dect saccesa&i meniul File#i apoi op&iunea
Display Data File Information. Se va deschide o
nousec&iune care v invitsalege&i ntre a afi#ainforma&iile bazei de date curente (Working File)
sau cele ale unei alte baze de date de pe disc
(External File). Noi suntem interesa&i de afi#area structurii bazei noastre
de date (IQ.sav) #i vom alege, a#adar, prima op&iune.
n fereastra de rezultate (Output), vor aprea o serie de tabele cores-
punztoare defini&iilor variabilelor din baza de date, astfel:
Variable Information
1Numele
subiectuluiNominal 14 Left A20 A20
2Varsta
subiectilorScale 8 Right F2 F2
3 Genulbiologic al
subiectilor
Scale 8 Right F1 F1
4
Coeficientu
l de
inteligenta
Scale 8 Right F3 F3
Variable
nume
varsta
sexul
iq
Position Label
Measurement
Level Column Width Alignment Print Format Write Format
Variables in the working file
Figura 1.16 Afi#area infor-ma&iilor despre baza de date
Tabelul 1.1 Tabelul de structura bazei de date
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
27/154
Statistic aplicat n tiinele socio-umane
92
III.2.5 Obinerea indicatorilor tendinei centrale n SPSS
V mai amintii, cred, de baza de date creat n SPSS n capitolul unu
i pe care am numit-o IQ. Haidei s o deschidem. Dac nu reuii, revedeiprimul capitol.
Acum vom introduce cteva date n SPSS. Trecem, deci, n modul
Data View prin apsarea tabulatorului din partea din stnga jos a progra-
mului SPSS.
Se afieaz o foaie de lucru, un tabel similar tabelului din Excel, n
care, pe prima coloan, cea de culoare gri (capul de tabel), ntlnim numelevariabilelor definite anterior.
Modul de lucru este analog celui din Excel. Se scriu pur i simplu da-
tele n celule. Atenie! Avem dou variabile pentru care am asociat valori:
variabila sexul i variabila scoala. Aici nu vom scrie cuvntul Mascu-
lin sau Feminin, ci vom tasta 1 pentru Masculin i 2 pentru Feminin.
La fel i n cazul variabilei scoala, vom tasta 1 pentru Primare, 2 pentru
Gimnaziu i aa mai departe.
Baza dumneavoastr de date trebuie s arate n final ca n figura de
mai sus. O mic precizare. Pe bara de instrumente, penultimul buton se nu-
mete Value Labels i arat ca n imaginea alturat. La o apsare a
acestuia, butonul se activeaz, iar
n baza de date se afieazetiche-
tele asociaiilorfcute, ca n figu-
ra alturat. La o nou apsare,
etichetele asociaiilor nu se mai
afieaz, ci se afieaz valorile
asociaiilor ca n figura mare de
mai sus.
Figura 3.2Baza de date cu afiarea etichetelor
asocierilor
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
28/154
Cristian Opariuc-Dan
93
Dup ce am introdus cele 30 de date, vom salva baza de date i vom
iniia procedura de extragere a indicatorilor tendinei centrale. Indicatorii
tendinei centrale ne sunt furnizai prin interme-diul numeroaselor proceduri statistice. Cele mai
simple comenzi, pentru a nu complica inutil ex-
punerea, le gsim n meniul Analyzei apoi n
meniul Descriptive Statistics. n traducere,
analize statistici descriptive. Primele trei co-
menzi din acest submeniu pot extrage indicatorii
tendinei centrale. Vom analiza doar prima comand, comandaFrequencies, urmnd ca celelalte dou s le discutm cu alte ocazii,
deoarece presupun i alte informaii.
Comanda Frequencies sau
frecveneprezint cele trei puncte, fapt
care va duce la deschiderea unei noi case-
te de dialog. Dai clic pe aceast comand
i vei obine o caset ca cea din imagineade mai jos.
n partea stng se afl o list cu
toate variabilele din baza dumneavoastr
de date. Alturi de aceast list, se afl un buton de transfer (acel buton cu o
sgeat pe el). Urmeaz apoi lista
Variable(s), care nseamn variabile-le pe care le introducem spre analiz.
Pentru a introduce o variabil spre ana-
liz, trebuie s o selectm, printr-un clic
simplu pe numele acesteia, din lista de
variabile din partea stng. O variabil
selectat are fundalul albastru (sau o
Figura 3.3Lansarea proce-durilor de analiz descriptiv
pe frecvene
Figura 3.4Caseta de analize descrip-
tive utilizndu-se frecvenele
Figura 3.5Includerea variabilelor spre
analiz
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
29/154
Statistic aplicat n tiinele socio-umane
94
alt culoare n funcie de schema de culori a calculatorului dumneavoastr).
Dup ce o selectai, apsai butonul de transfer (care va avea sgeata orientat
spre lista Variable(s)) pentru a transfera variabila dumneavoastr n listavariabilelor ce urmeaz a fi analizate. n figura din stnga, transferm variabi-
la Varsta subiectilor din lista variabilelor din baza de date n lista variabile-
lor supuse analizei. n final, va trebui s obinei o imagine ca cea de alturi.
Observai c dac am transferat variabila Varsta subiectilor n lista variabi-
lelor supuse analizei, butonul de transfer i-a schimbat sensul. Acum, dac
apsm pe el, scoatem variabila noastr din lista variabilelor supuse anali-
zei (dup ce, n prealabil, evident, o selectm)i o introducem n lista variabi-lelor totale din baza de date. Oricum, acest buton de transfer ne va nsoi
permanent n analizele noastre, deoarece va trebui s spunem programului
ce variabile s analizeze i pe care s nu le analizeze.
Vom trece n revist acum toate comenzile din aceast fereastr, cu
precizarea c unele dintre ele vor fi abordate n detaliu n cadrul altor capito-
le.
Caseta de bifare Display frequency tables informeaz aplicaia
SPSS dac s afieze tabelul frecvenelor (n condiiile n care aceast caset
o bifai) sau s nu-l afieze (n condiiile n care nu o bifai). Tabelul frecven-
elor este acel tabel general, studiat la capitolul despre organizarea datelor,
nainte de a grupa valorile n clase. Iat c, acum, am ales ca acest tabel al
frecvenelor s fie afiat.
n partea dreapt a acestui formular, se afl un numr de cinci butoanede acionare.
Butonul OKeste butonul pe care vom apsa pentru a lansaanaliza, dup ce am configurat modul n care dorim ca analiza
s fie efectuat.
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
30/154
Cristian Opariuc-Dan
95
Butonul Pasteeste un buton pe care nu-l vom folosi deloc.El permite lipirea codului care efectueaz analiza curent
ntr-o fereastr de sintax de comenzi. El se adreseaz utiliza-torilor care doresc s fac programare n SPSS, utiliznd lim-
bajul propriu de programare al acestei aplicaii.ntr-o alt lu-
crare, vom aborda i aspecte legate de programarea n SPSS.
Butonul Resetpermite reiniializarea ferestrei la starea eioriginal. Cu alte cuvinte, toate variabilele din lista de analiz
sunt eliminate, toate configurrile de analiz pe care le-am f-
cut sunt iniializate la valoarea lor implicit. Este un buton pecare-l vom folosi destul de frecvent.
Butonul Canceleste butonul prin care renunm la analizi nchidem aceast fereastr, fr a mai efectua nicio operai-
une.
Butonul Helpeste butonul cu ajutorul cruia obinem asis-ten i informaii (n limba englez) referitoare la funciona-rea acestei proceduri. Dac tii englez, nu ezitai s-l utili-
zai. SPSS are un tutorial excelent pe care l putei parcurge i
nelege cu succes.
n partea de jos a formularului,
se afl trei butoane care permit configu-
rarea statisticilor pe care le vom calcula.Butonul Statistics este bu-
tonul pe care vom i apsa acum pentru
a calcula indicatorii tendinei centrale.
Dup cum i spune i numele, cu ajuto-
rul acestui buton, putem stabili ce statis-
tici descriptive vom analiza. Iat ccele
Figura 3.6Fereastra de alegere a
indicatorilor tendinei centrale
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
31/154
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
32/154
Cristian Opariuc-Dan
97
vedem ce se ntmpl.
Iat c a aprut fereastra de rezultate sau fereastra Output.Nu vom
intra acum n detalii explicative ale acestei ferestre,pentru c s-ar putea s vsperiai de prea multe informaii i s trecei la Solitaire.Ne vom concentra
asupra celor dou tabele pe care le-a generat SPSS n partea din dreapta a
ferestrei de rezultate (partea cea mare), care nu reprezint altceva dect cele
dou tabele pe care le-am solicitat. Primul tabel conine indicatorii tendinei
centrale pe care i-am configurat n etapa anterioar.
Tabelul se numete Statistics i conine n partea de sus numele va-
riabilei, Varsta subiectilor, pentru a putea identifica variabila cu care ope-
rm. Apoi ne d numrul de cazuri, N,i ne spune c sunt 30 de date vali-
de (Valid) i zero date lips (Missing). Cu alte cuvinte, toi cei 30 de
subieci au nregistrat vrsta lor. Nu exist nici un subiect la care s fi uitat
s introducem aceast valoare. n continuare, ne spune c media de vrst
este 29,33 (Mean), mediana este 29 (Median), iar modul. avem o
problem. SPSS ne infor-meaz n josul tabelului c
sunt mai multe valori cu
frecvena cea mai mare i
c o va afia pe cea mai
mic, 24 (Multiple
modes exist. The smallest
value is shown). Acestaeste, deci, un singur mod real, cel inferior, i urmeaz s vedem care este i
cealalt valoare modal, deoarece avem o distribuie cu mai multe moduri
(multimodal).
Statistics
Varsta subiectilor
30
0
29,33
29,00
24a
Valid
Missing
N
Mean
Median
Mode
Mult iple modes exist. The smallest v alue is showna.
Tabel 3.7Indicatorii tendinei centrale
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
33/154
Cristian Opariuc-Dan
101
niciuna. Vomputea nsface media acestor dou eantioane. Adunm 178 cu
165 i mprim la doi. Obinem 171,5 centimetri, un indicator mai precis
pentru media populaiei. Iat c media eantioanelor este un indicator careaproximeaz mai bine media unei populaii. Cu ct avem mai multe eantioa-
ne, cu att putem stabili mai precis media populaiei. Aceast caracteristica
mediei eantioanelor de a tinde ctre media populaiei poart n statistic nu-
mele de teorema limitei centrale. Asupra acestui aspect vom reveni i
vom avea ocazia s-l tratm amnunit ntr-un alt capitol.
IV.1Reprezentri grafice
Am studiat n primul capitol o serie de repre-
zentri grafice uzuale. Vom vedea cum putem repre-
zenta grafic datele folosind SPSS i ce semnificaie
au aceste reprezentri. Aadar, vom deschide baza de
date creatanterior, baza de date IQ, i ne propunem
s reprezentm datele noastre printr-un grafic cu ba-
re.
Vom folosi pentru
aceasta meniul Graphs i
apoi opiunea Bar n general, n meniul
Graphs gsim toate posibilitile de reprezentare
grafic a datelor pe care SPSS le pune la dispoziie8.
n momentul n care am accesat opiunea
Bar... apare o nou fereastr, n care va trebui s
alegem tipul de grafic cu bare pe care dorim s-l re-
prezentm. Avem la dispoziie trei variante: Sim-
ple (simplu), Clustered (pe clusteri) i
8n SPSS versiunea 15, modalitatea de construcie a graficelor difer radical, fiind mult mai
simpl i mai inteligent. Vom aborda aspectele grafice ale aplicaieiSPSS 15, la sfritul
acestui volum i n volumele viitoare
Figura 4.1Meniul
pentru graficul cu bare
Figura 4.2Alegerea
tipului de grafic cu bare
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
34/154
Statistic aplicat n tiinele socio-umane
102
Stacked (aditiv). Graficul simplu ne permite reprezentarea cu bare doar a
variabilei noastre (n cazul nostru vom folosi reprezentarea cu bare a coefici-
entului de inteligen, iq). Graficul pe clusteri l folosim dac dorim s in-cludem o variabil categorial (de exemplu, dac dorim s prezentm compa-
rativ coeficientul de inteligen al brbailor ial femeilor), iar graficul aditiv
prezint valorile una deasupra alteia i se folosete atunci cnd urmrim s
vedem cu ct crete o variabil n timp sau care este rezultatul cumulrii mai
multor variabile. n cazul nostru, vom folosi graficul cu bare simplu. Aadar
vom efectua clic pe imaginea graficului Simplepentru a-l selecta.
Exist, dup cum putei observa, un numr de trei opiuni pe care leveifolosi: prima opiune, Summaries for group of casesarat c SPSS
va parcurge categoriile unei singure variabile i va afia, pentru fiecare bar,
categoria corespunztoare. A doua opiune, Summaries of separate varia-
bles arat c dou sau mai multe variabile vor fi parcurse, iar barele vor
indica fiecare dintre variabile. n sfrit, opiunea Values of individual cas-
es ne spune c SPSS va lucra cu o singur variabil, iar barele vor reprezen-
ta valorile sale. Aceasta este, de fapt, i opiunea care ne intereseaz pe noi.
Alegem, deci, aceast opiune, dup care apsm butonul Definepentru a
defini variabilele ce vor fi reprezentate.
Apare o nou fereastr cu mai
multe elemente. Recunoatem, n par-
tea stng, lista variabilelor din baza
noastr de date. n partea dreapt, pri-mul element l reprezint caseta Bars
Represent care se refer la ceea ce
vor reprezenta barele noastre. Variabi-
la pe care dorim s o reprezentm este
Coeficient de inteligen. O vom
selecta i apoi vom apsa butonul de Figura 4.3Opiunile de reprezentare alegraficului simplu cu bare
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
35/154
Cristian Opariuc-Dan
103
transfer pentru a o include n caseta Bars Represent ca n figura de maijos.
Pentru moment, att avem de fcut n vederea trasrii graficului cu bare.
Exist i alte opiuni pe care le putem folosi. Seciunea Category Labelsne permite s alegem dac pe axa
categoriilor (axa OX) va fi afiat
numrul fiecrui caz (opiunea
Case number) sau valorile unei
alte variabile categoriale pe care le
vom specifica (opiunea
Variable:). Seciunea Panelby permite gruparea barelor n
funcie de o alt variabil categori-
al. Gruparea poate fi efectuat fie
pe linii, fie pe coloane, cazuri n
care va trebui s specificm i vari-
abilele categoriale n funcie de
care se va face gruparea, introducndu-le n listele Rows: sauColumns:. Dac avem vreun ablon de grafic preferat, descrcat de pe
Internet sau construit de noi, l putem folosi pentru a desena graficul nostru,
bifnd caseta Use chart specification from: i apoi apsnd butonul Fi-
le care se activeaz i ne invit s
ncrcm acel fiier. Putem, de aseme-
nea, da un titlu graficului nostru ap-
snd butonul Titles. Utilizareaacestui buton v-o lsm dumneavoas-
tr ca exerciiu. Dup ce am terminat
de stabilit variabila pentru care dorim
s trasm graficul, apsm butonul
OK, care devine activ. SPSS va
genera graficul n fereastra de rezultate
Figura 4.4Reprezentarea prin grafic cu bare
a QI pe nivele se colarizare i n funcie de sex
302928272625242322212019181716151413121110987654321
Case Number
125
120
115
110
105
100
ValueCoeficientdeinteligenta
Figura 4.5Graficul cu bare simplu al
coeficientului de inteligen
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
36/154
Statistic aplicat n tiinele socio-umane
104
(Output), rezultnd un desen ca n figura de mai sus. Iat, aadar, reprezenta-
rea cu bare care ne intereseaz.
Pentru a exemplifica i ce-lelalte faciliti ale acestei repre-
zentri grafice, v prezentm, n
figura alturat, un grafic cu bare,
n care am folosit ca variabil eti-
chet Nivelul de colarizare, iar
graficul este mprit pe linii dup
variabila Sexul subiecilor. Lan-snd procedura de desenare prin
apsarea butonului OK, obinem
urmtorul grafic cu bare:
Observm dou grafice, n
cel de jos fiind reprezentat coeficientul de inteligen al brbailor, iar n gra-
ficul de sus cel al femeilor. Dac privim cu atenie pe axa OX, observm c,pentru fiecare bar, este indicat i nivelul de colarizare al subiectului respec-
tiv. Dup ce vei stpni la un nivel suficient de ridicat lucrul n SPSS, vei
putea face combinaii ntre variabile pentru a realiza grafice intuitive cu care
s v susinei demonstraiile statistice.
Exerciiu:
Reprezentai, folosind un grafic cu bare, valorile variabilei Varsta
subiectilor.
n primul capitol discutam, de asemenea, despre poligonul frecvene-
lor absolute (al valorilor individuale), al frecvenelor relative i al frecvene-
lor cumulate absolute sau relative. Folosind SPSS, vom putea desena poligo-
nul valorilor individuale prin folosirea unui grafic cu linii. Pentru aceasta,
vom accesa, tot meniul Graphs i apoi, submeniul Line.La fel ca n
Fa
cu
lta
te
Fa
cu
lta
te
Po
stl
ic
ea
la
Li
ce
u
Li
ce
u
Li
ce
u
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Li
ce
u
Li
ce
u
Li
ce
u
Li
ce
u
Gi
m
na
zi
u
Pr
im
ar
e
Pr
im
ar
e
Fa
cu
lta
te
Fa
cu
lta
te
Fa
cu
lta
te
Fa
cu
lta
te
Fa
cu
lta
te
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Li
ce
u
Li
ce
u
Gi
m
na
zi
u
Li
ce
u
Li
ce
u
Li
ce
u
Nivelul de scolarizare
125
120
115
110
105
100
ValueCoeficientde
inteligenta
125
120
115
110
105
100
Masculin
Feminin
Sexulsubiectilor
Figura 4.6 - Reprezentarea prin grafic cu bare
a QI pe nivele se colarizare i n funcie de sex
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
37/154
Cristian Opariuc-Dan
105
graficul cu bare, se afieaz o nou fereastr care ne invit s alegem tipul
graficului pe care-l dorim. Avem de ales ntre un grafic simplu (Simple),
care ne intereseaz i pe noi, un grafic cu linii multiple (Multiple), cepermite trasarea a dou sau mai multe variabile pe ace-
lai grafic i un grafic de tip pivot (Drop-line), cu
ajutorul cruia putem reprezenta dou sau mai multe
categorii de date. Pentru exemplul nostru, vom alege
graficul de tip simplu. La fel ca n cazul graficului cu
bare, i aici avem cele trei opiuni cu exact aceeai
semnificaie. Vom alege, ca i n exemplul anterior,opiunea Values of individual cases,deoarece dorim
s reprezentm un poligon al
frecvenelor individuale. Pentru
a putea lansa procedeul de definire a graficului, putem
apsa butonul Define.
Observm apariia unei ferestre identice cu fe-
reastra pe care am ntlnit-o la graficul cu bare i careare exact aceeai funcionalitate. Nu vom intra din
nou n detalii
asupra elemen-
telor pe care le
gsim aici, deoarece ele au fost discu-
tate la graficul cu bare. Vom transfera
doar variabila Coeficient de inteli-
gen, din lista variabilelor n lista
Line Represents, pentru a indica
programului SPSS variabila pe care
urmeaz s o reprezinte prin linii. De
fapt, aceasta este singura diferen
ntre cele dou ferestre. n fereastra
Figura 4.7Meniul
pentru graficul cu linii
Figura 4.8Selecta-rea tipului de grafic cu
linii
Figura 4.9Definirea graficului simplu cu
linii
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
38/154
Statistic aplicat n tiinele socio-umane
106
anterioar, acest element se numea Bar
Represent, deoarece era vorba de un
grafic cu bare, iar aici se numete LineRepresents, deoarece suntem n faa
unui grafic cu linii.Nu ne rmne acum
dect s apsm butonul OK care
vedem c s-a activat, pentru a lansa pro-
cedura de desenare a graficului. Iat, n
fereastra de rezultate, apare dup cteva
momente i poligonul frecvenelorindividuale pe
care l-am solicitat.
Cum am putea totui s reprezentm grafic
poligonul frecvenelor absolute cumulate? Ne
amintim, din capitolul despre organizarea datelor,
c frecvenele cumulate se calculeaz prin aduga-
rea frecvenei unei valori la frecvena cumulat avalorii anterioare, irul valorilor fiind un ir ordo-
nat. La fel, am vzut c la desenarea unui grafic cu
linii (sau cu bare) n SPSS, avem la dispoziie mai
multe opiuni, iar
noi nu am folosit
dect opiunea Values of individual cases.
De data aceasta, vom merge tot n meniulGraphs, opiunea Line.. . Nu vom mai
alege acum Values of individual cases, ci
Summaries for groups of cases, adic i
vom comunica programului s cumuleze ntr-
un fel valorile unei variabile. Rmnem tot la
graficul simplu, deoarece ne intereseaz s
Figura 4.11Configurareagraficului pentru
recvenele cumulate
Figura 4.12Stabilirea parametri-
lor de configurare a frecvenelorcumulate
302928272625242322212019181716151413121110987654321
Case Number
125
120
115
110
105
100
ValueCoeficientdeinteli
genta
Figura 4.10Poligonul frecvene-
lor absolute pentru coeficientul deinteligen
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
39/154
Cristian Opariuc-Dan
107
reprezentm o singur linie i nu un grup de linii sau categorii de linii. Lan-
sm apoi procedura de definire a graficului, prin apsarea butonului
Define.
n momentul n care am schimbat opiunea cu care vom defini datele
n zona grafic, evident, va aprea o alt fereastr de definiie a datelor, ca n
figura alturat.
Exist multe elemente comune cu fereastra anterioar, ns i seciuni
specifice pe care vom ncerca s le descriem pe scurt. Cea mai important
seciune este Line Represents, n care nu mai introducem pur i simplu
variabila, ci definim modul n care vor fi cumulate datele. Putem opta pentru
N of cases,prin care SPSS va numra apariiile fiecrei valori n irul de
date, obinnd un poligon al frecvenelor absolute pe date grupate, Cum.
N,adic apariiile fiecrei valori n irul de date (frecvenele), dar prezentate
cumulat i exprimarea procentual a acestora (sau frecvenele relative i rela-
tive cumulate)% of casesi Cum. %. Exist i posibilitatea s repre-
zentm grafic anumite statistici, folosind opiunea Other statistics, situaien care va trebui s includem varia-
bila pentru care vom extrage anumii
indicatori statistici i, de asemenea,
s precizm ce indicatori se vor fo-
losi prin activarea butonului
Change Statistic. Nu intrm
acum n detalii legate de aceastopiune. n cazul nostru, am ales
opiunea Cum. N,deoarece dorim
s reprezentm frecvenele cumulate
absolute. Avem de stabilit i variabi-
la pentru care vom desena poligonul
frecvenelor cumulate absolute, pe care trebuie s o introducem n cmpul
Category Axis:,folosind butonul de transfer din faa acestui cmp. Acum,
124121120111110109108107105104103101100
Coeficient de inteligenta
30
25
20
15
10
5
0
CumulativeFrequency
Figura 4.13Poligonul frecvenelor
cumulate
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
40/154
Statistic aplicat n tiinele socio-umane
108
nu mai trebuie dect s apsm butonul OK i obinem, iat, poligonul
frecvenelor absolute cumulate aa cum ne-am dorit. Folosind celelalte trei
opiuni, pot fi desenate poligoanele frecvenelor absolute i ale frecvenelorrelative i relative cumulate, activiti pe care vi le lsm ca exerciiu.
Reprezentarea procentual a unor variabile
categoriale, cum ar fi genul biologic sau nivelul
de colarizare, se poate face, cel mai bine, folosind
un grafic de tip plcint (pie), numit i diagram
de structur. Cu ajutorul programului SPSS, vom
ncerca s desenm graficul de tip plcint pentruvariabila nivel de colarizare. Pentru a reui acest
lucru, vom apela tot
la meniul Graphs
i vom alege apoi
submeniul Pie....
De aceast dat, nu mai avem ce tip degrafic plcint s selectm, iar urmtoarea
fereastr prezint doar cele trei opiuni pe care
le-am discutat. Vom selecta acum prima
opiune, Summaries for groups of
cases, deoarece ne intereseaz s re-
prezentm grafic frecvenele cu care
apar subiecii cu studii primare, cei cugimnaziu, cu liceu etc. i, n plus,
aceast reprezentare s aib un caracter
procentual. Deci, alegnd aceast opi-
une, SPSS va aduna cazurile care au o
aceeai valoare.
Figura 4.15Alegerea tipului de
grafic
Figura 4.16Configurarea reprezentrii
prin diagram de structur
Figura 4.14Meniul
pentru diagramele destructur
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
41/154
Cristian Opariuc-Dan
109
Pentru a defini graficul, procedm ca i n exemplul anterior, apsnd
butonul Define. Se va deschide fereastra de definire a graficului, o fereas-
tr pe care o cunoatem deja de la reprezentarea poligonului frecvenelor cu-mulate. Singura deosebire const n seciunea Slices Representssau, tra-
dus, ce reprezint feliile plcintei. Evident, n aceast seciune am selectat
opiunea % of cases,adic amcomunicat programului SPSS s-mi repre-
zinte grafic procentul n care se gsete fiecare nivel al acestei variabile n
eantionul total.
Desigur, trebuie s precizm i variabila pentru care vor fi reprezenta-
te grafic procentele. Acest lucru l putem face prin transferarea variabileiNivelul de colarizare din lista variabilelor din baza de date n caseta De-
fine Slices by:Selectai, aadar, vari-
abila n lista variabilelor din baza de
date i apsai butonul de transfer din
faa acestui element pentru a obine o
imagine ca n figura alturat. n acest
moment, se activeaz i butonul OK
pe care va trebui s apsm pentru a
lansa n execuieprocedura de desena-
re a graficului. Dup cteva momente,
obinemn fereastra de rezultate urm-
torul grafic plcint:
Observm c acest grafic prezint i o legend prin care suntem in-formai asupra categoriilor variabilei analizate. Putem cu uurin constata c
majoritatea subiecilor sunt absolveni de liceu, apoi, n proporii relativ ega-
le, absolveni de postliceal i facultate. Cei mai puini sunt cei cu studii pri-
mare i gimnaziale.
Iat, aadar, cteva metode extrem de simple prin care putem desena
grafice intuitive utiliznd aplicaia SPSS. Toate aceste statistici pe care le-am
Facultate
Postliceala
Liceu
Gimnaziu
Primare
Nivelul de scolarizare
Figura 4.17Diagrama de structur pentru
nivelul de studii
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
42/154
Statistic aplicat n tiinele socio-umane
110
prezentat i pe care le vom mai prezenta fac parte din analiza de date explo-
ratorie,deoarece scopul acesteia este acela de a explora, de a cunoate struc-
tura datelor analizate.
V mai amintii, desigur,
fereastra studiat n capitolul ante-
rior, prin care am calculat indica-
torii tendinei centrale. Iat-o, v-o
reamintesc, iar dumneavoastr va
trebui s gsii comenzile prin
care s ajungei la ea, deoarecereprezentarea grafic a datelor se
poate face i n acest mod. S in-
troducem, la fel ca n capitolul
anterior, variabila Coeficient de inteligen, pentru a extrage indicatorii
tendinei centrale. Sper c v amintii cum se face. Dac nu, v dau un indi-
ciu: folosii butonul Statistics. Iat c, lng acest buton, se afl un alt
buton, butonul Chartspe care vom
apsa. Se deschide o nou fereastr, n
care putem stabili ce grafic s desenm
pentru variabila introdus n analiz.
Opiunea None nu deseneaz niciun
fel de grafic i ignor setrile grafice.
Opiunea Bar charts deseneaz un
grafic cu bare, opiunea Pie charts
deseneaz grafice plcint i, iat, opiu-
nea Histograms: ne permite desena-
rea unei histograme. Aceast opiune o
ntlnim aici, alturi de caseta de bifare
With normal curvece permite dese-
narea curbei normale care caracterizeaz datele din variabila noastr.Nu vom
Figura 4.18Selectarea variabilei ce ur-
meaz s fie reprezentat
Figura 4.19Modul de reprezentare
grafic din analiza frecvenelor
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
43/154
Cristian Opariuc-Dan
111
bifa acum aceast caset, deoarece despre curba normal vom discuta ntr-un
alt capitol. Ne rezumm s alegem doar graficul sub form de histogram.
Anumite grafice pot fi reprezentate sub form de frecvene absolute(opiunea Frequencies) sau sub form de frecvene relative (opiunea
Percentages), prin selectarea uneia dintre cele dou opiuni din seciunea
Chart Values. Folosind
aceast fereastr, avem de
configurat mult mai puine
elemente. Deoarece am in-
trodus anterior variabila pe
care dorim s o analizm,
SPSS va lua singur decizia
modului n care va desena
graficul. Apsm butonul
Continue pentru a con-
firma aciunea noastr i
apoi butonul OKpentru a
lansa analiza.
Dup cteva momen-
te, SPSS va extrage indicatorii tendinei centrale sub forma celor dou tabele
discutate n capitolul anterior, ns ne va oferi i histograma variabilei Coe-
ficient de inteligen, alturi de o serie de date din inventarul statistic de
baz, pe care le vom discuta ntr-un alt capitol.
IV.2Analiza grafic a tendinei centrale
Afirmam n capitolul dedicat indicatorilor tendinei centrale c media
este cel mai fin, cel mai precis indicator, ns ea are o problem este sen-
sibil la scoruri extreme i, n acest caz, nu mai aproximeaz bine tendina
central a setului de date. Totui, cum ne dm seama de existena acestor sco-
ruri extreme? Tot analiza exploratorie ne vine n ajutor. Utiliznd reprezent-
125120115110105100
Coeficient de inteli enta
5
4
3
2
1
0
Frequency
Mean =111,33Std. Dev. =8,511
N =30
Histogram
Figura 4.20Histograma pentru coeficientul
de inteligen
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
44/154
Statistic aplicat n tiinele socio-umane
112
rile de date de mai sus, ne putem face o imagine intuitiv asupra acestor sco-
ruri extreme. Exist oare o metod mai precis de a le depista? Rspunsul
este pozitiv i vom prezenta n continuare dou tipuri de grafice deosebite,dar care pot caracteriza mai precis scorurile extreme.
IV.2.1 Graficul tulpin i frunze
A fost conceput de ctre Tuckey (1977) i se aseamn foarte mult cu
histogramele de frecvene, ns, spre deosebire de acestea, afieaz i scoruri-
le individuale. Un asemenea grafic se deseneaz mai uor manual dect com-
puterizat i ofer o imagine precis a distribuiei, deoarece alturi de repre-zentarea numeric ofer i o imagine vizual a datelor analizate(Dancey, i
alii, 2002).
Dac avem, de exemplu, urmtorul ir ordonat de date: 2, 12, 12, 19,
19, 20, 20, 20, 25 i dorim s construim un grafic tulpin i frunze, acesta
va arta dup cum urmeaz:
Tulpina Frunzele
0 21 22992 0005
Oare ce informaiinoi ne aduce acest grafic i cum se interpreteaz?
Destul de simplu. Tulpina reprezint valorile zecilor, iar frunzele valo-
rile unitilor. Deci, tulpina 0 cuprinde scorurile de la 0 la 9, tulpina 1-
scorurile de la 10 la 19, tulpina 2 - scorurile de la 20 la 29 i aa mai departe.Frunzele reprezint frecvenele scorului observat. Astfel, la tulpina 0 (scoruri
ntre 0 i 9) avem o singur apariie a lui 2. La tulpina 1 (scoruri ntre 10 i
19) avem frunza 2 de dou ori (adic dou apariii ale lui 12) i frunza 9 de
dou ori (dou apariii ale lui 19). La tulpina 2 (scoruri ntre 20 i 29) avem
frunza 0 cu trei apariii (trei scoruri de 20) i frunza 5 cu o singur apariie
(un singur scor de 25). Simplu, nu? Iat c, dei seamn cu o histogram,
acest grafic aduce n plusposibilitatea monitorizrii scorurilor individuale.
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
45/154
Cristian Opariuc-Dan
113
Pentru a nelege mai bine, s considermun set mai voluminos de date:1, 1,
2 ,2 ,2 , 5, 5, 5, 12, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 18, 18, 24, 24, 24,
24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 28, 28, 28, 28, 28, 28, 28, 32, 32, 33,33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 42, 42, 42, 43, 43, 44. Pentru
acest set de date, avem urmtorul grafic tulpin i frunze:
0 112225551 22224444555882 444444555555588888883 223333444444555554 222334Prin aceast reprezentare avem o metod mai concis i mai sintetic
de explorare a unui volum mare de date. Putem observa c scorurile de la
tulpina 2 (ntre 20 i 29) sunt cele mai frecvente, iar datele sunt relativ grupa-
te, fr scoruri extreme. n acest caz, am putea decide utilizarea mediei ca
indicator al tendinei centrale. Comparativ, s considerm un ir de date cu
scoruri extreme i s l reprezentm sub forma acestui grafic.
0, 0, 0, 0, 0, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
5, 5, 5, 5, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 13,13, 13, 13, 13, 18, 18, 18, 23, 64
Graficul pentru acest ir de date ar fi:
0 00000222222223333333335555555555555557777777777777999999991 0000000333338882 36 4
Observm c graficul ne indic faptul c majoritatea scorurilor se si-tueaz sub 20, ns avem i un scor extrem, scorul 64. Iat deci o situaie tip i-
c, n care mediana va fi cel mai bun indicator al tendinei centrale. Totui,
acest grafic efectuat pe blocuri de 10 valori nu este foarte informativ. Nu
avem o reprezentare foarte clar a scorurilor sub 20, deoarece exist foarte
multe. Prin urmare ar fi mai comod pentru noi s reprezentm grafic aceste
scoruri folosind nu blocuri de 10, ci blocuri de cinci (ntre 0 i 4, apoi ntre 5
-
8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf
46/154
Statistic aplicat n tiinele socio-umane
114
i 9, ntre 10 i 14 i aa mai departe). Folosind un asemenea sistem, graficul
devine:
0. 00000222222223333333330* 5555555555555557777777777777999999991. 000000033333
1* 888
2. 3
6. 4
Observm c am folosit punctul (.) pentru a desemna prima jumtate a
blocului (0-4) i stelua (*) pentru a desemna a doua jumtate a blocului (5-9). De data aceasta, lucrurile au devenit ceva mai clare. Existacelai scor
extrem, 64, ns acum putem afirma precis c cei mai muli subieci au obi-
nut rezultate ntre 5 i 9, ceea ce reprezint un plus de informaie. Rolul aces-
tei reprezentri este mai ales acela de a identifica existena scorurilor extreme
ntr-un set de date n vederea stabilirii indicatorului tendinei centrale ce va fi
folosit.
Discutam, pe la nceputul lucrrii noastre, despre situaia n care or-donm toate valorile posibile i apoi stabilim frecvenele absolute prin num-
rarea apariiilor fiecrui scor individual. La fel, am abordat i problema orga-
nizrii datelor n clase. Am vzut atunci c un numr mare de clase reprezint
o abordare analitic, accentul cznd mai mult pe valori individuale i se
pierde tendina de ansamblu. Analog, un numr mic de clase determin o
perspectiv sintetic, unde vedem clar tendina de ansamblu, ns de pierde
viziunea individual. Unul dintre avantajele incontestabile ale acestui graficeste acela c permite o viziune de ansamblu fr, ns, a se pierd