Hi-Patrat şi testul T

luni, 20 aprilie 2009 | Etichete: , , | |

Calculul statisticii hi-Pătrat se poate face prin accesarea meniului [Statistics => Summarize => Crosstabs...]. Această procedură va fi prima introducere în procedeul de codare a datelor, în cadrul editorului de date. La acest punct datele au fost introduse în format tip coloană. Acest format presupune o variabilă pe fiecare coloană. Totuşi, metoda respectivă nu este suficientă în anumite situaţii, incluzând calcularea lui hi-Pătrat, testul t independent şi orice design factorial ANOVA cu factori inter-subiecţi. În afară de acestea există multe alte cazuri care însă nu vor fi acoperite în acest tutorial. Esenţial, datele trebuie introduse într-un format specific care face analiza posibilă. Formatul reflectă de obicei designul studiului, cum va fi demonstrat în exemple.

Tabelul de mai jos - include datele observate şi datele aşteptate în paranteze.

Vină Vinovat
Nevinovat
Total
Scăzută 153(127.559) 24(49.441) 177
Ridicată
105(130.441) 76(50.559) 181
Total 258 100 358

Pentru statistica hi-Pătrat, tabelul de date poate fi codat prin indexarea coloanei şi rândului observaţiilor. De exemplu, calculul pentru vinovat cu vină Scăzută este 153. Această celulă specifică poate fi indexată, venind din rândul=1 şi coloana=1. La fel, Nevinovat cu vină Ridicată este codat ca rândul=2 şi coloana=2. Pentru fiecare observaţie, patru în cazul acesta, există un cod unic pentru locaţie în cadrul tabelului. Acestea pot fi introduse astfel,

Rând
Coloană Numărătoare
1 1 153
1 2 24
2 1 105
2 2 76

  • Astfel, 2 rânduri * 2 coloane egal 4 observaţii.
  • Pentru fiecare dintre rânduri, există 2 coloane corespondente, care sunt reflectate în coloana Numărătoare. Coloana Numărătoare reprezintă numărul de combinaţii unice dintre Rând şi Coloană care au loc.
Mai sus sunt prezentate date într-o manieră non-ambiguă. Odată introduse, analiza este o metodă de a selecta itemii de meniu doriţi şi poate selectarea opţiunilor adiţionale pentur această statistică [Nu uitaţi să folosiţi facilitatea de etichetare, menţionată anterior, pentru a identifica uşor coloanele/variabilele. Etichetele alese vor apărea în fereastra output.]

Pentru a executa analiza,

  • Primul pas este să informezi SPSS-ul că variabila NUMĂRĂTOARE reprezintă frecvenţa fiecărei codări unice ale RÂNDULUI ŞI COLOANEI, invocând comanda PONDERE (WEIGHT). Pentru a face acest lucru, daţi click pe [Data => Weight Cases]. În cuita de dialog rezultată, activează opţiunea Weight cases by, apoi mutaţi variabila COUNT în cutia Frequency Variable. Dacă acest pas este uitat, suma pentur fiecare celulă va fi 1 pentru tabel.


  • Acum că variabila COUNT a fost procesată ca variabilă ponderată, selectaţi [Statistics => Summarize => Crosstabs...] pentru a lansa cutia de dialog de control.
  • În partea de jos a cutiei de dialog sunt trei butoane, cel mai important fiind butonul [Statistics...]. Trebuie să daţi click pe butonul [Statistics...] şi apoi să selectaţi opţiunea Chi-square, altfel statistica nu va fi calculată. Explorând cutia de dialog clarificăm faptul că SPSS-ul poate fi forţat să calculeze un număr de alte statistici în conjuncţie cu hi-Pătrat. De exemplu, se pot selecta măsuri variate de asociere (ex. coeficient de contingenţă, phi şi cramer's v,...), printre altele.
  • Mutaţi variabila RÂND în cutia Row(s):, şi variabila COLOANĂ în cutia Column(s):, apoi daţi click pe [OK] pentru a executa analiza. Un subset al output-ului arată ca următorul exemplu,



Testul T

Până acum, ar trebui să ştiţi că există două forme ale testului t, unul pentru variabile dependente şi unul pentru variabile independente, sau observaţii. Pentru a informa SPSS-ul, sau orice alt pachet statistic, despre tipul de design este necesar să aveţi modalităţi diferite de a aşeza datele. Pentru designul dependent, cele două variabile în cauză trebuie introduse în două coloane. Pentru teste t independente, observaţiile pentru cele două grupuri trebuie să fie codate unic cu o variabilă Grup. La fel ca în cazul calculării statisticii hi-pătrat, aceste calcule vor întări practica gândirii asupra, şi aştezarea datelor în formatul corect.

Testul t Dependent

Pentru a calcula această statistică, trebuie selectată [Statistics => Compare Means => Paired-Samples T Test...] după introducerea datelor.

  • Întroduceţi datele într-un nou fişier de date. Datele ar trebui să arate cma ca următoarele. Aceasta înseamnă, că cele două variabile ar trebui să ocupe două coloane diferite...


    Mnths_6Mnths_24
    124 114
    94 88
    115 102
    110 2
    116 2
    139 2
    116 2
    110 2
    129 2
    120 2
    105 2
    88 2
    120 2
    120 2
    116 2
    105 2
    ... ...
    ... ...
    123 132

    Notaţi că numele variabilelor încep cu o literă şi sunt mai mici de 8 caractere. Acest lucru poate fi constrângător, totuşi, se poate folosi opţiunea de etichetare a variabilei, pentru a eticheta o variabilă cu un nume mai lung. Acest nume mai descriptiv va fi apoi reprodus în fereastra output.

  • Pentru a calcula statistica t daţi click pe [Statistics => Compare Means => Paired-Samples T Test...], apoi selectaţi cele două variabile de interes. Pentru a selecta cele două variabile , ţineţi apăsată tasta [Shift] în timp ce folosiţi mouse-ul pentru selecţie. Veţi nota faptul că, cutia de selectare necesită ca variabilele să fie selectate câte două odată. Îndată ce cele două variabile au fost selectate, mutaţi-le în lista Paired Variables:. Această procedură poate fi repetată pentru fiecare pereche de variabile care trebuie analizate. În acest caz, selectaţi variabilele MNTHS_6 şi MNTHS_24 împreună, apoi mutaţi-le în lista Paired Variables. În final, daţi click pe butonul [OK].

    Rezultatul critic pentru analiza curentă va apărea în fereastra output ca în modul următor ,



    După cum vedeţi, o valoare t exactă este oferită cu o valuare p exactă, şi această valoare p este mai mare decât valoarea aşteptată de 0.025, pentru o măsurare bi-direcţională. Examinările mai apropiate indică încă alte câteva statistici prezentate în fereastra output.

Testul t dependent

Când calculăm un test t independent, singua diferenţă implică modul în care datele sunt formatate în fişierul de date. Fişierul de date trebuie să includă atât datele brute, cât şi codarea de grup, pentru fiecare variabilă.

Uitaţi-vă la tabelul următor pentru a vă obişnui cu modul în care se codează datele.

GroupExp_Con
196
1127
1127
1119
1109
1143
1...
1...
1106
1109
2114
288
2104
2104
291
296
2...
2...
2114
2132

Mai sus puteţi vedea că am folosit variabila "Grup" pentru a coda cele două variabile. Valoarea 1 a fost folosită pentru a coda "LBW-Experimental", în timp de valoarea 2 a fost folosită pentru a coda "LBW-Control".

Pentru a genera statistica t,

  • Daţi click pe [Statistics => Compare Means => Independent-Samples T Test] pentur a lansa cutia de dialog necesară.
  • Selectaţi "exp_con" - din lista de variabile dependente - şi mutaţi-o în cutia Test Variable(s):.
  • Selectaţi "grup" - din lista de variabile de grupare - şi mutaţi-o în curia Grouping Variable:.
  • Ultimul pas necesită ca grupurile să fie definite. Acest lucru înseamnă că trebuie specificat faptul că Group1 - grupul experimental în acest caz - este codat 1, şi Group2 - grupa de control în acest caz - este codat 2. Pentru a face acest lucru, daţi click pe butonul [Define Groups...]. Daţi click pe butonul [Continue] pentru a va întoarce la cutia de dialog de control.
  • Rulaţi analiza prin accesarea butonului [OK].

    Outputul analizei curente arată în felul următor:


Valoarea lui p de .004 este mult mai mică decât pragul de 0.025, şi acest lucru sugerează că mediile sunt semnificativ diferite. În plus, un Test Levene poate fi executat pentru a ne asigura că sunt folosite rezultatele corecte. În cazul nostru varianţele sunt egale, totuşi, calculele pentru varianţele inegale sunt şi ele prezente, printre alte statistici - unele nefiind prezente.

1 comentarii:

  1. Anonim says:

    nevoia de a verifica:)