lojistik regresyon analizi: kavram ve uygulama

52
DURU / Uyum Zorluklarını Yordamada Yalnızlık, Sosyal Destek ve Sosyal Bağlılık Arasındaki... 1357 Lojistik Regresyon Analizi: Kavram ve Uygulama Ömay ÇOKLUK* Öz Lojistik regresyon analizinin temel odağı, bireylerin farklı gruplara ayrılarak sınıflanması- dır. Bu çalışmada, iki kategorili (ikilem/dichotomous/binary) bağımlı değişken olarak ifa- de edilen belirli gruplara üye olma durumunu en iyi açıklayan bağımsız değişkenler kom- binasyonunu belirlemeye yönelik ikili lojistik regresyon analizinin (binary logistic regres- sion analysis) temel kavram ve süreçlerini açıklamak amaçlanmaktadır. Bu çalışmada yer alan bağımsız değişkenler; “Bilimsel Düşünme Becerisi Ölçeği” toplam puanı, “Episte- molojik İnanç Ölçeği” toplam puanı ve “Fatalizm Ölçeği” toplam puanıdır. Bağımlı (yor- danan, ölçüt) değişken ise, eleştirel düşünme düzeyidir. Üç bağımsız değişken de sürek- li iken, bağımlı değişken, düşük ve yüksek eleştirel düşünme düzeylerinden oluşan ka- tegorik bir değişken olarak tanımlanmıştır. Bu çalışmanın araştırma grubu, 2006-2007 Eğitim-Öğretim yılında Ankara Üniversitesi Eğitim Bilimleri Fakültesi’nin, Rehberlik ve Psikolojik Danışmanlık bölümünde öğrenim görmekte olan toplam 200 öğrenciden oluş- maktadır. Araştırmada, Deryakulu ve Büyüköztürk (2002) tarafından Türkçeye uyarlan- mış olan “Epistemolojik İnanç Ölçeği”, Kökdemir (2003) tarafından Türkçeye uyarlanmış olan “Kaliforniya Eleştirel Düşünme Eğilimi Ölçeği”, Gündoğdu (2002) tarafından ge- liştirilen “Bilimsel Düşünme Becerisi Ölçeği (BDBO)” ve Şekercioğlu (2008) tarafından geliştirilen “Fatalizm Ölçeği (FO)” kullanılmıştır. Çalışmada lojistik regresyon analizinin her bir işlem adımının sırasıyla nasıl değerlendirileceğine ilişkin bilgiler sunulmuştur. Ça- lışma sonucunda amaçlanan model değişkenlerinin katsayı tahminleri incelendiğinde, bi- limsel düşünme becerisi yordayıcı değişkenindeki 1 birimlik artışın, yüksek eleştirel dü- şünme odds’unda %14.4’lük artışa yol açtığı saptanmıştır. Epistemolojik inanç yordayıcı değişkenindeki 1 birimlik artışın ise, yüksek eleştirel düşünme odds’unda %4.9’luk artı- şa yol açtığı belirlenmiştir. Anahtar Kelimeler Lojistik Regresyon Analizi, Eleştirel Düşünme, Bilimsel Düşünme Becererisi, Epistemo- lojik İnanç, Fatalizm. * Ankara Üniversitesi Eğitim Bilimleri Fakültesi, Ölçme ve Değerlendirme Bölümü, Eğitim İstatistiği ve Araştırma Anabilim Dalı Öğretim Üyesi. Kuram ve Uygulamada Eğitim Bilimleri / Educational Sciences: eory & Practice 10 (3) • Yaz / Summer 2010 • 1357-1407 © 2010 Eğitim Danışmanlığı ve Araştırmaları İletişim Hizmetleri Tic. Ltd. Şti.

Upload: hadat

Post on 03-Feb-2017

300 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: Lojistik Regresyon Analizi: Kavram ve Uygulama

DURU / Uyum Zorluklarını Yordamada Yalnızlık, Sosyal Destek ve Sosyal Bağlılık Arasındaki... • 1357

Lojistik Regresyon Analizi: Kavram ve Uygulama

Ömay ÇOKLUK*

ÖzLojistik regresyon analizinin temel odağı, bireylerin farklı gruplara ayrılarak sınıflanması-dır. Bu çalışmada, iki kategorili (ikilem/dichotomous/binary) bağımlı değişken olarak ifa-de edilen belirli gruplara üye olma durumunu en iyi açıklayan bağımsız değişkenler kom-binasyonunu belirlemeye yönelik ikili lojistik regresyon analizinin (binary logistic regres-sion analysis) temel kavram ve süreçlerini açıklamak amaçlanmaktadır. Bu çalışmada yer alan bağımsız değişkenler; “Bilimsel Düşünme Becerisi Ölçeği” toplam puanı, “Episte-molojik İnanç Ölçeği” toplam puanı ve “Fatalizm Ölçeği” toplam puanıdır. Bağımlı (yor-danan, ölçüt) değişken ise, eleştirel düşünme düzeyidir. Üç bağımsız değişken de sürek-li iken, bağımlı değişken, düşük ve yüksek eleştirel düşünme düzeylerinden oluşan ka-tegorik bir değişken olarak tanımlanmıştır. Bu çalışmanın araştırma grubu, 2006-2007 Eğitim-Öğretim yılında Ankara Üniversitesi Eğitim Bilimleri Fakültesi’nin, Rehberlik ve Psikolojik Danışmanlık bölümünde öğrenim görmekte olan toplam 200 öğrenciden oluş-maktadır. Araştırmada, Deryakulu ve Büyüköztürk (2002) tarafından Türkçeye uyarlan-mış olan “Epistemolojik İnanç Ölçeği”, Kökdemir (2003) tarafından Türkçeye uyarlanmış olan “Kaliforniya Eleştirel Düşünme Eğilimi Ölçeği”, Gündoğdu (2002) tarafından ge-liştirilen “Bilimsel Düşünme Becerisi Ölçeği (BDBO)” ve Şekercioğlu (2008) tarafından geliştirilen “Fatalizm Ölçeği (FO)” kullanılmıştır. Çalışmada lojistik regresyon analizinin her bir işlem adımının sırasıyla nasıl değerlendirileceğine ilişkin bilgiler sunulmuştur. Ça-lışma sonucunda amaçlanan model değişkenlerinin katsayı tahminleri incelendiğinde, bi-limsel düşünme becerisi yordayıcı değişkenindeki 1 birimlik artışın, yüksek eleştirel dü-şünme odds’unda %14.4’lük artışa yol açtığı saptanmıştır. Epistemolojik inanç yordayıcı değişkenindeki 1 birimlik artışın ise, yüksek eleştirel düşünme odds’unda %4.9’luk artı-

şa yol açtığı belirlenmiştir.

Anahtar KelimelerLojistik Regresyon Analizi, Eleştirel Düşünme, Bilimsel Düşünme Becererisi, Epistemo-

lojik İnanç, Fatalizm.

* Ankara Üniversitesi Eğitim Bilimleri Fakültesi, Ölçme ve Değerlendirme Bölümü, Eğitim İstatistiği ve Araştırma Anabilim Dalı Öğretim Üyesi.

Kuram ve Uygulamada Eğitim Bilimleri / Educational Sciences: Theory & Practice10 (3) • Yaz / Summer 2010 • 1357-1407

© 2010 Eğitim Danışmanlığı ve Araştırmaları İletişim Hizmetleri Tic. Ltd. Şti.

Page 2: Lojistik Regresyon Analizi: Kavram ve Uygulama

1358 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Yrd. Doç. Dr. Ömay ÇOKLUKAnkara Üniversitesi Eğitim Bilimleri Fakültesi

Ölçme ve Değerlendirme BölümüEğitim İstatistiği ve Araştırma Anabilim Dalı

Elektronik Posta: [email protected]

Yayın ve Diğer Çalışmalardan SeçmelerBüyüköztürk, Ş. & Çokluk-Bökeoğlu, Ö. (2008) Discriminant function analysis: Concept and appli-

cation. Eurasian Journal of Educational Research. 33, 73-92.Çokluk-Bökeoğlu, Ö. (2008). Testing the factor structure of California Mental Motivation Scale in Turkish primary school students and examining its relation to academic achievement. World Applied

Sciences Journal, 4(1).94-99.Yılmaz, K. ve Çokluk-Bökeoğlu, Ö. (2008). İlköğretim okulu öğretmenlerinin yeterlik inançları. An-

kara Üniversitesi, Eğitim Bilimleri Fakültesi Dergisi, 41(2). 143-167. Çokluk-Bökeoğlu, Ö. ve Yılmaz K. (2008, Bahar). İlköğretim okullarında örgütsel güven hakkında

öğretmen görüşleri. Kuram ve Uygulamada Eğitim Yönetimi, 54, 211-233. Çokluk-Bökeoğlu, Ö. ve Yılmaz, K. (2007).Üniversite öğrencilerinin fakülte yaşamının niteliğine iliş-kin görüşlerinin çeşitli değişkenler açısından incelenmesi. Ankara Üniversitesi, Eğitim Bilimleri Fakül-

tesi Dergisi, 40 (2). 179-204. Yılmaz, K. ve Çokluk-Bökeoğlu, Ö. (2006, Bahar). Fakülte Yaşamının Niteliği Ölçeği geçerlik ve gü-

venirlik Çalışması. Gazi Türk Eğitim Bilimleri Dergisi, 4(2), 201-210.Çokluk-Bökeoğlu, Ö. ve Yılmaz, K. (2005). Üniversite öğrencilerinin eleştirel düşünmeye yönelik

tutumları ile araştırma kaygıları arasındaki ilişki. Kuram ve Uygulamada Eğitim Yönetimi, 41, 47-67.

Page 3: Lojistik Regresyon Analizi: Kavram ve Uygulama

DURU / Uyum Zorluklarını Yordamada Yalnızlık, Sosyal Destek ve Sosyal Bağlılık Arasındaki... • 1359

Lojistik Regresyon Analizi: Kavram ve Uygulama

Ömay ÇOKLUK

Hemen hemen her bilim dalında araştırmacılar, eldeki verilere bağlı ola-rak sistemlerin çalışma kurallarını saptamak istemiş ve bu nedenle de sistemi açıklamaya yarayacak soyut yapılara yönelmişlerdir. Bu soyutla-maları “model” sözcüğü ile tanımlamak mümkündür. Model, bir olay-la ilgili bilgi ya da düşüncelerin belli kurallara bağlı olarak şekillenme-sidir (Tatlıdil, 1996). Lojistik regresyon analizinin kullanım amacı, is-tatistikte kullanılan diğer model yapılandırma teknikleriyle aynıdır. Bu tür analizlerde temel amaç bağımlı (yordanan) ve bağımsız (yordayıcı) değişkenler arasındaki ilişkiyi, en az değişken ile en iyi uyuma sahip ola-cak biçimde tanımlayabilen, kabul edilebilir bir model kurmaktır (Ata-soy, 2001).

Lojistik regresyon analizinin temel odağı, bireylerin hangi grubun üye-si olduğunu kestirmede bir regresyon denklemi oluşturmaktır. Bu çalış-mada, iki kategorili (ikilem/dichotomous/binary) bağımlı değişken ola-rak ifade edilen belirli gruplara üye olma durumunu en iyi açıklayan bağımsız değişkenler kombinasyonunu belirlemeye yönelik ikili lojistik regresyon analizinin (binary logistic regression analysis) temel kavram ve süreçlerini açıklamak amaçlanmaktadır.

Lojistik modelin kullanılması 1845’li yıllara kadar dayanmaktadır. Daha çok sosyo-ekonomik ağırlıklı konuların incelenmesinde kullanılan lo-jistik analiz, ilk önceleri toplumdaki nüfus artışının, matematiksel bir ifadeyle açıklanmasına yönelik çalışmalarda ortaya çıkmıştır (Gürcan, 1998). Lojistik regresyon alanındaki ilk çalışmalar 1944, 1953 ve 1955 yıllarında Berkson tarafından yapılmış olup, 1972 yılında Finney lojistik regresyonu probit analizine bir alternatif olarak önermiştir. Truett ve ar-

Page 4: Lojistik Regresyon Analizi: Kavram ve Uygulama

1360 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

kadaşları 1967, Halpering ve arkadaşları 1971 yılında lojistik regresyo-nun, ortalamanın 0 ve varyansın 1 olduğu normal dağılım sayıltıları ihlal edildiğinde, diskriminant analizine alternatif olarak önermişlerdir. 1975 yılında Koch, eklemeli olasılık modellerindeki etkileşimi yok etmek için lojistik regresyonu önermiştir. Aynı dönemlerde Walker, bağımsız değiş-kenlerin bileşik dağılımının, hem deney, hem de kontrol grubu için aynı varyans – kovaryans matrisi ile çok değişkenli normal dağılıma uyduğun-da risk kestirici olarak kullanılabileceğini belirtmiştir. Lojistik regresyon analizinin özellikle son 20 yıldır askeri konularda, meteorolojide, iç göç hareketlerinde ve eğitim alanında kullanımının arttığı görülmektedir. Bu artışın en önemli nedenlerinden biri, istatistik paket programlarının kul-lanımının yaygınlaşmasıdır. Ancak yine de en yaygın kullanıldığı alan-lardan birinin tıp olduğu gözlenmektedir (Seven, 1997). Örneğin bir tü-mörün kanser olup olmadığını ayırt etmeyi sağlayan bir model oluştur-mak, bir hastalığın tedaviye cevap verip vermediğini belirlemek gibi fark-lı amaçlarla sıkça kullanılmaktadır (Field, 2005).

Uygulamalı sosyal bilimlerde karşılaşılan ve araştırılan olaylara ilişkin elde edilen veriler, çoğunlukla kesikli (süreksiz) değer alan kategorik (sı-nıflamalı) veriler ya da sıralamalı ölçekle elde edilmiş verilerdir. Örne-ğin, bir kişi çalışıyordur ya da işsizdir; bir gruba üyedir ya da değildir; iktidarda sağ kanattan ya da sol kanattan bir parti vardır; kişi bir aka-demik programı tamamlamıştır ya da tamamlamamıştır şeklinde olabi-lir (Arabacı, 2002; Kılıç, 2000; Mertler ve Vannatta, 2005). Eğitim araş-tırmalarında da pek çok problem kategorik sonuçların kestirimi ile ilgi-lidir. Örneğin; bir öğrenci okulda başarılı olur ya da olmaz; bir çocukta öğrenme güçlüğü vardır ya da yoktur; ergenlerin riskli davranışlara eği-limleri vardır ya da yoktur (Peng, Lee ve Ingersoll, 2002). Örneğin Kay-ri ve Okut (2008) tarafından yapılan bir çalışmada, bir üniversitenin be-den eğitimi ve spor öğretmenliği özel yetenek sınavına katılan bireyler, başarılı olanlar olmayanlar, bir diğer deyişle bölüme girmeye hak kaza-nanlar kazanmayanlar (bireyler), cinsiyet değişkenine göre karışımlı lo-jistik regresyon analizi ile modellenmiştir. Kategorik verilerin çok değiş-kenli istatistiksel analizi, hemen hemen tüm alanları ilgilendirmektedir. Lojistik regresyon analizi, regresyon tipi mantığıyla ve diğer analizlere göre daha kullanışlı olmasının sağladığı avantaj sebebiyle, kategorik veri analizinde önemli bir yere sahiptir (Kılıç, 2000).

Lojistik regresyon hem çoklu regresyona, hem de diskriminant anali-zine oldukça benzer. Özellikle, lojistik regresyon ile diskriminant ana-

Page 5: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1361

lizi, bağımlı değişkenin kategorik olması açısından da benzerlik göste-rirler (Büyüköztürk ve Çokluk-Bökeoğlu, 2008). Bununla birlikte lojis-tik regresyon analizi, diskriminant analizi ve çoklu regresyon analizin-den bazı noktalarda farklılıklar gösterir.

Basit ve çoklu doğrusal regresyon analizleri, bağımlı değişken (yorda-nan/ölçüt değişken) ile bağımsız değişken (yordayıcı/açıklayıcı değiş-ken) ya da değişkenler arasındaki matematiksel bağıntıyı analiz etme-de kullanılmaktadır. Bu yöntemlerin uygulanabileceği veri setlerinde bağımlı değişkenin normal dağılım göstermesi, bağımsız değişkenle-rin normal dağılım gösteren değişken ya da değişkenlerden oluşması ve hata terimlerinin varyansının normal dağılım göstermesi gerekir. Bu ve benzeri koşulların yerine getirilmemesi durumunda ise, basit ya da çok-lu doğrusal regresyon analizi kullanılamaz (Kılıç, 2000).

Lojistik regresyon analizi, diskriminant analizi ve çoklu regresyon ana-lizinden farklı olarak bağımsız değişkenlerin dağılımına ilişkin araştır-macılarca karşılanması gereken sayıltılar gerektirmez (Tabachnick ve Fidell, 1996). Bir başka deyişle bağımsız değişkenlerin normal dağıl-ması, doğrusallık ve varyans-kovaryans matrislerinin eşitliği gibi sayıl-tıların karşılanması gerekmez. Dolayısıyla da lojistik regresyonun diğer iki teknikten çok daha esnek olduğu ifade edilebilir. Lojistik regresyo-nun yansız ve sapmasız istatistikler ortaya koyması için büyük örnek-lemler gerektirdiği bildirilmektedir. Özellikle bağımlı değişkenin ikiden fazla kategorisinin olduğu durumlarda, geçerli bir hipotez testi için, her bağımsız değişkende en az 50 kişilik bir grup büyüklüğüne ihtiyaç var-dır. Bazı kaynaklarda bu sayının her bağımsız değişken için minimum 20, toplamda minimum 60 olması gerektiği vurgulanmaktadır. Diğer yandan örneklem büyüklüklerinin aynı olması durumunda, bağımlı de-ğişkenin her bir kategorisinde bağımsız değişkenlerin çok değişkenli normalliğe sahip olması, her bir kategori için varyans ve kovaryansla-rın eşitliği sayıltılarının karşılanması durumunda, daha önce de değinil-diği gibi diskriminant analizi, lojistik regresyon analizine tercih edilme-lidir. Bununla birlikte, lojistik regresyon analizi ile yapılan çözümleme-den elde edilen matematiksel modelin yorumlanmasının daha kolay ol-duğunu belirtmekte yarar vardır (Akkuş ve Çelik, 2004; Grimm ve Yar-nold, 1995; Kalaycı, 2005; Leech, Barrett ve Morgan, 2005; Poulsen ve French, 2008; Tabachnick ve Fidell, 1996; Tatlıdil, 1996).

Kümeleme analizi, log-linear analiz ve probit analizi de lojistik regresyon analizine yakınlığı bulunan tekniklerdir. Ancak bu tekniklerle de temel

Page 6: Lojistik Regresyon Analizi: Kavram ve Uygulama

1362 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

bazı farklılıklar bulunmaktadır. Kümeleme analizinde, lojistik regresyon analizinden farklı olarak grup sayısı ve grup üyelikleri bilinmemektedir. Gözlemler, uzaklık ya da benzerlik ölçütlerine göre kümelendirilmekte-dir. Log-linear analizde ise, tüm değişkenlerin kategorik olması gerekir ve kategorik değişkenlerin beklenen dağılımları Poisson’dır. Link fonksi-yonu, logaritmik link fonksiyonudur ve tahminler lojistik regresyondaki gibi logit Ŷ değeri için değil, kontincensi (contingency) tablosu gözenek-leri için yapılır. Probit analizi de lojistik regresyona oldukça benzerdir ve her iki yöntem ile elde edilen olasılık tahminleri birbirine yakın değerler-dir. Lojistik regresyon analizinde log odds oranları kullanılırken, probit analizinde kümülatif normal dağılım kullanılır (Kalaycı, 2005).

Lojistik regresyon analizinde amaç, kategorik bağımlı değişkenin değe-rini tahmin etmek olduğundan, aslında burada yapılmaya çalışılan iki ya da daha fazla gruba ilişkin “üyelik” tahminidir. Buna göre analizin amaç-larından birinin sınıflandırma, diğerinin ise bağımlı ve bağımsız değiş-kenler arasındaki ilişkileri araştırmak olduğu ifade edilebilir. (Mertler ve Vannatta, 2005).

Sonuç olarak lojistik regresyon analizinin normal dağılım, ortak kovar-yansa sahip olma gibi sayıltıların ihlal edilmesi durumunda, diskrimi-nant analizi ve kontincensi tablo analizine bir alternatif oluşturduğu, bağımlı değişkenin 0 ve 1 gibi ikili (binary) değer aldığı ya da ikiden çok düzey içeren kesikli değişken (polychotomous) olduğu durumlarda nor-mallik sayıltısının bozulması nedeniyle doğrusal regresyon analizine al-ternatif oluşturduğu ifade edilebilir.

Lojistik regresyon analizi adını, bağımlı değişkene uygulanan logit dö-nüştürmeden (logit transformation) almaktadır. Bu durum aynı zaman-da hem kestirim, hem de yorumlama sürecinde bazı farklılıklara neden olur (Hair, Black, Babin, Anderson ve Tatham, 2006). Lojistik regres-yon analizi, bağımlı değişkenin ölçüldüğü ölçek türüne ve bağımlı de-ğişkenin seçenek sayısına göre üçe ayrılmaktadır. Eğer bağımlı değişken iki seçenekli bir kategorik değişken ise “İkili Lojistik Regresyon Ana-lizi (Binary Logistic Regression Analysis)” adını alır. Örneğin bir aka-demik programı bitirme durumuna göre öğrencilerin başarılı ve başarı-sız olarak nitelendirilmesi durumunda ikili lojistik regresyon uygulanır. Eğer bağımlı değişken ikiden çok kategorili (düzeyli) sınıflamalı bir de-ğişken ise “Çok Kategorili/Düzeyli İsimsel Lojistik Regresyon Anali-zi (Multinominal Logistic Regression Analysis)” adını alır. Örneğin üç farklı akademik programda öğrenim görmekte olan öğrencilerden olu-

Page 7: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1363

şan bir bağımlı değişkenin olması durumunda, çok düzeyli isimsel lo-jistik regresyon uygulanır. Eğer bağımlı değişken sıralama ölçeğiyle elde edilmiş ise, bu durumda da “Sıralı Lojistik Regresyon Analizi (Ordinal Logistic Regression Analysis)” kullanılır. Örneğin öğrencilerin öğrenim gördükleri akademik programdaki başarılarının “düşük”, “orta” ve “yük-sek” olarak gruplandığı durumda sıralı lojistik regresyon uygulanır. Lo-jistik regresyon, “tek değişkenli lojistik regresyon (bağımsız değişkenin tek olduğu durum)” ve “çok değişkenli lojistik regresyon (bağımsız de-ğişkenin iki veya daha fazla olduğu durum)” olarak da sınıflandırılmak-tadır (Stephenson, 2008).

Son yıllarda lojistik regresyon analizinin giderek daha yaygın kullanılma-sının nedenleri kısaca şöyle açıklanmaktadır (Cook, 2008; Garson, 2008; Mertler ve Vannatta, 2005; Seven, 1997; Tabachnick ve Fidell, 1996):

1. Bağımlı değişken kategorik (kesikli, süreksiz) olmakla birlikte, ba-ğımsız değişkenler sürekli, kategorik ya da ikilem olabilir. Lojistik regresyon bağımsız değişkenlerin sürekli ya da süreksiz olmasına yö-nelik hiçbir kısıtlama getirmemektedir.

2. Lojistik modelin parametreleri kolaylıkla yorumlanabilmekte ve ma-tematiksel olarak kullanımı kolay olan fonksiyonlar üretilmektedir.

3. Lojistik modele dayalı analizleri yapabilmeyi sağlayan çok sayıda bil-gisayar paket programı (SPSS, SAS vb.) mevcuttur.

4. Bağımsız değişkenlerin olasılık fonksiyonlarının dağılımı üzerinde kısıt olmaması (yarı parametrik) nedeni ile çeşitli testler uygulana-bilmektedir.

5. Lojistik regresyon negatif yordama olasılıkları üretmez; lojistik regres-yonda tüm olasılık değerleri pozitiftir ve ranjı 0 ile 1 arasında değişir.

6. Lojistik regresyon analizi, bağımsız ve bağımlı değişken arasındaki ilişkinin doğrusal olmasını gerektirmez; üstel veya polinom ilişkisi de olabilir. Lojistik regresyon bağımlı ve bağımsız değişkenler arasında logit bir ilişki olduğunu varsayar; dolayısıyla lojistik regresyon doğ-rusal olmayan modeller üretebilir. Bir diğer deyişle lojistik regresyon, doğrusal olmayan ilişkiyi koruyarak, ilişkinin formunu doğrusal hale getiren logaritmik dönüştürmeler yapar. Lojistik regresyon bağımlı değişkene ilişkin verilerin dağılımının bir ya da daha fazla bağımsız değişkenle doğrusal olmayan ilişki gösterdiğinin bilinmesi ya da bek-lenmesi durumunda özellikle yararlıdır.

Page 8: Lojistik Regresyon Analizi: Kavram ve Uygulama

1364 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Çoklu Doğrusal Regresyon ve Lojistik Regresyon Analizinin Kar-şılaştırılması

Her ne kadar sonuçta ortaya çıkan regresyon eşitliği oldukça farklı olsa da, çoklu doğrusal regresyon analizinin temel kavramları lojistik regresyon analizi ile aynıdır (George ve Mallery, 2000). Standart bir regresyon eşit-liği, bağımlı değişkenin değerini yordamak üzere, birkaç bağımsız değiş-kenin gerçek değerleri ile üretilmiş ağırlıkları toplamından oluşur. Buna karşılık lojistik regresyonda tahmin edilen değer, 0 ile 1 arasında değişen bir olasılıktır. Daha net bir ifadeyle lojistik regresyon, her bir denek için belli sonuçların (örneğin “geçti” ya da kaldı”) gerçekleşme olasılığını orta-ya koyar. Analiz bir bireyin kategorilerden birine (“geçti”) ya da diğerine (“kaldı”) girme olasılığını doğru yordamayı sağlayan bir regresyon eşitliği üretir (Tate, 1992). Sonuç olarak iki teknik arasındaki en temel fark, çok-lu doğrusal regresyon analizinde bağımlı değişkenin değeri tahmin edilir-ken, lojistik regresyon analizinde bağımlı değişkenin alabileceği değerler-den birinin gerçekleşme olasılığının tahmin edilmesidir (Bircan, 2004).

Tablo 1, çoklu regresyon ve lojistik regresyonda model uyumuna ilişkin kavramların benzerliklerini, bir başka deyişle çoklu regresyondaki temel bazı kavramların lojistik regresyonda hangi kavramlara karşılık geldiği-ni göstermektedir (Hair ve ark., 2006).

Tablo 1. Çoklu Regresyon ve Lojistik Regresyonda Model Uyumuna İlişkin Temel Kavramlar

Çoklu Regresyon Lojistik Regresyon

Genel Kareler Toplamı Başlangıç Modeli / Temel Model (Base model) için -2LL

Hata Kareler Toplamı Amaçlanan Model (proposed model) için -2LL

Regresyon Kareler Toplamı Başlangıç modeli-Amaçlanan model arasındaki –LL farkı

Model Uyumu için F Testi -2LL farkı için c2 testi

Determinasyon Katsayısı (R 2) Pseudo R 2 ölçümleri

Ayrıca lojistik regresyonda bağımlı değişken 0 ve 1 olmak üzere sade-ce iki değer alıyorsa da, lojistik regresyon katsayılarının kestirilmesi çok-lu regresyona oldukça benzerdir. Lojistik regresyonda model kestirimin-de en küçük kareler (ordinary least square) yöntemi yerine, en çok olabi-lirlik (maximum likelihood) yöntemi kullanılır. Çoklu regresyon analizi, bağımlı değişkene ilişkin gerçek değerler ile kestirilen değerler arasında-ki farkın kareler toplamını en az (minimum) yapmak için, en küçük ka-

Page 9: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1365

reler yöntemini kullanır. Lojistik regresyon ise, lojistik dönüştürme ge-rektiren doğrusal olmayan (nonlinear) doğasından dolayı en çok olabi-lirlik yöntemini kullanır. Bu yöntem katsayıların en çok olabilirlik kesti-rimini bulmak amacıyla kullanılır. Lojistik regresyon sapmaların karesini (en küçük kareler) “en az” yapmak yerine, bir olayın olma (gerçekleşme) olasılığını “en çok (maximum)” yapmakla ilgilenir (Hair ve ark., 2006).

Matematiksel olarak lojistik regresyon olasılık, odds ve odds’un logarit-masına dayanır. Olasılıklar basitçe, belirli bir tipteki sonuç sayısının top-lam olası sonuçlar içerisindeki oranıdır. Örneğin, bir zar atıldığında 3 gel-me olasılığı 1/6’dır. Çünkü zarda sadece bir tane 3 vardır ve 6 olası sonuç vardır. Bu oran .167 ya da %16.70 olarak ifade edilebilir. Lojistik regres-yonda odds, bir olayın olma olasılığının, o olayın olmama olasılığına bölü-mü olarak tanımlanır. Yani bir başka deyişle (Mertler ve Vannatta, 2005):

p (x)Odds

1- p (x)

Burada p(X), bir X olayının gerçekleşme olasılığını, 1-p(X) ise gerçek-leşmeme olasılığını gösterir. Dolayısıyla bir zar atıldığında 3 gelme ola-sılığına ilişkin odds:

p (“3”) .167Odds .200= =

1- p (“3”) .833

Burada dikkat edilmesi gereken nokta, olasılıkların her zaman 0-1 ran-jında değişeceğidir. Ancak odds oranı 1’den büyük olabilir. İkilem olan sonuçlar üzerinde bağımsız değişkenin etkisi odds oranı ile temsil edi-lir. Odds oranı -y ya da Exp(b) (Exponentiated logistic coefficients) ile sembolize edilir (Mertler ve Vannatta, 2005).

Lojistik regresyon analizi sonucunda elde edilen sonuç modeli (amaçla-nan model) doğrusal olmayan bir fonksiyondur. Lojistik regresyondaki anahtar kavram, “logit” kavramıdır. Logit, odds oranının doğal logarit-masıdır. Tekrar basit örneğimize dönecek olursak, bir zarın 3 gelmesine ilişkin odds için logit (Mertler ve Vannatta, 2005):

In(.200)= -1.609

Özellikle lojistik regresyonda Y

<

, yordayıcı değişkenlerin mümkün olan en iyi doğrusal kombinasyonu ile sonuçlanan doğrusal olmayan modele dayalı olarak, bir sonucun ya da diğerinin ortaya çıkma olasılığıdır. Ola-sılık, odds ve logit kavramlarını tek bir eşitlikte bir araya getirdiğimizde (Mertler ve Vannatta, 2005):

Page 10: Lojistik Regresyon Analizi: Kavram ve Uygulama

1366 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Y

<

i= u

u

ee+1

Burada Y

<

i, ncii.' deneğin bağımlı değişkenin kategorilerinin birisinde yer almasına ilişkin kestirilen olasılıktır. e ise 2.718’e eşit bir sabittir. Bu-rada u ise klasik regresyon eşitliğidir:

Kk XBXBXBBu ++++= ............22110

Doğrusal regresyon eşitliği (u) bir grupta bulunma olasılığının, diğer grupta bulunma olasılığına bölünmesinin doğal logaritmasıdır (Tabach-nick ve Fidell, 1996). Doğrusal regresyon eşitliği odds oranının log’unu ya da logitini yaratır:

1n1-

Y

<

Y<

= kk XBXBXBB ++++ ...22110

Burada araştırmacılar genel olarak üretilen modelin uyumunu değerlen-dirmekle birlikte, aynı zamanda bir bütün olarak yordama doğruluğunu da değerlendirmek üzerine odaklanmalıdırlar (Mertler ve Vannatta, 2005).

Bir Olasılığın Odds’a ve Logit Değerlerine Dönüştürülmesi

Lojistik regresyonda olasılık değerleri ranjı 0-1 ile sınırlıdır. Ancak kes-tirilen değerlerin bu ranjın dışına düşmemesi nasıl sağlanabilir ya da bir başka deyişle bu aralığa düşmesi nasıl garantilenebilir? Lojistik dönüş-türme bu işlemi iki adımda gerçekleştirir (Hair ve ark., 2006):

Olasılığın odds Olarak Yeniden İfadelendirilmesi: Orijinal formun-da olasılık 0-1 ranjı ile sınırlıdır. Ancak, odds oranı 0-1 ranjı ile sınırlı de-ğildir. Dolayısıyla da yeni bir değişkenin her zaman 0-1 arasında olasılığa sahip olması, olasılığın odds olarak yeniden ifadelendirilmesi ile sağlanır. Odds iki sonuçtan ya da olaydan birinin ortaya çıkma olasılığının oranı-dır. Yani P/1-P’dir. Bu şekilde ifade edildiğinde, herhangi bir olasılık de-ğeri, doğrudan kestirilebilen metrik bir değişkene dönüştürülmüş olarak tekrar ifade edilmiş olur. Herhangi bir odds değeri de her zaman 0-1 arası bir olasılığa geri çevrilebilir. Dolayısıyla da yordanan değerlerin 0-1 ara-sına düşmesine ilişkin sınırlandırma problemi bu şekilde çözülmüş olur.

Bir sınavda “başarılı” ya da “başarısız” olmaya ilişkin bir örnek üzerinde odds oranının nasıl hesaplanacağını gösterelim. Bu sınavda başarılı olma olasılığı .80 olsun. Bu durumda başarısız olma olasılığı, bir başka deyiş-le alternatif sonucun ortaya çıkma olasılığı .20 olacaktır (.20=1-.80). Bu

Page 11: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1367

olasılığın anlamı, başarılı olmaya ilişkin odds’un 4.00 olması (.80/.20) ya da başarılı olmanın, başarısız olmaya göre 4 kat daha olası olmasıdır. Ter-sine başarısız olmaya ilişkin odds oranı da .25’tir (.20/.80). Bir başka de-yişle başarısızlık, başarılı olma oranının ¼’ü kadardır. Dolayısıyla da de-ğerlendirilen sonuç ne olursa olsun (başarılı ya da başarısız olma) olasılı-ğı odds olarak ifade etmek mümkündür (Hair ve ark., 2006).

Bu bilgilerden yola çıkılarak .50’lik bir olasılık (yani bir olayın olma ya da olmama / ortaya çıkma ya da çıkmama şansının eşit olması durumu) odds’un 1.00 olması ile sonuçlanır. Odds’un 1.00’den küçük olması, ilgi-lenilen olasılığın .50’den az; 1.0’den büyük olması ise .50’den fazla oldu-ğu anlamına gelir. Böylece her zaman 0-1 arasında bir olasılığa dönüş-türülebilen metrik bir değişken elde edilmiş olur (Hair ve ark., 2006).

Logit Değerinin Hesaplanması: Odds, olasılık kestiriminin 0-1 ara-sında olmasına ilişkin problemi ortadan kaldırmakla birlikte, hala çö-zülmesi gereken bir problem daha bulunmaktadır ki, o da odds’un sıfı-rın altında bir değer almamasının nasıl sağlanacağına ilişkindir. Odds’un üst limiti olmamakla birlikte alt limiti 0’dır. Bu sorunun çözümü de lo-git değerinin hesaplanması ile mümkündür. Logit, odds’un logaritması-dır. Odds 1.0’den küçükse logit değeri negatif, büyükse pozitif olur. Odds oranının 1.0 olması durumunda ise (bu .50 olasılığa karşılık gelir), logit 0 olur. Ek olarak negatif değer ne kadar küçük olursa olsun, odds değeri-nin antilogu alınarak 0’dan büyük bir değere dönüşmesi sağlanabilir. Lo-git değerinin hesaplanması ile de yine her zaman 0-1 arasında bir olası-lığa geri çevrilebilen, pozitif ve negatif değerler alabilen metrik bir de-ğişken elde edilmiş olur. Tablo 2’de, bazı olasılıklar ile onlara karşılık ge-len odds ve log odds (logit) değerleri sunulmaktadır (Hair ve ark., 2006).

Tablo 2. Bazı Olasılık Değerlerine Karşılık Gelen Odds ve Log Odds Oranları

Olasılık Odds Log Odds (logit)

.00 .00 Hesaplanamaz

.10 .11 -2.20

.30 .43 -.85

.50 1.00 .00

.70 2.33 .85

.90 9.00 2.20

1.00 Hesaplanamaz Hesaplanamaz

Page 12: Lojistik Regresyon Analizi: Kavram ve Uygulama

1368 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Lojistik Regresyon Analizinin Sayıltı ve Sınırlılıkları

Daha önce de söz edildiği gibi, lojistik regresyon bağımsız değişkenle-rin dağılımına ilişkin herhangi bir sayıltının karşılanmasını gerektirmez (Tabachnick ve Fidell, 1996). Ancak, lojistik regresyonun kullanımı ile ilgili önemli bazı gereklilikler de bulunmaktadır. Birinci nokta, analize giren değişkenlerdeki denek oranları ile ilgilidir. Eğer ele alınan grup-ta yordayıcı değişkenlerin sayısına göre çok az sayıda denek varsa, bazı problemler ortaya çıkabilir. Lojistik regresyon, özellikle de kategorik de-ğişkenlerin kombinasyonu sonucu oluşan hücreler (gözenekler) düşü-nülürse, hiçbir deneğin olmadığı hücre sayısının çok olduğu durumlar-da oldukça geniş parametre kestirimleri ve standart hata üretebilir. Böy-le bir durum ortaya çıkarsa, araştırmacılara kategorik değişkenlere iliş-kin kategori birleştirmelerine gitmeleri, eğer uygunsa sorunlu kategori-yi dışarıda bırakmaları ya da analiz açısından çok önemli değil ise, bu değişkeni tamamen çıkartmaları önerilir (Tabachnick ve Fidell, 1996). Araştırmacılar için diğer bir seçenek de, denek sayısının artırılarak boş kalan hücrelerin doldurulmasını sağlamaya yönelik girişimdir.

İkinci nokta, lojistik regresyon model-veri uyumunu değerlendirmenin bir aracı olarak uyum iyiliği testlerine dayalıdır. Uyum iyiliği testleri ka-tegorik değişkenlerin kombinasyonu ile oluşan veri matrisinde, her bir hücre için beklenen frekansların değerlerini içerir. Eğer hücrelerin her-hangi birinde beklenen frekans çok küçük ise (tipik olarak fb <5 ) ana-lizin gücü çok düşük olur. Tüm kategorik değişken çiftleri, tüm hücre-lerde beklenen frekansın 1’den büyük olduğundan ve beklenen frekan-sın 5’ten küçük olduğu gözenek sayısının %20’yi geçmediğinden emin olmak adına, dikkatle değerlendirilmelidir. Bu koşullardan herhangi bi-rinin karşılanmasında sorun olduğu takdirde, araştırmacı yapacağı ana-lizin gücünün düşük düzeyde olacağını kabul etmeli veya ikiden fazla kategorisi bulunan değişkenlerde birleştirmelere gitmeli ya da toplam hücre sayısını azaltmak için bu kategorik değişkeni dışarıda bırakmalı-dır (Tabachnick ve Fidell, 1996).

Üçüncüsü, çoklu regresyonun tüm türlerinde olduğu gibi, lojistik regres-yonun da bağımsız değişkenler arasındaki yüksek korelasyona oldukça duyarlı olmasıdır. Bu durum bağımsız değişkenler arasında çoklu bağ-lantı (multicollinearity) sorunu ile sonuçlanır. Eğer analize giren değiş-kenler arasında çoklu bağlantı problemi varsa bu sorunu devre dışı bı-rakabilmek için, bir ya da daha fazla değişkenin modelden çıkartılması tavsiye edilir (Tabachnick ve Fidell, 1996). Aksi takdirde çoklu bağlantı

Page 13: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1369

sorunu potansiyel bir problem kaynağı olarak yanlış yorumlamalara ve sonuç çıkartmalara yol açabilir.

Dördüncüsü, yordayıcı değişkene ilişkin uç değerlerin dikkatle incelen-mesi gerekliliğidir. Lojistik regresyon sonucu ortaya çıkan lojistik mo-del, uç değerlere de son derece duyarlıdır. Bu durum, gerçekte bir ka-tegoride yer alan bir deneğin, değişkenin bir diğer kategorisinde gö-rünmesine neden olabilir. Standardize edilmiş hatalar (standardized re-siduals) uç değerleri belirlemek üzere dikkatle incelenmelidir. Belirle-nen herhangi bir uç değer (>|3|) standart yöntemler (veri girişini kont-rol etme, örneklemden çıkarma gibi) kullanılarak elenmelidir (Mertler & Vannatta, 2005). Yani, standart artıkların (residual) -3’ten küçük ve +3’den büyük olmaması gerekmektedir.

Lojistik regresyon analizinde katsayıların elde edilmesinde en küçük kareler yönteminden farklı olarak, en yüksek olabilirlik yöntemi kul-lanıldığından az sayıda gözlemle çalışılmaması gerekmektedir. Çünkü az sayıda gözlemle yapılan tahminlerde modelin güvenilirliği azalmak-tadır. Dolayısıyla da bu açıdan bakıldığında, lojistik regresyon modeli-nin güvenilirliğinin büyük örneklemlerle çalışılması durumunda arttı-ğı belirtilebilir (Cook, 2008). Kararlı ve anlamlı sonuçların elde edilme-si, daha fazla veri gerektirir. Standart bir regresyon analizi ya da disk-riminant analizinde tipik olarak her bağımsız (yordayıcı) değişken için 20 kişilik bir grup alt sınır olarak kabul edilebilir. Ancak lojistik regres-yonda kararlı sonuçlara ulaşmak için, her bağımsız değişkende en az 50 kişilik grupların olmasına ihtiyaç vardır. Bir diğer önemli nokta da, ka-tegorilerin birbirini dışta tutması ve bağımsız olmasıdır. Bir değişkenin bir kategorisinde yer alan bir birey, değişkenin diğer kategori ya da ka-tegorilerinde yer almamalıdır.

Her ne kadar lojistik regresyon iki ya da daha fazla kategorisi olan bir bağımlı değişkeni tahmin etmekte kullanılabilse de, daha önce de de-ğinildiği gibi bu çalışmada sadece iki kategorisi olan bir bağımlı değiş-kenle, bir başka deyişle bağımlı değişkenin ikilem olduğu durumla ilgi-lenilmekte ve dolayısıyla ikili lojistik regresyonun uygulama süreçlerinin gerçek veriler kullanılarak tanıtılması amaçlanmaktadır. Lojistik regres-yon analizinin tanıtılması ve örneklendirilmesinin, eğitim ve psikoloji gibi uygulamalı sosyal bilimler alanında kullanımının yaygınlaşmasına hizmet etmesi açısından yararlı olacağı düşünülmektedir.

Page 14: Lojistik Regresyon Analizi: Kavram ve Uygulama

1370 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

YöntemAraştırma Modeli

Bu çalışma, korelasyonel araştırma niteliğindedir. Korelasyonel araştır-malar, iki ya da daha çok değişken arasındaki ilişkinin, herhangi bir şe-kilde bu değişkenlere müdahale edilmeden incelendiği araştırmalardır. Korelasyonel araştırmalar, değişkenler arasındaki ilişkilerin açığa çıka-rılmasında, bu ilişkilerin düzeylerinin belirlenmesinde etkili ve bu iliş-kilerle ilgili daha üst düzey araştırmaların yapılması için gerekli ipuçla-rını sağlayan araştırmalardır (Büyüköztürk, Kılıç Çakmak, Akgün, Ka-radeniz, ve Demirel, 2008). Bu çalışmada yer alan bağımsız değişken-ler; “Bilimsel Düşünme Becerisi Ölçeği” toplam puanı, “Epistemolojik İnanç Ölçeği” toplam puanı ve “Fatalizm Ölçeği” toplam puanıdır. Ba-ğımlı (yordanan, ölçüt) değişken ise, eleştirel düşünme düzeyidir. Üç ba-ğımsız değişken de sürekli iken, bağımlı değişken, düşük ve yüksek eleş-tirel düşünme düzeylerinden oluşan kategorik bir değişken olarak ta-nımlanmıştır.

Araştırma Grubu

Bu çalışmanın araştırma grubu, 2006-2007 Eğitim-Öğretim yılında Ankara Üniversitesi Eğitim Bilimleri Fakültesi’nin, Rehberlik ve Psiko-lojik Danışmanlık bölümünde öğrenim görmekte olan toplam 200 öğ-renciden oluşmaktadır. Öğrencilerin 64’ü (%32) birinci sınıf, 52’si (%26) ikinci sınıf, 62’si üçüncü sınıf (%31) ve 22’si (%11) dördüncü sınıfta öğ-renim görmektedir. Grubun 128’i kız (%64), 72’si (%36) ise erkek öğ-rencilerden oluşmaktadır.

Veri Toplama Araçları

Araştırmada, Deryakulu ve Büyüköztürk (2002) tarafından Türkçeye uyarlanmış olan “Epistemolojik İnanç Ölçeği”, Kökdemir (2003) tara-fından Türkçe’ye uyarlanmış olan “Kaliforniya Eleştirel Düşünme Eği-limi Ölçeği”, Gündoğdu (2002) tarafından geliştirilen “Bilimsel Dü-şünme Becerisi Ölçeği (BDBO)” ve Şekercioğlu (2008) tarafından ge-liştirilen “Fatalizm Ölçeği (FO)” kullanılmıştır.

Epistemolojik İnanç Ölçeği: Epistemolojik İnanç Ölçeği (EİÖ), Schommer (1990) tarafından bireylerin bilgi ve öğrenme ile ilgili inanç-larını ölçmek amacıyla geliştirilmiştir. EİÖ, Deryakulu ve Büyüköztürk (2002) tarafından Türk kültürüne uyarlanarak Türk üniversite öğren-

Page 15: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1371

cilerinden oluşan 595 kişilik bir grup üzerinde geçerlik ve güvenirli-ği incelenmiştir. Özgün ölçek İngilizce’dir ve dört faktörlü bir yapı al-tında toplam 63 maddeden oluşmaktadır. Yapılan ilk çalışmada ölçeğin Türk kültüründe üç faktörlü bir yapıya sahip olduğu belirlenmiş ve bi-rinci faktör “Öğrenmenin Çabaya Bağlı Olduğuna İnanç”, ikinci fak-tör, “Öğrenmenin Yeteneğe Bağlı Olduğuna İnanç” ve üçüncü faktör ise “Tek Bir Doğrunun Var Olduğuna İnanç” şeklinde adlandırılmıştır. Bi-rinci faktörde 17’si olumsuz, 1’i olumlu toplam 18 madde; ikinci faktör-de hepsi olumlu toplam 9 madde; üçüncü faktörde ise, hepsi olumlu 8 madde olmak üzere toplam 35 madde bulunduğu belirlenmiştir. Ölçe-ğin güvenirliğini sınamak üzere hesaplanan Cronbach Alpha iç tutarlı-lık katsayıları, birinci faktör için .83, ikinci faktör için .62, üçüncü faktör için .59, ölçeğin bütünü için .71 olarak bulunmuştur.

Deryakulu ve Büyüköztürk tarafından 2005 yılında 626 üniversite öğ-rencisi ile yürütülen ikinci çalışmada ise, ilk çalışmada ikinci faktörde yer alan bir madde, çok düşük madde-toplam korelasyonu verdiği için ölçekten çıkartılmıştır. Ayrıca, daha önce birinci faktörde yer alan bir maddenin ise ikinci faktörde yüklendiği belirlenmiştir. Bunun dışında ölçeğin üç faktörlü yapısının korunduğu saptanmıştır. Ayrıca uygula-nan doğrulayıcı faktör analizi sonucunda uyum istatistikleri; GFI=0.89, AGFI=0.87, RMS=0.09 (standardize edilmiş RMS=0.07) olarak belir-lenmiştir. 0.05 olarak hesaplanmış olan RMSEA değerinin de, modelin uyumu için kabul edilir bir değer olduğu ve EİÖ’nin üç faktörlü yapısı-nın kullanılabilir, geçerli bir model olduğu belirtilmiştir. Cronbach alfa iç-tutarlılık katsayıları ise; birinci faktör için .84, ikinci faktör için .69, üçüncü faktör için .64 ve ölçeğin bütünü için ise .81 olarak bulunmuştur.

Bu çalışma kapsamında ise, EİÖ’nin Deryakulu ve Büyüköztürk tara-fından 2005 yılında yapılan ikinci çalışma kapsamında belirlenen 34 maddelik formu kullanılmıştır. Bu haliyle birinci faktörde toplam 17 madde, ikinci faktörde toplam 9 madde, üçüncü faktörde ise toplam 8 madde yer almaktadır. Maddeler “kesinlikle katılmıyorum”dan, “kesin-likle katılıyorum”a doğru uzanan beşli dereceleme formatında yanıtlan-maktadır. Olumlu maddeler 1’den 5’e; olumsuz maddeler ise tersine pu-anlanmaktadır.

Kaliforniya Eleştirel Düşünme Eğilimi Ölçeği: Kaliforniya Eleş-tirel Düşünme Eğilimi Ölçeği, bireylerin eleştirel düşünme eğilimle-rini ölçmeyi amaçlayan bir araç olup 1990 yılında Amerikan Felsefe Derneği’nin düzenlediği Delphi projesinin bir sonucu olarak ortaya çık-

Page 16: Lojistik Regresyon Analizi: Kavram ve Uygulama

1372 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

mıştır. Ölçeğin kuramsal olarak belirlenmiş ve psikometrik olarak da test edilmiş 7 alt ölçeği bulunmaktadır. Orijinal formu İngilizce olup 73 maddeden oluşan aracın Kökdemir (2003) tarafından uyarlaması yapı-lan Türkçe formunda 6 alt ölçek ve 51 madde yer almaktadır. Ancak bazı maddelerin faktörler arasında yer değiştirmesi ve iki faktörün birleşmesi dışında, faktörler ve bu faktörlerin altında yer alan maddelerin, orijinal ölçekten çok farklı olmadığı belirtilmektedir. Ölçeğin alt ölçeklerinin Cronbach-Alpha iç tutarlık katsayıları ise şöyledir: Analitiklik alt ölçe-ği α=.75, Açık Fikirlilik alt ölçeği α=.75, Meraklılık alt ölçeği α=.78, Kendine Güven alt ölçeği α=.77, Doğruyu Arama alt ölçeği α=.61, Sis-tematiklik alt ölçeği α=.63, ölçeğin tümü için ise α=.88’dir (Kökdemir). Bu çalışmada ölçekten alınan toplam puanlar kullanılmıştır.

Bilimsel Düşünme Becerisi Ölçeği: Gündoğdu (2002) tarafından ge-liştirilen Bilimsel Düşünme Becerisi Ölçeği 20 maddeden oluşmaktadır. Ölçek geliştirme çalışması, Hacettepe Üniversitesi’nden seçilen 715 üni-versite öğrencisi üzerinde yapılmıştır. Bilimsel Düşünme Becerisi Öl-çeği, bireylerin üniversite eğitimi sürecinde aldıkları bilimsel düşünme ve bilimsel araştırma bilgilerini günlük yaşamda karşılaştıkları sorunla-rın çözümünde ne ölçüde kullandıklarını ölçülmeyi amaçlamaktadır. Öl-çek, bireylerin karşılaşabileceği problem durumlarından oluşmakta ve bu problemlere yönelik olarak deneklerin hipotez kurabilme, değişkenleri belirleyebilme, verileri ve bilgileri yorumlayabilme, araştırma deseni oluş-turabilme becerilerini ölçmeye yönelik maddeler sunulmaktadır. Ölçeğin her bir maddesi için üçü yanlış, birisi doğru olmak üzere dört seçenek bulunmaktadır. Ölçekten alınabilecek puanlar 0-20 arasında değişmek-tedir. Yüksek puan bilimsel düşünme becerisinin yüksek olduğuna işaret etmektedir. Ölçeğin güvenirlik katsayısı .64 bulunmuştur.

Fatalizm Ölçeği: Şekercioğlu (2008) tarafından öğretmen adayların-dan oluşan bir grup üzerinde geçerlik ve güvenirlik çalışmaları yapılmış olan Fatalizm Ölçeği tek faktör altında toplanan 10 maddeden oluş-maktadır. Ayrıca açımlayıcı faktör analizi ile elde edilmiş olan bu tek faktörlü yapının, doğrulayıcı faktör analizi ile de doğrulandığı belirlen-miştir. Ölçek beşli likert tipi yanıtlama formatına sahip olan ölçek, “hiç uygun değil (1)”, “tamamen uygun (5)” şeklinde puanlanmaktadır. Böy-lelikle ölçekten alınan yüksek puan, yüksek fatalistik düşünce düzeyi-ne sahip olmayı ifade etmektedir. Fatalizm Ölçeği’nin Cronbach-alfa iç tutarlık katsayısı .81 olarak bulunmuştur. 40 kişilik bir grup üzerinde 4 hafta ile yapılan iki uygulama sonucu elde edilmiş olan test-tekrar test güvenirliği ise r=.88 (p<.01) olarak bulunmuştur.

Page 17: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1373

İşlem

Bu çalışmada öğrenciler, Kaliforniya Eleştirel Düşünme Eğilimi Ölçeği’nden aldıkları puanlara göre, düşük ve yüksek eleştirel düşünme düzeyine sahip gruplar olmak üzere ikiye ayrılmıştır. Bu ayrımın ger-çekleştirilmesinde puanlar yaklaşık normal dağıldığı için, kesim noktası olarak aritmetik ortalama kullanılmıştır. Grubun ölçekten alınan puan-lara ilişkin ortalaması yaklaşık olarak 220 olup, bu değer ve altında puan alan öğrenciler “düşük”, üzerinde puan alan öğrenciler ise “yüksek” eleş-tirel düşünme düzeyi kategorisine atanmıştır. Böylelikle analiz için ge-reken iki kategorili bağımlı değişken elde edilmiştir.

İkili lojistik regresyon analizinde bağımlı değişkenin kategorilerinin analize 0 ve 1 şeklinde kodlanmış olarak girilmesi gerekmektedir. İşlem SPSS’de gerçekleştirildiğinde, program herhangi bir şekilde kodlanmış kategorileri 0 ve 1 değerlerine dönüştürmekte ve hangi kategorinin 0’a, hangi kategorinin 1’e dönüştürüldüğüne ilişkin bilgiyi hemen analizin başlangıcında sunmaktadır. Sıfır olarak kodlanan kategori “referans ka-tegori” olarak da adlandırılır. Hangi gruba 0 ya da 1 olarak değer atandığı önemli olmamakla birlikte, bu bilgiye analiz sonucu elde edilen model-deki katsayılar yorumlanırken ihtiyaç vardır. Örneğin, eğer ilgilenilen de-ğişken cinsiyet ise, herhangi bir gruba 1 (örneğin kadın) ve diğer gruba 0 (erkek) değeri atanabilir. Bu durumda katsayılar, bağımsız değişken ya da değişkenlerin, bir bireyin kadın olması olasılığı üzerindeki etkisini yan-sıtır. Çünkü 1 olarak kodlanan kategori “kadın”dır (Hair ve ark., 2006).

Bu bilgiyi örneğimize uyarladığımızda, orijinal verilerde 1: düşük eleşti-rel düşünme düzeyine sahip olma, 2: yüksek eleştirel düşünme düzeyine sahip olma şeklinde kodlanmıştır. Lojistik regresyon analizi uygulandı-ğında program tarafından düşük eleştirel düşünme düzeyine sahip olma 0’a, yüksek eleştirel düşünme düzeyine sahip olma ise 1’e dönüştürül-müştür. Bu durumda düşük eleştirel düşünme düzeyine sahip olan grup referans kategoridir. Buna göre 1 ile kodlanan kategori “yüksek” eleşti-rel düşünme düzeyine sahip olmak olduğu için elde edilen katsayılar; bi-limsel düşünme, epistemolojik inanç ve fatalizm değişkenlerinin, bir in-sanın yüksek eleştirel düşünme düzeyine sahip olması olasılığı üzerin-deki etkilerini yansıtmaktadır..

Lojistik regresyon analizi uygulamasında öncelikle kullanılacak modele karar verilmelidir. Bu nedenle de bulgulara geçilmeden önce, modelle-rin kısa tanıtımlarına ve model seçiminde dikkat edilmesi gereken bir-kaç noktaya değinilmiştir.

Page 18: Lojistik Regresyon Analizi: Kavram ve Uygulama

1374 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Lojistik Regresyonda Model Seçimi: Lojistik regresyon standart (di-rekt, tam, enter) ve adımsal (aşamalı, stepwise) olmak üzere iki temel yöntemle yapılabilmektedir. Adımsal yöntemler de kendi içerisinde ile-riye doğru (forward) ve geriye doğru (backward) yöntemler olmak üze-re ikiye ayrılmaktadır.

Standart (Enter) Yöntem: Bu yöntemde tüm ortak değişkenler (cova-riates) bir blok olarak regresyon modelinde yer alır ve her bir blok için parametre kestirimleri hesaplanır. Bazı araştırmacılar bu yöntemin sa-dece teori test etmede uygun olduğunu inanmaktadırlar. Bunun nede-ni, adımsal (stepwise) yöntemlerin verilerdeki tesadüfi (random) değiş-melerden etkilenmesi ve modelin aynı örneklerle tekrar edilmesi duru-munda bile, nadiren aynı sonuçların elde edilebilmesidir (Field, 2005).

Adımsal (Stepwise) Yöntemler: Adımsal yöntemler ileriye doğru (for-ward) ve geriye doğru (backward) olmak üzere ikiye ayrılır. İleriye doğru yöntemlerde analize önce sadece sabit terim dâhil edilerek başlanır. Son-ra belirli bir ölçüte göre, modele değişkenler tek tek eklenir. Burada söz edilen ölçüt, puan istatistikleridir (score statistics). Yani, en önemli puan istatistiğine sahip olan değişken ilk önce modele girer. İşlem, anlamlı puan istatistiği olan değişken kalmayıncaya kadar devam eder. Burada kesme noktası α=0.05’tir. Her bir adımda analiz dışı bırakılması gereken değişken olup olmadığı incelenir. Bu üç yolla gerçekleşir (Field, 2005):

İlk yol olabilirlik oran istatistiğini (likelihood ratio statistics) kullan-maktır. Bu yönteme “Olabilirlik Oranı ile İleriye Doğru (Forward Like-lihood Ratio- Forward:LR) Yöntemi” adı verilir. Burada mevcut model, bağımsız değişkenin dışarıda bırakıldığı model ile karşılaştırılır. Eğer bağımsız değişkenin dışarıda bırakılması (çıkarılması ya da elenmesi) gözlenen verilerin model uyumunda anlamlı farka neden oluyorsa, bu bağımsız değişken modelde tutulur. Çünkü bu değişken modele dâhil edildiğinde, modelin uyumu iyileşmektedir. Ancak, bağımsız değişke-nin çıkarılması modelde çok küçük farklara yol açıyorsa, o takdirde bu değişken elenir (Field, 2005).

Olabilirlik oran istatistiği yerine, değişkenlerin modelden çıkartılması ya da elenmesinde kullanılan bir diğer ölçüt durum indeksinin (Condi-tion Index) kullanımıdır. Bu yönteme “Durum İndeksi ile İleriye Doğru Yöntem” de denir. Bu istatistik aritmetik olarak olabilirlik oran istatisti-ğinin daha az duyarlı şeklidir. Bu nedenle de olabilirlik oran istatistiği-ne göre kullanımı çok fazla önerilmez (Field, 2005).

Page 19: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1375

Üçüncü ve son ölçüt ise Wald istatistiğidir. Bu yönteme “Wald İstatisti-ği ile İleriye Doğru (Forward: Wald) Yöntemi” adı verilir. Wald istatisti-ği, her bir bağımsız (yordayıcı) değişken için lojistik regresyon katsayısı-nın anlamlılığını test etmede yaygın olarak kullanılan bir testtir. Bir baş-ka deyişle bu test, herhangi bir logit katsayısının sıfıra eşit olduğu şek-lindeki null hipotezini test eder. Wald istatistiği, standardize olmayan bir lojistik katsayının, kendi standart hatasına oranının karesidir. Wald istatistiği, lojistik regresyonda b katsayısının anlamlılık testine karşılık gelir. Wald istatistiği en çok olabilirlik kestirimlerinin (maximum likeli-hood estimations) asimptotik olarak normal dağılım gösterdiği varsayı-mına dayanır ve 1 serbestlik dereceli ki-kare dağılımı gösterir.

Araştırmacılar yordayıcı değişkenleri, Wald istatistiği tarafından belirle-nen etkilerinin anlamlı olup olmamasına göre modelden çıkartabilirler. Wald testi, örnek hacminin büyük olması durumunda anlam kazanır. Bu nedenle de bazı araştırmacıların, Wald istatistiğinin kullanımı ile ilgili bazı uyarılarda bulundukları görülmektedir. Menard (1995), büyük kat-sayılarda standart hatanın büyümesi nedeniyle Wald istatistiği değeri-nin küçüldüğünü belirtirken; Agresti (1996) de, küçük örneklem geniş-liklerinde Wald istatistiği yerine olabilirlik oran istatistiğinin kullanımı-nın daha uygun olduğunu belirtmiştir. Ayrıca Field (2005) da söz konu-su yöntemler içerisinde olabilirlik oran istatistiğinin en iyi değişken ele-me ölçütü olduğunu, çünkü Wald istatistiğinin zaman zaman güvenilir olmayan sonuçlar üretebildiğini vurgulamaktadır.

İleriye doğru yöntemlerin tersi, geriye doğru yöntemlerdir. Bu yöntem-ler de aynı değişken eleme ölçütlerini kullanırlar; ancak ileriye doğru yöntemlerde olduğu gibi modele önce sadece sabit terimi alarak başla-mak yerine, tüm yordayıcı değişkenleri alarak başlarlar. Sonra modelin gelişmesine ya da iyileşmesine katkılarına göre yordayıcı değişkenlerin modelde tutulmasına ya da elenmesine karar verilir. Modelin iyileşme-sine en az katkıyı sağlayan yordayıcı değişken ilk önce uzaklaştırılır ve işlem bu şekilde devam eder (Field, 2005).

Doğrusal regresyonda olduğu gibi, lojistik regresyonda da model seçi-minde dikkate alınması gereken birkaç nokta vardır. Öncelikle karar ve-rilmesi gereken temel nokta, yapılan çalışmanın teori test etmek amaçlı mı, yoksa açımlayıcı / keşfedici nitelikte bir çalışma mı olduğudur. Daha önce de değinildiği üzere, bazı yazarlar adımsal yöntemlerin teori test etmede değer taşımadığına inanmaktadırlar. Ancak adımsal yöntemler, test edilecek hipotezlere temel oluşturacak daha önceden yapılmış ça-

Page 20: Lojistik Regresyon Analizi: Kavram ve Uygulama

1376 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

lışmaların olmadığı ve nedenselliğin temel ilgi konusu olmadığı, sadece verilere uygun bir model bulmak arzusunda olunduğu durumlarda sa-vunulabilir. Aynı zamanda adımsal bir yöntem kullanımına karar veril-diğinde, geriye doğru yöntemler, ileriye doğru yöntemlere tercih edil-melidir. Bunun nedeni baskılama (supressor) etkisidir. Baskılama etki-si, bir yordayıcı değişkenin etkisi sabit tutulduğunda, bir diğer yordayı-cının anlamlı bir etkiye sahip olması durumudur. Buna bağlı olarak da şunu belirtmekte yarar vardır ki, ileriye doğru yöntemlerin, geriye doğru eleme yöntemlerine kıyasla baskılama etkisi altında olan yordayıcı de-ğişkenleri dışarıda bırakma, yani eleme olasılığının daha yüksek olma-sıdır. Dolayısıyla da ileriye doğru yöntemlerin II. Tip hata riski (aslın-da sonucu anlamlı bir şekilde yordayan değişkeni dışarıda bırakma ya da eleme) daha yüksektir. Dikkat edilmesi gereken bir diğer nokta ise, adımsal yöntemlerde kullanılacak test istatistiğinin seçimine ilişkindir. Daha önce de değinildiği gibi, olabilirlik oran istatistiği en iyi yöntem-dir. Wald istatistiği, bazı durumlarda hatalı sonuçlar verme eğiliminde-dir (Field, 2005).

Yukarıdaki tartışmalar sonucunda bu çalışma doğası gereği keşfedici olarak nitelendirilebileceğinden, adımsal bir yöntemin kullanımı tercih edilmiştir. Yine yukarıda tartışıldığı üzere ileriye doğru yöntemlerin bazı dezavantajları bulunmakla birlikte Todman ve Dugard (2007), az sayı-da parametre ile çalışıldığında ileriye doğru yöntemlerin daha güvenilir sonuçlar verdiğini belirtmişler ve yöntemlerde her ne kadar farklı seçim ölçütleri kullanılsa da, benzer sonuçlar elde edildiğini vurgulamışlardır. Bu nedenle de bu çalışmada lojistik regresyon analizi “Olabilirlik Ora-nı ile İleriye Doğru Yöntemi (Forward Likelihood Ratio-Forward: LR)” kullanılarak gerçekleştirilmiştir.

Model seçimine karar verildikten sonra lojistik regresyon analizine baş-lamadan önce veriler taranarak uç değerler ve kayıp değerler açısından incelenmesi ve gerekli dönüştürmelerin yapılması gerekir. Çoklu doğru-sal regresyon (multiple linear regression) analizinde olduğu gibi, Maha-lanobis uzaklıkları (Mahalanobis Distances) hesaplatılarak çok değiş-kenli uç değerler (multivariate outliers) belirlenir. Bu incelemeler sonu-cunda veri atma veya dönüştürme işlemleri yapılmış ise, bunların betim-lenmesi gerekir. Bu çalışma kapsamında herhangi bir işlem yapılmadı-ğından raporlanmamıştır.

Analizde yordayıcı değişkenler arasında çoklu bağlantı (multicollinea-rity) sorunu olup olmadığının da incelenmesi gerekir. Yordayıcı değiş-

Page 21: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1377

kenler arasında çoklu bağlantı problemi olup olmadığını değerlendir-mek üzere çoklu bağlantı teşhis tablosu (collinearity diagnostics) incele-nir. Bu tabloda her bir değişken için özdeğerler (eigenvalues), durum in-deksleri ve varyans oranları yer alır. Herhangi bir değişkene ilişkin özde-ğerin diğerlerinden büyük olması, çoklu bağlantı sorunu olduğunu gös-terir. Çünkü bu durum, regresyon parametrelerine ilişkin çözümlerin, yordayıcı ya da yordanan değişkenlerdeki küçük değişikliklerden büyük oranda etkilenmesi anlamına gelmektedir. Böyle bir durum da regres-yon modeli hakkında şöyle bir fikir verir: Eğer özdeğerler büyük oranda benzerlik gösteriyorsa, oluşturulan model ölçülen değişkenlerdeki kü-çük değişkenlerden etkilenmeyecektir (Field, 2005).

Durum indeksi, özdeğerleri ifade etmenin bir başka yoludur ve en yük-sek özdeğere sahip değişkenin durum indeksi her zaman 1’dir. Durum indeksi değerleri içerisinde diğerlerinden çok büyük bir değerin bulun-ması, çoklu bağlantı problemi açısından dikkat çekmelidir. Bir diğer de-ğer ise, varyans oranlarıdır. Varyans oranları 100 ile çarpılarak %’ye dö-nüştürülebilir ve böylelikle daha kolay anlaşılması sağlanabilir. Çoklu bağlantı problemi açısından özdeğeri küçük, ancak varyansı büyük olan değişkenler aranmalıdır. Çünkü bu durum, o değişkenlerin regresyon katsayılarına ilişkin varyansın bağımlı olduğu anlamına gelir. Varyans oranı 0 ile 1 arasında değişir ve her bir değişken için farklı boyutlar (ya da özdeğerler) boyunca dağılmalıdır. Yani her bir değişkenin en yük-sek varyansı, farklı bir özdeğere yüklenmelidir. Bu durum çoklu bağlan-tı probleminin olmadığını gösterir. Eğer farklı yordayıcıların en yüksek varyansları aynı özdeğere yükleniyorsa, bu değişkenler arasında çoklu bağlantı problemi var demektir (Field, 2005).

Çoklu bağlantı probleminin saptanması için, tolerans ve varyans artış faktörleri de (Variance Inflation Factor-VIF) incelenerek belirleme ya-pılabilir. Menard (1995), tolerans değerinin <.1 olmasının ciddi çok-lu bağlantı problemine işaret ettiğini ifade etmektedir. Tolerans ista-tistikleri <.2 durumunda ise, çoklu bağlantı potansiyel bir problemdir. Aslında her iki istatistik de aynı bilgileri verir; çünkü Tolerans = 1 / VIF’tir. Daha küçük tolerans değeri, daha büyük VIF değeri demek-tir (Field, 2005). Myers (1990) VIF değerlerinin 10’dan büyük olması-nın çoklu bağlantı problemine işaret ettiğini belirtmektedir. Yine ortala-ma VIF (Average VIF) >1 ise, regresyon modeli yanlı olabilir. Ortalama VIF, tüm değişkenlere ilişkin VIF değerlerinin toplanıp değişken sayı-sına bölünmesi ile bulunur. Bulunan değer 1’e yakınsa, bu da çoklu bağ-lantı probleminin olmadığına ilişkin bir kanıttır (Field, 2005).

Page 22: Lojistik Regresyon Analizi: Kavram ve Uygulama

1378 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Tolerans değerlerini yorumlamanın bir diğer yolu da R2 ile bağlantılı-dır. Eğer tolerans değerleri <1-R2ise, çoklu bağlantı probleminin oldu-ğu söylenebilir. Örneğin düzeltilmiş R2(Adjusted R2) değerinin .36 ola-rak bulunduğu bir çalışmada 1-R2=.64’tür. Buna bağlı olarak da .64’den küçük tolerans istatistikleri bulunduğu durumda, çoklu bağlantı prob-leminden şüphe edilmesi gerekir (Leech ve ark., 2005; Mertler ve Van-natta, 2005). Yine çoklu bağlantı probleminin olup olmadığının ince-lenmesinde bir diğer yöntem de, standardize edilmemiş regresyon kat-sayılarına (b) ilişkin standart hataların değerlendirilmesidir. Tüm değiş-kenlere ilişkin standart hatalar 2’den küçükse, çoklu bağlantı problemi-nin olmadığına karar verilir.

Bulgular

Bu bölümde ilk olarak lojistik regresyon analizi için yapılan ön analiz sonuçlarına, daha sonra da araştırmanın problemini yanıtlamak amacıy-la uygulanan lojistik regresyon analizinden elde edilen bulgulara yer ve-rilmiştir.

Değişkenler Arası Çoklu Bağlantılılık Problemi

Tablo 3’de lojistik regresyon analizinde yer alan değişkenler arasında çoklu bağlantı probleminin araştırılmasına yönelik olarak özdeğerler, durum indeksleri ve varyans oranları; Tablo 4’de ise yordayıcı değişken-lere ilişkin standart hatalar, tolerans, VIF değerleri ve değişkenler ara-sındaki ikili korelasyonlar sunulmaktadır.

Tablo 3. Araştırmada Yer Alan Yordayıcı Değişkenler Arası Çoklu Bağlantı Probleminin Özdeğerler, Durum İndeksleri ve Varyans Oranları Yoluyla İncelenmesi

Boyut Özdeğer

Durum Indeksi

Varyans Oranları

Sabit Epistemolojik İnanç

Bilimsel Düşünme Fatalizm

1 3.896 1.000 .00 .00 .00 .00

2 .086 6.714 .00 .01 .05 .63

3 .015 16.253 .04 .14 .91 .08

4 .003 36.121 .96 .86 .04 .28

Page 23: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1379

Tablo 3 incelendiğinde, öncelikle tüm yordayıcı değişkenlere ilişkin öz-değerlerin benzerlik gösterdiği görülmektedir. Durum indeksi değerleri incelendiğinde, bu değerler içerisinde diğerlerinden çok büyük bir değe-rin bulunmadığı görülmektedir. Varyans oranları incelendiğinde de her bir yordayıcı değişkenin en yüksek varyansının, farklı bir özdeğere yük-lendiği görülmektedir. Bir diğer deyişle, yordayıcı değişkenlerin her biri varyansın farklı bir boyutunu açıklamaktadır.

Tablo 4. Araştırmada Yer Alan Yordayıcı Değişkenler Arası Çoklu Bağlantı Probleminin Standart Hata, Tolerans ve VIF Değerleri Yoluyla İncelenmesi

Yordayıcı Değişkenler

bStandart Hata Tolerans VIF

Korelasyonlar

1 2 3

1. Epistemolojik İnanç .010 .003 .848 1.179 - .23** -.37**

2. Bilimsel Düşünme .024 .013 .901 1.110 - -.28**

3. Fatalizm -.003 .00 .827 1.210 -

** p<.01

Tablo 4’e ait tolerans değerleri incelendiğinde, tüm değişkenlere ilişkin tolerans değerlerinin .2’den büyük olduğu tespit edilmiştir. VIF değer-leri incelendiğinde de, tüm yordayıcı değişkenler için değerlerin 10’dan küçük olduğu saptanmıştır. Ortalama VIF değeri ise yaklaşık 1.17’dir. Bu değerler değişkenler arası çoklu bağlantı probleminin olmadığını göstermektedir. Alanyazında tolerans değerlerinin .1’den büyük olma-sı durumunda, değişkenler arası çoklu bağlantı probleminin olmadığına işaret edilmektedir (Field, 2005; Mertler ve Vannatta, 2005). Aynı tab-loda görüldüğü gibi, epistemolojik inanç ile bilimsel düşünme arasın-da .23, epistemolojik inanç ile fatalizm arasında -.37, bilimsel düşünme ile fatalizm arasında ise -.28’lik korelasyon bulunmaktadır. Sonuç ola-rak değişkenler arasındaki korelasyonlar düşük ya da orta düzeyde olup, tümü .01 düzeyinde anlamlıdır. Yüksek düzeyde korelasyona rastlanma-maktadır. Yaygın bir anlayışla, 0 ile .30 arasındaki korelasyonların düşük, .31 ile .70 arasındaki korelasyonların orta, .71 ve üzeri korelasyon katsa-yıları ise yüksek ilişkinin göstergesi olarak yorumlanabilmektedir (Bü-yüköztürk, 2009). Tablo 3 ve Tablo 4’de sunulan bulguların tümü bir-likte değerlendirildiğinde, yordayıcı değişkenler arasında çoklu bağlantı probleminin olmadığı ifade edilebilir.

Page 24: Lojistik Regresyon Analizi: Kavram ve Uygulama

1380 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Lojistik Regresyon Analizi

SPSS’te yapılan lojistik regresyon analizi sonuçlarında ilk olarak yordanan değişkenin kategorilerinin 0 ve 1 kodlarına dönüştürülmesine ilişkin bil-gi, ardından başlangıç durumuna ilişkin -2LL istatistiği sunulmaktadır.

-2LL ya da -2log olabilirlik (-2log likelihood) bir model uyumu in-deksidir. En çok olabilirlik kestiriminin ne kadar iyi uyuma işaret etti-ğine ilişkin temel ölçü, çoklu regresyondaki kareler toplamına benze-yen “olabilirlik değeridir (likelihood value)”. Lojistik regresyon, kes-tirilen model uyumunu olabilirlik değerinin -2 log’unu alarak ölçer. -2LL’nin alabileceği en küçük değer 0’dır ve mükemmel uyuma karşı-lık gelir. -2LL=0 olduğunda, olabilirlik=1’dir. Sonuç olarak -2LL değe-ri, çoklu regresyondaki R2 değeri gibi düşünülebilir ve uyumdaki deği-şiklikler karşılaştırılarak yorumlanabilir. Olabilirlik değeri, bir model-den diğerine uyumda meydana gelen değişiklikler arasındaki fark kar-şılaştırılarak değerlendirilir. Bu temel yaklaşım üç adımda gerçekleşir (Hair ve ark., 2006):

1. Null Modelinin Kestirimi: İlk adım, model uyumundaki gelişmeyi ya da iyileşmeyi karşılaştırabilmek üzere oluşturulan başlangıç mo-delidir (baseline model / constant-only model). En yaygın kullanı-lan ya da bilinen null modeli, çoklu regresyonda ortalamalar kullanı-larak hesaplanan toplam kareler toplamına benzeyen, hiçbir bağım-sız değişkenin yer almadığı, sadece sabit terimin yer aldığı model-dir. Null modelinin temel mantığı, daha sonraki adımlarda bağımsız değişkenlerin girdiği model ile karşılaştırma yapabilmeyi sağlamak adına, bir başlangıç durumu / modeli oluşturmaktır.

2. Amaçlanan Modelin Kestirimi (Estimate the Proposed Mo-del): Bu model yordayıcı değişkenleri içeren lojistik regresyon mo-delidir. Burada, null modelinden sonra yordayıcı değişkenlerin mo-dele girmesi ile uyumda iyileşmeler olması beklenir.

3. -2LL Farkının Değerlendirilmesi: Son adım da iki model (null / başlangıç modeli ile amaçlanan model) arasındaki -2LL’nin istatis-tiksel manidarlığını değerlendirmektir. Eğer istatistiksel testler far-kın manidar olduğunu gösteriyorsa, “amaçlanan modelde yordayıcı değişken ya da değişkenler, kestirilen modelin uyumunun iyileşme-sine anlamlı katkı sağlamıştır” yorumu yapılabilir. Benzer mantık-la, amaçlanan iki model arasındaki fark da karşılaştırılabilir. Bu du-rumda -2LL farkı, bir modelden diğerine uyum farklılığını gösterir.

Page 25: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1381

Örneğin, iki bağımsız değişkenli model, üç bağımsız değişkenli mo-delle karşılaştırılarak, bir bağımsız değişken daha modele girdiğinde uyumda meydana gelen değişmeler değerlendirilebilir. Bu durumda bir model, null modeli olarak seçilir ve diğer modelle karşılaştırılır.

Bir başka deyişle, bir grup yordayıcı değişkenin yer aldığı bir modelde uyumdaki iyileşmenin anlamlılığını test etmek istediğimizi düşünelim. Burada null modeli, yordayıcı değişkenlerin yer almadığı model, amaç-lanan model ise bu değişkenlerin yer aldığı model olarak belirlenebi-lir. -2LL farkı, yordayıcı değişkenlerden kaynaklı iyileşme farkını belir-tir. İstatistiksel manidarlık için ki-kare testi ve benzeri testler, log ola-bilirlik değerindeki azalmanın ya da düşüşün değerlendirilmesinde kul-lanılır. Ancak bu testler örneklem büyüklüğüne oldukça duyarlıdır (kü-çük örneklemlerde istatistiksel manidarlığın elde edilmesi daha zorken, büyük örneklemlerde tam tersi bir durum söz konusudur). Sonuç ola-rak şunu söylemek mümkündür; lojistik regresyonda sadece ki-karenin manidar olup olmadığına bağlı olarak sonuç çıkartma yoluna gidilirken özellikle dikkatli davranılmalıdır.

Yukarıdaki açıklamalar doğrultusunda, Tablo 5’te başlangıç modeli-ne yani sadece sabit terimin yer aldığı modele ilişkin -2LL değeri su-nulmaktadır. İlerleyen aşamalarda yordayıcı değişkenlerin modele gir-mesi ile –2LL değerinde meydana gelen değişiklikler, bir başka anla-tımla yordayıcı değişkenler modele eklendikçe, modelde meydana ge-len gelişmeler ve model-veri uyumunda gözlenen iyileşmeler ayrıca tar-tışılacaktır. Amaçlanan modelde uyum iyileştiği için, -2LL değeri düşer. Burada henüz erken olmakla birlikte, mükemmel uyuma karşılık gelen -2LL değerinin sıfır olduğunu hatırlatmakta ve modelin oldukça yük-sek -2LL değeri (277.239) ile başladığını belirtmekte yarar vardır.

Tablo 5. Başlangıç Modeli için İterasyon Öyküsü

İterasyon -2Log Olabilirlik(-2LL)

Katsayılar

Sabit

Adım 01 277.239 -.020

2 277.239 -.020

SPSS’te yapılan lojistik regresyon analizi sonuçlarında ilk olarak bir sı-nıflandırma tablosu sunulmaktadır. Program öncelikle keyfi bir şekilde,

Page 26: Lojistik Regresyon Analizi: Kavram ve Uygulama

1382 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

tüm denekleri bir kategoride düşünerek sınıflandırma yapmaktadır (Fi-eld, 2005). Bu durum aynı zamanda, sadece sabit terimin yer aldığı bir modelde, ancak bir gruba ilişkin üyeliklerin doğru sınıflanabileceği şek-linde de düşünülebilir (Kalaycı, 2005). Örneğin uygulanan herhangi bir başarı testi sonucunda öğrencilerin geçti / kaldı şeklinde sınıflandığı bir yordanan değişkende, tüm öğrencileri “geçti” ya da tam tersi “kaldı” ka-bul ederek bir sınıflama yüzdesi çıkartmaktadır. Ancak programın her ne kadar keyfi bir sınıflama yaptığından söz edilmiş olsa da, burada yine de hangi kategoride daha çok denek varsa, tüm denekleri o kategoride kabul ettiğini belirtmekte yarar vardır. Örneğin 70 öğrenciden oluşan bir gruba uygulanan test sonucunda gözlenen sonuç 31 öğrenci “geçti”, 39 öğrenci “kaldı” ise, ilk sınıflama tablosunda tüm öğrenciler “kaldı” ka-tegorisinde değerlendirilir; çünkü bu kategoride daha fazla denek vardır ve dolayısıyla doğru sınıflandırma yüzdesi daha yüksek olacaktır. “Geç-ti” grubu için sınıflandırma yüzdesi 31/70= %44 iken; “kaldı” grubu için 39/70= %56’dır (Field, 2005).

Bu çalışmada ele alınan yordayıcı değişkenler açısından durum değer-lendirildiğinde; gözlenen durum (gerçek durum) ve ilk sınıflandırma sonuçları Tablo 6’da görülmektedir.

Tablo 6.

Lojistik Regresyon Analizi Sonucunda Elde Edilen İlk Sınıflandırma Durumu

Gerçek / Gözlenen Durum

Beklenen Durum

Doğru Sınıflandırma Yüzdesi

Düşük Eleştirel Düşünme

Yüksek Eleştirel Düşünme

Düşük Eleştirel Düşünme 101 0 100.00

Yüksek Eleştirel Düşünme 99 0 0

Toplam Doğru Sınıflandırma Yüzdesi 50.50

Tablo 6 incelendiğinde, programın öncelikle tüm öğrencileri düşük eleştirel düşünme kategorisinde sınıflandırdığı ve bu haliyle doğru sınıf-landırma yüzdesinin %50.50 olduğu görülmektedir.

Sınıflandırma tablosunun ardından yine Blok 0’a ilişkin “eşitlikte yer alan değişkenler (variables in the equation)” tablosu sunulmaktadır. Tablo 7’de görüldüğü üzere, burada başlangıç modelini (baseline model / constant-only model) oluşturan sabit terim, sabit terime ilişkin stan-

Page 27: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1383

dart hata, değişkenin anlamlılığını test eden Wald istatistiği, Wald ista-tistiğinin serbestlik derecesi ve anlamlılık düzeyi ile Exp(b), yani üstel lojistik regresyon katsayısı (Exponentiated logistic coefficients) yer al-maktadır. Üstel lojistik regresyon katsayısı Odds oranını temsil etmek-tedir.

Tablo 7. Başlangıç Modelinde / Eşitlikte Yer Alan Değişkenler

Adım 0 b Standart Hata Wald sd p Exp(b)

Sabit -.020 .141 .020 1 .888 .980

Tablo 8’da ise yine Blok 0’a ilişkin eşitlikte yer almayan değişkenler (va-riables not in the equation) sunulmaktadır.

Tablo 8. Başlangıç Modelinde/Eşitlikte Yer Almayan Değişkenler

Adım 0

Değişkenler Skor sd p

Epistemolojik İnanç 16.077 1 .000

Bilimsel Düşünme 7.712 1 .005

Fatalizm 5.371 1 .020

Hata Ki-kare İstatistiği (c2bo) 19.924 3 .000

Burada öncelikle Tablo 8’in son satırında yer alan hata ki-kare istatis-tiğine (residual chi-square) değinilecektir. İlk ki-kare değeri olarak da adlandırılan bu değerin anlamlı olduğu görülmektedir [c2

bo=19.924, p<.01]. Bu değerin anlamlı olması, modelde yer almayan yordayıcı de-ğişkenlere ilişkin katsayıların sıfırdan anlamlı derecede farklı olduğu-nu göstermektedir. Bir başka deyişle, bu değişkenlerden bir ya da daha fazlasının modele eklenmesinin, modelin yordama gücünü arttıracağı görülmektedir. Eğer hata ki-kare istatistiğine ilişkin anlamlılık düzeyi p>.05 ve dolayısıyla anlamlı değil ise, bu durum modele dahil edilme-miş yordayıcı değişkenlerden hiçbirinin modelin yordama gücüne an-lamlı katkı sağlamadığına işaret eder ve analiz bu noktada sonlanır (Fi-eld, 2005). Bir diğer anlatımla da, ancak bütün yordayıcı değişkenlerin b katsayılarının sıfır olduğunu test eden H0 hipotezi reddedilirse değiş-ken seçimine devam edilir (Kalaycı, 2005). Ancak örneğimizde c2

bo is-

Page 28: Lojistik Regresyon Analizi: Kavram ve Uygulama

1384 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

tatistiğine ilişkin p<.01’dir. Dolayısıyla tüm yordayıcı değişkenlerin mo-dele anlamlı katkılar sağladığı ve değişken seçimine devam edileceği ifa-de edilebilir.

Tablo 8’de yer alan puan istatistikleri, her bir değişken için Roa’nın etki puan istatistikleridir (Roa’s efficient score statistics) ve değişkenlerin her birinin modele anlamlı katkı sağlayıp sağlamadığını gösterir (Field, 2005). Burada tüm değişkenlere ilişkin puan istatistiklerinin anlamlı ol-ması, tüm yordayıcı değişkenlerin modele potansiyel katkı sağlayacak-ları anlamına gelmektedir. Ek olarak, adımsal yöntemlerde en yüksek puan istatistiği olan değişkenin, analize ilk önce giren yordayıcı değiş-ken olduğunu da belirtmek gerekir. Örneğimizde en yüksek puan ista-tistiği “epistemolojik inanç (16.077)” değişkenine aittir ve dolayısıyla da ilk önce bu değişkenin analize gireceği anlaşılmaktadır.

Tablo 9’da model katsayılarına ilişkin Omnibus Testi sonuçları sunul-maktadır. Ki-kare istatistiğinin anlamlılık düzeyi de model, blok ve adım için hesaplanır. Model için ki-kare, sadece sabit terimin yer aldığı baş-langıç modeli ile amaçlanan model arasındaki farkı temsil eder. Adım-sal bir yöntem kullanıldığında, amaçlanan model sadece seçilmiş yorda-yıcıları içerirken, standart yöntem tüm bağımsız değişkenlerin yer aldı-ğı bir model üretir. Sonuç olarak bu karşılaştırma kullanılan yönteme göre farklılık gösterir. Genel olarak modele ilişkin anlamlı bir ki-kare, üretilen modelin deneklerin üyeliklerini, sadece sabit terimin yer aldı-ğı başlangıç modeline göre daha iyi yordadığını gösterir. Eğer bir adım-sal yöntem kullanılırsa ki-kare her adım için hesaplanır. Bu değer, mo-dele her adımda seçilen yeni değişkenler eklendikçe, modeldeki iyileş-meyi gösterir.

Tablo 9. Model Katsayılarına İlişkin Omnibus Testi

Adım Ki-kare sd P

1

Adım 16.839 1 .000

Blok 16.839 1 .000

Model 16.839 1 .000

2

Adım 4.463 1 .035

Blok 21.302 2 .000

Model 21.302 2 .000

Page 29: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1385

Tablo 9 incelendiğinde, model ki-kare değerine ilişkin p değerinin an-lamlı olması, yordanan değişken ile yordayıcı değişkenler kombinasyonu arasında ilişkinin varlığını göstermektedir. Model ki-kare istatistiğinin anlamlı olması, “sadece sabit terimin yer aldığı başlangıç modeli ile yor-dayıcı değişkenlerin analize girmesiyle oluşan sonuç modeli ya da amaç-lanan model arasında fark yoktur” şeklindeki null hipotezinin (H0) red-dedilmesi ve yordayıcı değişkenlerle yordanan değişken arasındaki iliş-kinin desteklenmesi demektir.

Tablo 10’da sonuç modeli ya da amaçlanan modelin uyum istatistikleri-ne ilişkin özet sunulmaktadır.

Tablo 10. Amaçlanan Modelin Özeti

Adım (-2LL) Cox & Snell R2 Nagelkerke R2

1 260.400 .081 .108

2 255.937 .101 .135

Tablo 10’un incelenmesine geçilmeden önce başlangıç modeline iliş-kin -2LL değeri değerinin 277.239 olarak bulunduğunu hatırlamak ge-rekir. Lojistik regresyonda başlangıç modeli ya da temel model sadece sabit terimin yer aldığı modeldir. Modele bir ya da daha fazla değişken eklendiğinde, modelde meydana gelen iyileşme aşağıdaki eşitlik yardımı ile belirlenir (Field, 2005):

c2 = 2 [LL(YENİ)- LL(TEMEL)]

sd=K(YENİ)- K(TEMEL)

Yeni modele ilişkin LL ile, temel ya da başlangıç modeline ilişkin LL farkının 2 ile çarpılmasının sebebi, sonucun ki-kare dağılımını vermesi içindir. Ki-kare dağılımında kullanılan serbestlik derecesi ise, yeni mo-dele ilişkin parametre sayısından, temel modele ilişkin parametre sayı-sının çıkartılması ile elde edilir. Temel modele ilişkin parametre sayısı her zaman 1’dir. Çünkü bu modelde kestirilen tek parametre sabit te-rimdir. Sonraki herhangi bir model için de serbestlik derecesi, yordayı-cı değişken sayısının bir fazlasına eşittir. Burada eklenen “1” değeri, yor-dayıcı değişken sayısına sabit terimin eklenmesini ifade etmektedir (Fi-eld, 2005).

Sadece sabit terimin yer aldığı temel modele, birinci adımda en yük-sek puan istatistiğini veren epistemolojik inanç değişkeni girdiğinde,

Page 30: Lojistik Regresyon Analizi: Kavram ve Uygulama

1386 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

-2LL farkı 16.839’dur (277.239 - 260.400). İkinci adımda bilimsel dü-şünme değişkeni girdiğinde oluşan -2LL farkı ise 4.463’tür (260.400 - 255.937). Her iki durumda da modelin uyumunda meydana gelen de-ğişme anlamlıdır(Bu değişim miktarları ve anlamlılık düzeyleri Tablo 14’te de görülmektedir).

Cox & Snell R2 ve Nagelkerke R2 değerleri, model tarafından bağım-lı değişkende açıklanan varyansın iki farklı yoldan kestirilmesini tem-sil eder ve çoklu regresyondaki R2 ile benzer şekilde yorumlanır (Fi-eld, 2005). Bir diğer anlatımla her iki değer de lojistik model tarafından açıklanan varyans miktarını gösterir ve 1.00 mükemmel model uyumu-nu ifade eder. Dolayısıyla daha büyük değerler, daha iyi model uyumu-na karşılık gelir (Hair ve ark., 2006). Cox & Snell R2 hiçbir zaman 1’e ulaşamadığı ve yorumlanması da bu nedenle kolay olmadığı için, Nagel-kerke R2 hesaplanır (Field, 2005; Garson, 2008). Nagelkerke katsayı-sı, ranjın 0-1 arasında değişmesini sağlamak adına Cox & Snell katsa-yısının modifikasyona uğramış şeklidir. Bu nedenle de her zaman Na-gelkerke R2değeri, Cox & Snell R2 değerinden daha yüksektir (Garson, 2008; Hair ve ark., 2006).

Tablo 11’de sunulan Cox & Snell R2 değerleri incelendiğinde, birinci adımda epistemolojik inanç yordayıcı değişkeni analize girdiğinde, eleş-tirel düşünme yordanan değişkenindeki varyansın %8.1’ini açıklamak-tadır. İkinci adımda bilimsel düşünme becerisi yordayıcı değişkeni ana-lize girdiğinde ise, iki yordayıcı değişken birlikte eleştirel düşünme yor-danan değişkenindeki varyansın %10.1’ini açıklamaktadır. Nagelkerke R2 değerleri ise birinci adım için %10.8, ikinci adım için ise %13.5’tir. Daha önce de değinildiği üzere, Nagelkerke R2 değerleri, Cox & Snell R2 değerlerinden yüksektir.

Tablo 12’de Hosmer ve Lemeshow Testi sonucu sunulmaktadır. Hos-mer ve Lemeshow ki-kare uyum iyiliği testi olarak da anılan test, lojistik regresyon modelinin bir bütün olarak uyumunu değerlendirir. Özellik-le yordayıcı değişkenlerin sürekli değişkenler olduğu durumda ya da kü-çük örneklemlerle çalışıldığı durumda, geleneksel ki-kare testinden çok daha güçlüdür. Bu anlamda da geleneksel ki-kare yöntemi ile hesapla-nan Omnibus Testi’nin daha güçlü bir alternatifidir. Bu teste ilişkin so-nucun anlamlı olmaması (p>.05), model-veri uyumunun yeterli düzeyde olduğunu gösterir. Bir diğer deyişle, gözlenen ve model tarafından kes-tirilen değerler arasında anlamlı fark yoktur; model tahminleri, gözle-nen durumdan farklı değildir (Garson, 2008). Adımsal bir analiz yön-

Page 31: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1387

temi tercih edildiğinde, Hosmer ve Lemeshow Testi sonucu da her bir adım için sunulur.

Tablo 11 incelendiğinde, hem birinci adımda sadece epistemolojik inanç yordayıcı değişkeni analize girdiğinde, hem de bilimsel düşünme bece-risi yordayıcı değişkeni analize girdiğinde Hosmer ve Lemeshow tes-ti sonucu anlamlı çıkmamaktadır (p>.05). Bu değerin anlamlı olmama-sı, iki değişkenli modelin kabul edilebilir uyuma sahip olduğunu, yani model-veri uyumunun yeterli düzeyde olduğunu göstermektedir.

Tablo 11. Hosmer ve Lemeshow Testi

Adım Ki-kare sd P

1 3.220 8 .920

2 9.599 8 .294

Tablo 12’de lojistik regresyon modeli sonucunda elde edilen sınıflandır-ma sunulmaktadır. Bu tablo grup üyeliklerini yordamak üzere üretilen regresyon modelinin uygulanmasıdır. Bu tahminler deneklerin gerçek durumları ile karşılaştırılır. Doğru sınıflandırılan (yani gerçek duruma uygun olarak sınıflandırılan) deneklerin oranı hesaplanır ve bu da mo-del uyumunun bir diğer göstergesidir.

Tablo 12. Sınıflandırma Tablosu

Gerçek / Gözlenen Durum

Beklenen DurumDoğru Sınıflandırma Yüzdesi

Düşük Eleştirel Düşünme

Yüksek Eleştirel Düşünme

Adım 1Düşük Eleştirel Düşünme 55 46 54.50

Yüksek Eleştirel Düşünme 36 63 63.60

Toplam Doğru Sınıflandırma Yüzdesi 59.00

Adım 2Düşük Eleştirel Düşünme 59 42 58.40

Yüksek Eleştirel Düşünme 31 68 68.70

Toplam Doğru Sınıflandırma Yüzdesi 63.50

Tablo 12’ye ilişkin değerlendirmelere geçmeden önce Tablo 6’da sunul-muş olan ilk sınıflandırma sonuçları hatırlanacak olursa, düşük eleşti-

Page 32: Lojistik Regresyon Analizi: Kavram ve Uygulama

1388 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

rel düşünme grubunda 101 kişi, yüksek eleştirel düşünme grubunda ise 99 kişi olup (gözlenen durum), doğru sınıflandırma oranı %50.50 ola-rak bulunmuştu. Lojistik regresyon modeli sonucunda elde edilen sı-nıflandırma incelendiğinde ise, birinci adımda, bir başka deyişle sadece epistemolojik inanç yordayıcı değişkenine göre yapılan sınıflandırma-da, düşük eleştirel düşünme grubunda yer alan toplam 101 öğrenciden 55’i doğru, 46’sı yanlış sınıflandırılmış olup, doğru sınıflandırılma ora-nı %54.50’dir. Durum, yüksek eleştirel düşünme açısından incelendiğin-de, toplam 99 kişilik gruptan 63’ü doğru, 36’sı ise yanlış sınıflandırılmış olup, doğru sınıflandırma oranı %63.60’dır. Birinci adıma ilişkin top-lam doğru sınıflandırma oranı ise %59.00’dur. Bu durum ilk sınıflandır-ma oranı ile karşılaştırıldığında, epistemolojik inanç yordayıcı değişke-ninin analize girmesiyle birlikte, doğru sınıflandırma oranının yüksel-diğini söylemek mümkündür. İkinci adımda epistemolojik inanç değiş-keni ile birlikte bilimsel düşünme becerisi değişkeninin de analize gir-mesiyle birlikte amaçlanan modele ilişkin toplam doğru sınıflandırma oranı %63.50’ye yükselmektedir. Bu bulgu da, yine model-veri uyumu-nun bir işareti olarak değerlendirilebilir. Ancak bu örnekte de görüldü-ğü gibi, modelin anlamlı olması ya da model-veri uyumunun yeterli dü-zeyde olması, her zaman yüksek yordama ya da sınıflandırma gücünün bir garantisi değildir.

Yukarıda açıklandığı üzere, modelin anlamlılığını test eden yöntemler-den biri de Wald istatistiğidir. Wald istatistiği b’nin anlamlılığına ilişkin bir ölçüdür ve her bir değişkenin modele katkısını ifade eder. Tabach-nick ve Fidell (1996) Wald istatistiğinin oldukça muhafazakar (con-servative) olduğunu, bu nedenle de yorumlanırken anlamlılık düzeyi-nin biraz daha esnek tutulması gerektiğini tavsiye etmektedirler (örne-ğin p<.05 ya da p<.01 gibi). Doğrusal regresyonda bir bütün olarak mo-del - veri uyumunun ne kadar iyi olduğu değerlendirilmekle birlikte, her bir yordayıcı değişkenin katkısı da belirlenmek istenir. Doğrusal regres-yonda t istatistiğini hesaplamak için kestirilen regresyon katsayıları ile onların standart hataları kullanılır. Lojistik regresyonda ise, ki-kare da-ğılımı olarak bilinen özel bir dağılıma sahip olan Wald istatistiği kulla-nılır. Doğrusal regresyondaki t testine benzer şekilde Wald istatistiği de, yordayıcı değişkenlere ilişkin b katsayılarının, sıfırdan anlamlı farklılık gösterip göstermediğini belirlemeyi sağlar. Yine Wald istatistiği de t is-tatistiğinde olduğu gibi, regresyon katsayılarına ilişkin değerlerin stan-dart hatalarına bölünmesi ile elde edilir (Field, 2005). Bazı istatistik pa-

Page 33: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1389

ket programlarında Wald istatistiği, regresyon katsayısının standart ha-taya bölümünden sonra elde edilen değerin karesinin alınması ile de so-nuçlanabilmektedir. Yapılan bu çalışma SPSS programında analiz edil-diğinden Wald istatistiği;

Wald = b 2

sh şeklinde hesaplanmıştır.

Özet tabloda yer alan son değer de Exp(b), yani üstel lojistik regresyon katsayılarıdır. Bu değer de her bir değişken için hesaplanan Odds oranı-dır (Mertler ve Vannatta, 2005). Yordayıcı değişkendeki bir birimlik de-ğişmeden kaynaklı olarak odds oranında meydana gelen değişmeyi gös-terir. Dolayısıyla Exp(b) değerleri şöyle yorumlanır: Eğer değer 1’den büyükse, yordayıcı değişkendeki artışla birlikte, olayın olma ya da gö-rülme olasılığına ilişkin odds oranı yükselir. Eğer değer 1’den küçükse, yordayıcı değişkendeki artışa karşılık olayın olma ya da görülme olası-lığı düşer (Field, 2005). Aşağıda orijinal ve üstel lojistik regresyon kat-sayılarının yorumlanmasına ilişkin biraz daha ayrıntılı bilgilere yer ve-rilmektedir.

Katsayıların Yorumlanması: Lojistik regresyonun avantajlarından biri, yordanan değişken olarak bir ikilemi tanımlamak için, sadece bir olayın olma ya da olmama durumunu bilmeye ihtiyaç olmasıdır. Lojis-tik dönüştürme kullanılarak bu veriler analiz edilmekle birlikte, lojistik regresyon ve katsayılarının, metrik bir bağımlı değişkenin yer aldığı reg-resyon analizinden biraz farklı düşünülmesi gerekir (Hair ve ark., 2006).

Kestirim sürecinde katsayıların (b0, b1, b2,… bn ) gerçekte olasılık ora-nına (odds) ilişkin değişim ölçüleri olduğu bilinmektedir. Ancak, lojis-tik katsayıların orijinal formlarında yorumlanması oldukça güçtür; çün-kü bağımlı ölçüm olarak logit kullanıldığı zaman logaritma cinsinde ifa-de edilirler. Bundan dolayı da pek çok bilgisayar programı üstel lojistik regresyon katsayıları da sunar ki, bunlar orijinal lojistik katsayıların dö-nüştürülmüş (antilog) halidir. Lojistik regresyon analizinde yorumlama için ya orijinal ya da üstel lojistik katsayılar kullanılabilir. Yordanan de-ğişkenin iki şekli ile yordayıcı değişken arasındaki ilişkiyi farklı şekilde yansıtan iki tür lojistik katsayıdan söz edilebilir (Hair ve ark., 2006). Bu katsayılar Şekil 1’de sunulmaktadır:

Page 34: Lojistik Regresyon Analizi: Kavram ve Uygulama

1390 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Lojistik Katsayı Değişikliklerin Yansıması

1.Orjinal 1.Logit (Odds’un log’u)

2.Üstel 2.Odds

Şekil 1. Yordanan ve Yordayıcı değişkenler arasındaki ilişkiyi yansıtan lojistik kat-sayı türleri

Her iki katsayı da hem yön, hem de büyüklük olarak yorumlamada fark-lı yöntemler gerektirirler (Hair ve ark., 2006). İlişkinin yönü (pozitif ya da negatif ) yordayıcı değişkende meydana gelen değişimlerle ilişkili olarak yordanan değişkendeki değişimleri yansıtır. Pozitif ilişkinin an-lamı, yordayıcı değişkende meydana gelen artışla ilişkili olarak yorda-nan olasılıkta meydana gelen artış demektir. Negatif ilişki için de bunun tersi söz konusudur. Aşağıda ilişkinin yönünün, orijinal ve üstel lojistik katsayılar için farklı yorumlanmasına ilişkin açıklamalar yer almaktadır (Hair ve ark., 2006).

Orijinal Katsayıların Yönünün Yorumlanması: Orijinal katsayıların işareti (pozitif ya da negatif ) ilişkinin yönünü gösterir ve regresyon kat-sayılarında görülür. Pozitif katsayı yordanan olasılığı yükseltirken, nega-tif katsayı düşürür; çünkü orijinal katsayılar logit değerleri olarak ifade edilir ve sıfır olması odds’un 1.00, olasılığın ise .50 olması anlamına ge-lir. Sonuç olarak negatif sayılar odds’un 1.0’den küçük ve olasılığın da .50’den az olması anlamına gelir.

Üstel Katsayıların (Exponentiated Coefficients) Yönünün Yorum-lanması: Üstel katsayılar farkı şekilde yorumlanmalıdır; çünkü bu kat-sayılar orijinal katsayıların logaritmasıdır. Logaritma alırken, aslında üs-tel katsayılar odds cinsinden ifade edilir. Bunun anlamı üstel sayıların negatif değerler alamayacağıdır. Sıfırın logaritması 1 olduğu için, üs-tel katsayı 1.0, aslında yönü olmayan ilişkiye karşılık gelir. Sonuç olarak 1.0’in üzerinde üstel katsayı pozitif ilişkiyi, 1.0’den küçük katsayı ise ne-gatif ilişkiyi yansıtır.

Örneğin eğer bi (orijinal katsayı) pozitif ise, bunun dönüştürülmüş hali (üstel katsayı) 1’den büyük olacaktır. Bunun anlamı da, yordayıcı değiş-kendeki herhangi bir pozitif değişmeye karşılık, odds değerinin yüksele-ceğidir. Böylece de model daha yüksek gerçekleşme olasılığının yordan-masını sağlar. Benzer şekilde eğer bi negatif ise, üstel katsayı 1’den kü-çük olacak ve odds da düşecektir. Bir katsayının sıfır olması, üstel katsa-yı değerinin 1 olması ve odds’da değişme olmaması anlamına gelir (Hair ve ark., 2006).

Page 35: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1391

Katsayıların yorumlanmasında bir diğer boyut, ilişkinin büyüklüğüne ilişkindir. Bağımsız değişkendeki bir birimlik değişmenin olasılıkta ne kadarlık bir değişmeye yol açacağını belirlemek için, katsayının nüme-rik değeri değerlendirilmelidir. Çoklu regresyonda olduğu gibi, katsayı-nın metrik olup olmadığına göre yorumlama farklı şekilde yapılmalıdır; çünkü her birinin yordanan değişken üzerindeki etkileri farklıdır (Hair ve ark., 2006).

Metrik Bağımsız Değişkenlerin Büyüklüğünün Yorumlanması: Metrik değişkenler için soru; “yordayıcı değişkendeki her bir birimlik değişme için, kestirilen olasılıktaki değişim ne kadardır?” şeklindedir. Çoklu regresyonda regresyon katsayıları, yordayıcı değişken ile yorda-nan değişken arasındaki doğrusal ilişki eğilimine sahiptir. 1.35 olan bir katsayı, yordayıcı değişkende meydana gelen her bir birimlik değişmeye karşılık, her seferinde yordanan değişkende 1.35 birimlik değişme mey-dana geleceğini göstermektedir. Lojistik regresyonda ise, 0-1 arasında sınırlı doğrusal olmayan bir ilişki söz konusudur ve dolayısıyla da farklı şekilde yorumlanması gerekir.

Orijinal Lojistik Katsayılar: Her ne kadar ilişkinin yönüne karar ver-mekte orijinal lojistik katsayılar çok uygun ise de, ilişkinin büyüklüğüne karar vermede daha az kullanışlıdır. Çünkü bu katsayılar logit değerin-deki (log odds) değişmeleri yansıtırlar ve bir birimlik değişim, gerçekte olasılıkta ne kadarlık bir değişme olduğunu betimlemez.

Özet olarak; metrik yordayıcı değişkenlerin büyüklüğü orijinal ve üstel katsayılar için farklı şekilde yorumlanır. Orijinal katsayılar ilişkinin bü-yüklüğünün değerlendirilmesinde daha az kullanışlıdır; çünkü logit (log odds) değerindeki değişmeyi yansıtırlar. Üstel katsayılar ise, doğrudan odds değerindeki değişmenin büyüklüğünü yansıtırlar. Ancak etkileri artan / çarpımsaldır (multiplicative) ve katsayının 1.00 olması, değiş-me olmadığı anlamına gelir (yordayıcı değişkenin 1 kez artması, değiş-me olmaması demektir). İlişkinin yönü de ya doğrudan orijinal katsayı-lar (pozitif ya da negatif ) ya da dolaylı olarak üstel katsayılar (1’den kü-çükse negatif, 1’den büyükse pozitif ) yardımıyla değerlendirilir. İlişkinin büyüklüğünün değerlendirilmesinde ise üstel katsayılar çok daha kulla-nışlıdır; çünkü yordanan değişkendeki değişmenin yüzde olarak ifade edilmesini [(Üstel katsayı – 1). 100] sağlarlar.

Page 36: Lojistik Regresyon Analizi: Kavram ve Uygulama

1392 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Tablo 13. Amaçlanan Model Değişkenlerinin Katsayı Tahminleri

Adımb

Standart Hata Wald sd p Exp(b)

1Epistemolojik İnanç .053 .014 14.807 1 .000 1.054

Sabit -6.910 1.800 14.733 1 .000 0.001

2

Bilimsel Düşünme .135 .067 4.027 1 .045 1.144

Epistemolojik İnanç .048 .014 11.838 1 .001 1.049

Sabit -8.538 2.077 16.904 1 .000 0.000

Tablo 13 incelendiğinde, bilimsel düşünme becerisi yordayıcı değişkenin-deki 1 birimlik artışın, yüksek eleştirel düşünme (çünkü 1 olarak kodla-nan kategori yüksek eleştirel düşünme kategorisidir) odds’unda %14.4’lük [(1-1.144).100] artışa yol açtığı görülmektedir. Artışa yol açtığına ilişkin belirleme, daha önce tartışıldığı üzere bu değişkene ilişkin b katsayısının işaretinin pozitif olmasından kaynaklıdır. Epistemolojik inanç yordayıcı değişkenindeki 1 birimlik artışın ise, yüksek eleştirel düşünme odds’unda %4.9’luk [(1-1.049).100] artışa yol açtığı görülmektedir.

Tablo 14’te yordayıcı değişkenlerin çıkartılması halinde modelin duru-muna (model if term removed) ilişkin -2LL değeri, bu değerlerdeki de-ğişim miktarı, serbestlik derecesi ve değişimlerin anlamlılığına ilişkin p değerleri sunulmaktadır.

Tablo 14. Yordayıcı Değişkenlerin Çıkartılması Halinde Modelin Durumu

Değişken Model LL -2LL’deki Değişim sd P

Adım 1 Epistemolojik İnanç -138.619 16.839 1 .000

Adım 2Bilimsel Düşünme -130.200 4.463 1 .035

Epistemolojik İnanç -134.559 13.182 1 .000

Tablo 14 incelendiğinde, sadece sabit terimin yer aldığı temel mode-le birinci adımda en yüksek puan istatistiğini veren epistemolojik inanç

Page 37: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1393

değişkeni girdiğinde, -2LL farkı 16.839’dur (277.239-260.400). İkin-ci adımda bilimsel düşünme becerisi değişkeni girdiğinde oluşan -2LL farkı ise 4.463’tür (260.400-255.937). Her iki durumda da modelin uyumunda meydana gelen değişme anlamlıdır.

Değişken/değişkenler elendiğinde modelin durumunu gösteren tablo (model if term removed), değişken elendiğinde ya da modelden çıkar-tıldığında bu durumun modeli anlamlı etkileyip etkilemediğini göste-rir. Değişmenin anlamlı olması, modelin bundan olumsuz etkileneceği, yani değişken/değişkenlerin elenmesinin iyi bir fikir olmadığıdır (Fi-eld, 2005). Tablo 14’te görüldüğü gibi, epistemolojik inanç ve bilim-sel düşünme becerisi değişkenlerinin modelden çıkartılması iyi bir fi-kir değildir; çünkü her ikisi de modelin tahmin gücünü anlamlı düzey-de azaltmaktadır.

Tartışma ve Sonuç

Lojistik regresyon analizi normallik, varyansların homojenliği gibi sa-yıltıların karşılanmaması durumunda diskriminant analizi ve çapraz dü-zey içeren tablolara alternatif olurken, bağımlı değişkenin 0 ve 1 gibi ikili ya da ikiden çok düzey içeren kategorik bir değişken olması duru-munda normallik sayıltısının bozulması nedeniyle, doğrusal regresyon analizine de alternatif olmaktadır (Tatlıdil, 1996).

Lojistik regresyon analizinin kullanım amacı, istatistikte kullanılan di-ğer model yapılandırma teknikleriyle aynıdır. Dolayısıyla temel amaç, en az değişkeni kullanarak en iyi uyuma sahip olacak biçimde, yorda-yan (bağımsız) ve yordanan (bağımlı) değişkenler arasındaki ilişkiyi ta-nımlayabilen, kabul edilebilir bir model kurmaktır (Atasoy, 2001). Bir diğer deyişle yordanan değişken (Y) iki kategorili ya da sınıflandırılmış olduğunda, yordanan değişken ile yordayıcı değişken ya da değişkenler arasındaki en uygun ve ekonomik modeli oluşturmaktır (Seven, 1997). Modelde genellikle X olarak gösterilen yordayıcı değişkenler, Y olarak gösterilen yordanan değişkeni tahmin etmek amacıyla kullanılmakta-dır. Yordayıcı değişkenlerin, yordanan değişkeni tahmin etmek amacıy-la bir deneme sürecinde ölçülmesi ve elde edilen regresyon denkleminin gelecekte yordanan değişkeni tahmin etmek amacıyla kullanılması yay-gın bir uygulamadır. Her iki durumda da, X ve Y değişkenleri arasında-ki ilişkinin yapısı tam olarak bilinmiyorsa, seçilen değişkenlerden elde edilen verilerin kullanılması ve tahmin için kullanılacak ilişkinin yapısı-

Page 38: Lojistik Regresyon Analizi: Kavram ve Uygulama

1394 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

nı örnekleyebilecek ilişkinin belirlenmesi gerekmektedir (Miller, 1990).

Bu çalışmada, lojistik regresyon ayrıntıları ile ele alınmış, birden faz-la ölçme aracından elde edilen puanlar modele bağımsız değişken ola-rak atanmıştır. Yordanmaya çalışılan değişken ise eleştirel düşünme dü-zeyi olup, iki kategorili (düşük-yüksek) bir değişken olarak modelde ta-nımlanmıştır. Lojistik regresyon birçok istatistiksel yöntemin gerektir-diği varsayımlardan sorumlu tutulmamaktadır. Ancak, lojistik regresyon analizinden önce özellikle değişkenler arası çoklu bağlantı problemi-nin test edilmesi önemli görülmektedir. Bu problemin göz ardı edilme-si, yanlı ve sapmalı bulguları beraberinde getirebilecektir. Ayrıca, örnek-lem büyüklüğünün de lojistik regresyon analizine uygun olması dikka-te alınmalıdır. Lojistik regresyon, örneklemdeki bireylerin grup üyelik-lerini belirlerken, bireylerin bu sınıflarda bulunma olasılıklarını da he-saplamaktadır. Bireylerin gruplara üye olma durumları P(πik)= P (cik | xi) (yi | cik, xi) şeklinde hesaplanır. Bununla birlikte, alt sınıflarda yordanan değişkenin her bir kategorisi için odds oranlarını da

hesaplayabil-mektedir (Kayri ve Okut, 2008).

Yapılan çalışmada, hem bireylerin yordanan değişkenin iki kategorisin-den birinde (düşük ya da yüksek eleştirel düşünme) yer alma olasılıkları, hem de yordayıcı değişkenlerin, bu kategoriler üzerindeki etkisi model-lenmek istenmiştir. Söz konusu modellemeye ilişkin matematiksel eşit-lik aşağıdaki gibidir:

Lojistik regresyon analizi sonucunda elde edilen modelin uyumunu sı-nayan yöntemlerden biri Wald istatistiğidir. Lojistik regresyon analizi-nin güçlü ki-kare tabanına sahip Wald istatistiği ile sınanabilmesi, bu analizi daha yansız ve sapmasız parametre bulguları ile sonuçlandırabil-me avantajını sağlamaktadır. Yapılan bu çalışmada, lojistik regresyonun tahminlediği parametreler Wald istatistiği ile sınanmış ve modelde yer alan tüm yordayıcı değişkenlerin modele anlamlı katkılar sağladığı gö-rülmüştür (bk. Tablo 13).

Sonuç olarak, sosyal bilimler alanında yapılan çalışmalarda genellikle çok sayıda değişkenle ilgilenilmektedir. Bir regresyon eşitliğine girecek

Page 39: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1395

değişken sayısı ne kadar çok olursa, eşitlik o kadar az hata taşır ve yorda-nan değişkene ilişkin açıklanan varyans oranı da yükselir. Ancak, gerek bağımsız değişkenlere ilişkin gözlem elde etmenin, gerekse bu gözlem-leri belirli bir zaman aralığında yapmanın getireceği güçlükler ve ola-sı hatalar bağımsız değişken sayısını azaltmayı gerekli kılabilir. Bu ne-denle, yapılacak yordamanın doğruluğuna zarar vermeyecek ve hatala-rı mümkün olduğunca azaltacak sayıda değişkenle ilgilenmenin önem-li olduğu unutulmamalıdır (Düzgüneş ve ark., 1987’den akt. Önder ve Cebeci, 2001). Ayrıca yine sosyal bilimlerde karşılaşılan ve araştırılan olaylara ilişkin elde edilen verilerin çoğunlukla kesikli (süreksiz) değer alan kategorik (sınıflamalı) veriler ya da sıralamalı ölçekle elde edilmiş veriler olması gerçeği göz önünde bulundurulduğunda, bu tür modelle-melerin kullanımının avantaj sağlayacağı düşünülebilir. Dolayısıyla da uygun araştırma modellerinin kurgulanması durumunda, hem analiz, hem de yorumlama kolaylığı açısından lojistik regresyon analizinin kul-lanımı önerilmektedir.

Page 40: Lojistik Regresyon Analizi: Kavram ve Uygulama

1396 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ

Page 41: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Lojistik Regresyon Analizi: Kavram ve Uygulama... • 1397

Logistic Regression: Concept and Application

Ömay ÇOKLUK*

AbstractThe main focus of logistic regression analysis is classification of individuals in different groups. The aim of the present study is to explain basic concepts and processes of binary logistic regression analysis intended to determine the combination of independent vari-ables which best explain the membership in certain groups called dichotomous depen-dent variable. Independent variables in this study are as follows: total score in the Scien-tific Thinking Skills Scale, total score in the Epistemological Belief Scale and total sco-re in the Fatalism Scale. The dependent (predicted, criteria) variable is the level of critical thinking. While the three independent variables are constants, the dependent variable is defined as a categorical variable to include high and low critical thinking levels. The study group consists of 200 students from Ankara University, Faculty of Educational Sciences, Department of Guidance and Psychological Counseling during the 2006-2007 academic years. In the study, the following were used: the Epistemological Belief Scale adapted to Turkish by Deryakulu and Büyüköztürk (2002), the California Critical Thinking Dispo-sition Scale adapted to Turkish by Kökdemir (2003), the Scientific Thinking Skills Scale” developed by Gündoğdu (2002) and the Fatalism Scale” developed by Şekercioğlu (2008). The study presents information about how to relatively assess each application step of lo-gistic regression analysis. When the coefficient predictions of aimed model variables at the end of the study are considered, it is observed that a one-unit increase in the predicti-ve variable of scientific thinking skills leads to an increase of 14.4% in high critical thin-king odds. It is also seen that a one-unit increase in the predictive variable of epistemolo-

gical belief leads to an increase of 4.9% in high critical thinking odds.

Key WordsLogistic Regression Analysis, Critical Thinking, Scientific Thinking Skills, Epistemolo-

gical Belief, Fatalism.

*Correspondence: Assist. Prof. Ömay Çokluk, Ankara University Faculty of Educational Sciences, 06590 An-kara/Turkey.

E-mail: [email protected]

Kuram ve Uygulamada Eğitim Bilimleri / Educational Sciences: Theory & Practice10 (3) • Summer 2010 • 1397-1407

© 2010 Eğitim Danışmanlığı ve Araştırmaları İletişim Hizmetleri Tic. Ltd. Şti.

Page 42: Lojistik Regresyon Analizi: Kavram ve Uygulama

1398 • EDUCATIONAL SCIENCES: THEORY & PRACTICE

Researchers almost from every discipline would like to define work-ing principles of systems based on gathered data and they turn towards abstract structures to explain such systems. It is possible to define these abstractions as the term “model”. A model is shaping information or concerns in a case, depending on certain principles (Tatlıdil, 1996). In-tended use of logistic regression analysis is the same as those of other model structuring techniques in statistics. In such analysis, the main goal to form an acceptable model which could define the correlation between dependent (predicted) and independent (predictive) variables in best fit with the least variable (Atasoy, 2001).

The use of logistic regression model dates back to 1845. It first appeared during the mathematical studies for the population growth at that time (Gürcan, 1998). The term logistic regression analysis comes from logit transformation, which is applied to the dependent variable. This case, at the same time, causes certain differences both in estimation and inter-pretation (Hair, Black, Babin, Anderson and Tahtam, 2006). Logistic regression analysis is also called “Binary Logistic Regression Analysis”, “Multinominal Logistic Regression Analysis” and “Ordinal Logistic Regression Analysis”, depending on the scale type where the depend-ent variable is measured and the number of categories of the dependent variable. Logistic regression is divided into two: “univariate logistic re-gression” and “multivariate logistic regression” (Stephenson, 2008).

The main focus of logistic regression analysis is classification of individ-uals in different groups. The aim of the present study is to explain basic concepts and applications of binary logistic regression analysis intended to determine the combination of independent variables which best ex-plain the membership in certain groups called dichotomous dependent variable.

Data related to confronted and researched cases in applied social sci-ences are mostly categorical (nominal) data with discrete value or data obtained by an ordinal scale. For instance, a man either works or unem-ployed; he is either a member of a group or not; the party in power is either from the right wing or the left wing; a student is either a graduate or not (Arabacı, 2002; Kılıç, 2000; Mertler & Vannatta, 2005). In edu-cational research, many problems relate with prediction of categorical results. For example, a student is either academically successful or not; he is either a slow learner or not; a teenager either has a tendency to-wards risky behavior or not (Peng, Lee & Ingersoll, 2002). For instance,

Page 43: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Logistic Regression: Concept and Application • 1399

in a study by Kayri and Okut (2008), the individuals in special ability exam of a university for the Department of Physical Education and Sports Teaching were modeled using mixed logistic regression analysis as those achieved or not (or those who get into the department or not) according to gender. Multivariable statistical analysis of categorical data is of importance for almost every discipline. Logistic regression analysis, with its advantage of being more eligible than other analysis and with its regression logic, has an important place in categorical data analysis (Kılıç, 2000).

Over the past years, logistic regression has been commonly used (Cook, 2008; Garson, 2008; Mertler & Vannatta, 2005; Seven, 1997; Tabach-nick & Fidell, 1996). Logistic regression is similar to both multiple re-gression and discriminant analysis. Simple and multiple linear regres-sion analysis are used to analyze the mathematical correlation between dependent (predicted or criteria) variables and independent (predictive or explanatory) variable or variables. In data sets where these methods could be used, it is essential that the dependent variable display a nor-mal distribution, independent variables consist of a variable or variables with normal distributions and error terms variance display a normal distribution. Under no such circumstances, simple or multiple linear re-gression analysis cannot be used (Kılıç, 2000).

Although regression equation varies, basic terms of multiple linear re-gression analysis are the same as the terms of logistic regression (George and Mallery, 2000). A standard regression equation consists of true val-ues of a few independent variables and weights produced by the model to predict the value of the dependent variable. On the other hand, in logistic regression, the estimated value ranges from 0 to 1. More clearly, logistic regression reveals the possibility of particular consequences for each subject (for example; “passed” or “failed”). The analysis produces a regression equation which enables us to make an accurate estima-tion for the possibility that an individual falls into one of the categories (“passed”) or (“failed”) (Tate, 1992). As a result, the main difference between the two techniques is that the value of the dependent variable is estimated in multiple linear regression analysis, while the possibility of occurrence of one of the values which the dependent variable might have is estimated in logistic regression analysis (Bircan, 2004).

Logistic regression is an analysis which enables us to estimate categori-cal results like group membership with the help of a group of variables.

Page 44: Lojistik Regresyon Analizi: Kavram ve Uygulama

1400 • EDUCATIONAL SCIENCES: THEORY & PRACTICE

Independent variables could be constant or categorical. Also, discrimi-nant analysis aims at explaining and predicting group membership us-ing a group of independent variables. When all these definitions are taken into account, it is clear that discriminant analysis and logistic regression analysis enable us to answer the same questions. In addi-tion, logistic regression analysis and discriminant analysis are similar in that they both have a categorical dependent variable (Büyüköztürk & Çokluk-Bökeoğlu, 2008). However, logistic regression analysis differs from discriminant analysis and multiple regression analysis at certain points (Tabachnick & Fidell, 1996). Logistic regression analysis, unlike discriminant analysis and multiple regression analysis, does not require assumptions to meet concerning the distribution of independent vari-ables. In other words, assumptions such as normal distribution of inde-pendent variables, linearity and equality of variance-covariance matrix do not have to be met. Therefore, it might be suggested that logistic regression analysis is much more flexible than the other two techniques. Also, it is sensible to state that it is easier to interpret the mathemati-cal model obtained as a result of analysis by logistic regression analy-sis (Akkuş and Çelik, 2004; Grimm and Yarnold, 1995; Kalaycı, 2005; Leech, Barrett and Morgan, 2005; Poulsen and French, 2008; Tabach-nick and Fidell, 1996; Tatlıdil, 1996). However, since maximum likeli-hood method, unlike least squares method is used in logistic regression analysis to obtain coefficients, it is important not to study with a low number of observations, because in estimations by low numbers of ob-servations, reliability of the model decreases.

Although logistic regression could be used to predict a dependent vari-able with two or more categories, as it is mentioned above, the present study concerns only a dichotomous dependent variable, in other words, where the dependent variable is dichotomous. Therefore, it is aimed to introduce application processes of binary logistic regression analysis us-ing real data. It is thought that introducing and illustrating logistic re-gression analysis will be useful for further use in applied social sciences such as education and psychology.

The study is correlational research. Correlational research includes studies where the correlation between two or more variables is exam-ined, without any variable manipulation (Büyüköztürk, Kılıç Çakmak, Akgün, Karadeniz, & Demirel, 2008). The independent variables in this study are as follows: total score in the Scientific Thinking Skills Scale,

Page 45: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Logistic Regression: Concept and Application • 1401

total score in the Epistemological Belief Scale and total score in the Fa-talism Scale. The dependent (predicted, criteria) variable is the level of critical thinking. While the three independent variables are constants, the dependent variable is defined as a categorical variable to include high and low critical thinking levels.

The study group consists of 200 students from Ankara University, Fac-ulty of Educational Sciences, Department of Guidance and Psycho-logical Counseling during the 2006-2007 academic years. In the study, the following were used: the Epistemological Belief Scale, developed by Schommer (1990) and adapted to Turkish by Deryakulu and Büyüköz-türk (2002, 2005), the California Critical Thinking Disposition Scale adapted to Turkish by Kökdemir (2003), the Scientific Thinking Skills Scale developed by Gündoğdu (2002) and the Fatalism Scale developed by Şekercioğlu (2008).

In the study, the students were divided into two groups according to their scores from the California Critical Thinking Disposition Scale as high and low critical thinking level groups. The scores for this classifica-tion were almost the normal distributed arithmetic mean was used as cut-off point. The mean of the group according to their scores from the scale was approximately 220 and the students with the same or a lower score were assigned to “low”, those with a higher score were assigned to “high” critical thinking level category. Thus, the dichotomous dependent variable for the analysis was obtained.

In binary logistic regression analysis, it is essential that the categories of dependent variable should be encoded as 0 and 1 in the analysis. In our case, 0 shows low critical thinking level and 1 means high critical thinking level. Accordingly, the coefficients obtained reflect the effects of the variables of scientific thinking, epistemological belief and fatal-ism on the possibility of having a high critical thinking level, since the category encoded as 1 shows “high” critical thinking level. For the study could be defined as exploratory by nature, a stepwise method was pre-ferred. Although forward methods have some disadvantages, Todman and Dugard (2007) state that they present more reliable results when the number of parameters is low and emphasize similar results are ob-tained, although different selection criteria are used. Therefore, in this study, logistic regression analysis is carried out using “Forward Likeli-hood Ratio-Forward:LR”.

Page 46: Lojistik Regresyon Analizi: Kavram ve Uygulama

1402 • EDUCATIONAL SCIENCES: THEORY & PRACTICE

In the study, before the application of logistic regression analysis, eigen-values, condition indexes, variance ratios and standard errors in predic-tive variables, tolerance, VIF values and bivariate correlations between variables were examined to probe the problem of multicollinearity be-tween variables. When all the findings obtained are considered, it is clear that there is no problem of multicollinearity between the predic-tive variables (Büyüköztürk, 2009; Menard, 1995; Myers, 1990).

The study presents information about how to relatively assess each ap-plication step of logistic regression analysis. In SPSS, when logistic regression analysis is used, first -2LL value of the baseline model or constant only model is presented. At further stages, with the predictive variable included in the model, there are changes in –2LL value. In other words, as the predictive variables are added to the model, there are developments in the model and model-data fit is improved.

The results of logistic regression analysis in SPSS first present a clas-sification table. This case, at the same time, can be interpreted as the fact that in a constant only model, membership of only one group can be accurately classified (Kalaycı, 2005). In this study, as a result of the anal-ysis, it was determined that all the students were classified in low criti-cal thinking category and the percentage of accurate classification was 50.50 %. Following the classification table, the constant term which constituted the baseline model concerning Blok 0, standard error of the constant term, Wald statistics to test significance of variables (Agresti, 1996), degree of freedom of Wald statistics and significance level, and

)(BExp or exponentiated logistic coefficients were assessed.

When residual chi-square or the initial chi-square value is considered, it is clear that the value is significant. This case shows the coefficients of predictive variables which are not included in the model significantly differ from 0, in other words, adding one or more variables to the model will increase the predictive power of the model. It is also understood that all the predictive variables in the study considerably contribute to the model and further selection of variables is decided.

Score statistics are Roa’s efficient score statistics for each variable and decide whether each variable significantly contributes to the model or not (Field, 2005). Here, significant score statistics of all variables means all predictive variables will potentially contribute to the model.

Page 47: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Logistic Regression: Concept and Application • 1403

Then, the model was assessed with p value of chi-square statistics. A sig-nificant value means a current correlation between the combination of predicted variables and the predictive variables. Significant model chi-square statistics means refusing the null hypothesis (H0) stating “There is no difference between the baseline model with the constant only and the final model obtained when predictive variables are analyzed or be-tween the former and the aimed model”: It also means supporting the correlation between predictive variables and the predicted variable.

Next, changes in -2LL value of the baseline model were examined. This case shows improvements in the model, when one or more variables are added to the model. In our case, in the baseline or constant-only model, it was seen that the changes in the model fit were significant when the variable of epistemological belief with the highest score statistics was added at the first stage and the variable of scientific thinking at the second stage.

Cox & Snell R2 and Nagelkerke R2 values represent two different ways of prediction for the explained variance in the dependent variable by the model and are interpreted in a similar way to R2 in multiple regression (Field, 2005). When Cox & Snell R2 values are examined, it is observed that when the predictive variable of epistemological belief at the first stage is included in the analysis, it explains 8.1% of the variance of the predicted variable of critical thinking, and when the predictive vari-able of scientific thinking skills at the second stage is included in the analysis, it explains 10.1% of the variance of the predicted variable of critical thinking, together with the two predictive variables. Nagelkerke R 2 values are 10.8% for the first stage, and 13.5% for the second stage.

Hosmer and Lemeshow chi-squared goodness of fit test assess logistic regression model fit as a whole. It is particularly more powerful than the traditional chi-square test when predictive variables are constant vari-ables or when there is a small sample. Here, the result of Hosmer and Lemeshow test is significant neither when only the predictive variable of epistemological belief at the first stage is included in the analysis, nor the predictive variable of scientific thinking skills is included in the analysis. This case shows a bivariate model is of acceptable fit, that is; the model-data fit is enough.

When classification results after logistic regression model were exam-ined, it was determined that at first all the students were classified in

Page 48: Lojistik Regresyon Analizi: Kavram ve Uygulama

1404 • EDUCATIONAL SCIENCES: THEORY & PRACTICE

low critical thinking category and the percentage of accurate classifica-tion was 50.50%. As a result of logistic regression model, the ratio in low critical thinking is 54.50% and 63.60% in high critical thinking group at the first stage, for the classification according to the predictive variable of epistemological belief. The total percentage of accurate clas-sification at the first stage is 59.00%. When this case is compared to the original classification percentage, it might be suggested that the accu-rate classification percentage is increased when the predictive variable of epistemological belief is included in the analysis. The total percentage of accurate classification of the aimed model is increased to 63.50% at the second stage, when the variable of scientific thinking skills is included in the analysis, together with epistemological belief. This finding can be interpreted as an indicator of model-data fit.

When the predictions of the variables of the aimed model variables were considered, it was seen that a one-unit increase in the predictive variable of scientific thinking skills led to an increase of 14.4% in high critical thinking odds. A one-unit increase in the predictive variable of epistemological belief led to an increase of 4.9% in high critical think-ing odds. When variable/variables were eliminated and whether that case affected the model was examined, it was determined that eliminat-ing the variables of epistemological belief and scientific thinking skills was not a good idea because both significantly decreased the predictive power of the model.

As a result, logistic regression analysis is an alternative to discriminant analysis and cross level tables when assumptions such as normality and homogeneity of variance are not met, and it is the alternative of linear regression analysis when the dependent variable is a categorical variable including two (such as 0 and 1) or more levels, since the assumption of normality is invalid (Tatlıdil, 1996).

Intended use of logistic regression analysis is the same as those of other model structuring techniques in statistics. In such analysis, the main goal to form an acceptable model which could define the correlation between dependent (predicted) and independent (predictive) variables in best fit with the least variable (Atasoy, 2001). In other words, when the predicted variable (Y) is dichotomous or classified, the most eligible and economic model between the predicted variable and the predic-tive one or ones occurs (Seven, 1997). In the model, predictive variables generally referred as X are used to estimate the predicted variable Y.

Page 49: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Logistic Regression: Concept and Application • 1405

Measuring predictive variables in order to estimate the predicted vari-able over a probation time and using the obtained regression equation to estimate the predicted variable in the future are common practices. In both cases, when the nature of correlation between variables X and Y is not fully known, it is essential to use data from the selected variables and define the correlation which could show the nature of the correla-tion to be used for prediction (Miller, 1990).

The higher the number of variables to be included in a regression equa-tion designed to explain variance of the predicted variable, the less er-ror rate in the equation will be. However, problems and possible errors caused by workload for observation of each predictive variable and time limit for such observations would entail a decrease in the number of predictive variables. Therefore, accuracy of predictions should be high as much as possible and it is suggested to work with a reasonable number of predictive variables to lower systematic errors caused by data gather-ing using too many variables (Önder & Cebeci, 2001).

Page 50: Lojistik Regresyon Analizi: Kavram ve Uygulama

1406 • EDUCATIONAL SCIENCES: THEORY & PRACTICE

References/KaynakçaAgresti, A. (1996). An introduction to categorical data analysis. New York: John Wi-ley and Sons.

Akkuş, Z., ve Çelik, M. Y. (2004, Eylül-Ekim). Lojistik regresyon ve diskriminant analizi yöntemlerinde önemli ölçütler. VII. Ulusal Biyoistatistik Kongresinde sunu-lan bildiri. Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Mersin.

Arabacı, Ö. (2002). Lojistik regresyon analizi ve bir uygulama denemesi. Yayınlanma-mış yüksek lisans tezi, Uludağ Üniversitesi, Sosyal Bilimler Enstitüsü, Bursa.

Atasoy, D. (2001). Lojistik regresyon analizinin incelenmesi ve bir uygulaması. Yayın-lanmamış yüksek lisans tezi, Cumhuriyet Üniversitesi, Sosyal Bilimler Enstitüsü, Si-vas.

Bircan, H. (2004). Lojistik regresyon analizi: Tıp verileri üzerine bir uygulama. Ko-caeli Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 2, 185-208.

Büyüköztürk, Ş. (2009). Sosyal bilimler için veri analizi el kitabı: İstatistik, araştırma deseni, SPSS uygulamaları ve yorum (9. bs).  Ankara: PegemA Yayıncılık.

Büyüköztürk, Ş., & Çokluk-Bökeoğlu, Ö. (2008). Discriminant analysis: Concept and application. Eurasian Journal of Educational Research, 33, 73-92.

Büyüköztürk, Ş., Kılıç-Çakmak E., Akgün, Ö. E., Karadeniz, Ş. ve Demirel, F. (2008). Bilimsel araştırma yöntemleri (2. baskı). Ankara: PegemA Yayıncılık.

Cook, D. (2008). Binary response and logistic regression analysis. www.public.iastate.edu/~stat415/ stephenson/stat415_chapter3.pdf adresinden 22 Kasım 2008 tarihin-de edinilmiştir.

Deryakulu, D. ve Büyüköztürk, Ş. (2002). Epistemolojik İnanç Ölçeği’nin geçerlik ve güvenirlik çalışması. Eğitim Araştırmaları, 18, 111-125.

Deryakulu, D. ve Büyüköztürk, Ş. (2005). Epistemolojik inanç ölçeğinin faktör ya-pısının yeniden incelenmesi: Cinsiyet ve öğrenim görülen program türüne göre epis-temolojik inançların karşılaştırılması. Eğitim Araştırmaları, 5 (18), 57-70.

Field, A. (2005). Discovering statistics using SPSS (2nd ed.). London: Sage.

Garson, G. D. (2008). Logistic regression. http://www2.chass.ncsu.edu/garson/PA765/ logistic.htm adresinden 22 Kasım 2008 tarihinde edinilmiştir.

George, D., & Mallery, P. (2000). SPSS for Windows step-by-step: A simple guide and reference (2nd ed). Boston: Allyn and Bacon.

Grimm, L.G., & Yarnold, P. R. (Eds.). (1995). Reading and understanding multivari-ate statistics. Washington D.C.: American Psychological Association.

Gündoğdu, M. (2002). Üniversite öğrencilerinin bilimsel düşünme becerilerinin yor-danması. Türk Psikolojik Danışma ve Rehberlik Dergisi, II (17), 11-18.

Gürcan, M. (1998). Lojistik regresyon analizi ve bir uygulama. Yayınlanmamış yüksek lisans tezi, Ondokuz Mayıs Üniversitesi, Fen Bilimleri Enstitüsü, Samsun.

Hair, J. F., Black, W. C., Babin, B., Anderson, R. E., & Tatham, R. L. (2006). Multi-variate data analysis (6th ed). Upper Saddle River, NJ: Prentice-Hall.

Kalaycı, Ş. (Ed.). (2005). SPSS uygulamalı çok değişkenli istatistik teknikleri. Ankara: Asil Yayın Dağıtım.

Page 51: Lojistik Regresyon Analizi: Kavram ve Uygulama

ÇOKLUK / Logistic Regression: Concept and Application • 1407

Kayri, M. ve Okut, H. (2008). Özel yetenek sınavındaki başarıya ilişkin risk analizi-nin karışımlı lojistik regresyon modeli ile incelenmesi. Hacettepe Üniversitesi Eğitim Fakültesi Dergisi, 35, 227-239.

Kılıç, S. (2000). Lojistik regresyon analizi ve pazarlama araştırmalarında bir uygulama. Yayınlanmamış yüksek lisans tezi, İstanbul Teknk Üniversitesi, Fen Bilimleri Ens-titüsü, İstanbul.

Kökdemir, D. (2003). Belirsizlik durumlarında karar verme ve problem çözme.Yayım-lanmamıs doktora tezi, Ankara Üniversitesi Sosyal Bilimler Enstitüsü, Ankara.

Leech, N. L., Barrett, K. C., & Morgan, G. A. (2005). SPSS for intermediate statis-tics: Use and interpretation (2nd ed). Mahwah, NJ: Lawrence Erlbaum Associates.

Menard, S. (1995). Applied logistic regression analysis. Thousand Oaks, CA: Sage.

Mertler, C. A., & Vannatta, R. A. (2005). Advanced and multivariate statistical met-hods: Practical application and interpretation (3rd ed.). Glendale, CA: Pyrczak Pub-lishing.

Miller, A. J. (1990). Subset selection in regression. London: Chapman and Hall.

Myers, R. (1990). Classical and modern regression with applications (2nd ed). Boston, MA: Duxbury.

Önder, H. ve Cebeci, Z. (2001). Lojistik regresyonlarda değişken seçimi. Çukurova Üniversitesi Ziraat Fakültesi Dergisi, 17(2), 105-114.

Peng, C. Y. J., Lee, K. L., & Ingersoll, G. M. (2002). An introduction to logistic reg-ression analysis and reporting. The Journal of Educational Research, 96 (1), 3-14.

Poulsen, J., & French, A. (2008). Discriminant function analysis. http://userwww.sfsu. edu/~efc/classes /biol710/discrim/discrim.pdf adresinden 22 Kasım 2008 tarihin-de edinilmiştir.

Schommer, M. (1990). Effects of beliefs about the nature of knowledge on compre-hension. Journal of Educational Psychology, 82(3), 498-504.

Seven, Z. (1997). Değişken seçimi yöntemi olarak adimsal lojistik regresyon ile adım-sal diskiriminant analizinin karşılaştırılması. Yayınlanmamış yüksek lisans tezi, Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Ankara.

Stephenson, B. (2008). Binary response and logistic regression analysis. www.public.ias-tate.edu / ~stat415/stephenson/stat415_chapter3.pdf. adresinden 22 Kasım 2008 ta-rihinde edinilmiştir.

Şekercioğlu, G. (2008). Fatalizm Ölçeği’nin geliştirilmesi: Geçerlik ve güvenirlik çalış-ması. Yayınlanmamış makale taslağı.

Tabachnick, B. G., Fidell, L. S. (1996). Using multivariate statistics (3rd ed.). New York, USA: HarperCollins College Publishers.

Tatlıdil, H. (1996). Uygulamalı çok değişkenli istatistiksel analiz. Ankara: Engin Ya-yınları.

Tate, R. (1992). General linear model applications. Unpublished manuscript, Florida State University.

Todman, J., & Dugard, P. (2007). Approaching multivariate analysis: An introduction for psychology. New York: Taylor & Francis Group.

Page 52: Lojistik Regresyon Analizi: Kavram ve Uygulama

1408 • KURAM VE UYGULAMADA EĞİTİM BİLİMLERİ