yapay sİnİr aĞlari ve uygulamalari › baef › c9b675debb9ebe1b3948411… · kullanılan yapay...
TRANSCRIPT
YAPAY SİNİR AĞLARI
VE UYGULAMALARI
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
974
Tekstil Fabrikası Maketinin Nem ve Sıcaklığının Yapay Sinir Ağı
İle Kontrolü
Osman Doğmuş 1, Şaban Yılmaz
1, Fatih Keçecioğlu
1, Alev YILMAZ
1,Zafer Özer
1
Kahramanmaraş Sütçü İmam Üniversitesi, Avşar Yerleşkesi, Kahramanmaraş [email protected]
Özetçe
Tekstil Fabrikalarında klima, üretimin her
aşamasında çok önemlidir. İplik veya dokuma üretimi
olsun, bu ürünlerin kalitesini ortamın nemi ve sıcaklığı
büyük oranda etkilemektedir. Bu nedenle, Tekstil
Fabrikalarındaki klima kontrolünün, hassas bir şekilde
yapılması, üretimin kalitesi açısından çok önemlidir. Bu
çalışmada, Tekstil Fabrikalarındaki klima sistemlerinin
Yapay Sinir Ağı metodu ile kontrolü araştırılmıştır.
Deneysel çalışmalarda, tekstil fabrikası maketi
kullanılmıştır. Bu set DAQ kartı yardımı ile bilgisayara
bağlana bilmektedir. Yazılan Yapay Sinir Ağı metotlu
bilgisayar programı ile bu set kontrol edilmiştir.
1. Giriş
İklimlendirme odaları, parametreleri zamana ve
bir diğerine göre değişen doğrusal olmayan sistemlerdir.
İklimlendirme odasının imal edildiği malzemelerin ısı
yalıtım-transfer özellikleri farklılık göstermekte ve
matematiksel modelleri ancak birçok ihmal ve kabul
sonucunda yapılabilmektedir. Bu süreç oldukça zor ve
zaman alıcıdır. Geleneksel kontrol mühendisliğinde, bir
sistemin kontrol edilebilmesi için bazı durumlarda
sistemin matematiksel modeline ihtiyaç duyulmaktadır.
İklimlendirme odaları gibi çok parametreli doğrusal
olmayan sistemlerin matematiksel modelleri her ne
kadar bir takım varsayımlarla basite indirgenseler de
fazla sayıda diferansiyel denklemle ifade edilmeleri söz
konusu olup analitik olarak çözülmeleri de oldukça
zordur. Nümerik olarak bilgisayarda çözülmeleri ise
bazı durumlarda içerdikleri fazla sayıda iterasyon ve
tekrarlar nedeniyle zaman almaktadır. [1]
İklimlendirme bugün büyük ölçüde tekstil
sanayiinde uygulanmakta ve üretilen maddelerin kalitesi
üzerinde büyük etken olmaktadır. Bir pamuklu dokuma
fabrikasında nem %75-85 arası olmalıdır. Aksi halde
çözgü ve atkı kopuşları fazla olur ve dokuma
tezgâhlarının durmasına neden olur ve netice itibarı ile
üretimin düşmesine sebep olur.[2]
Ülkemizde ise tekstil sektörü hem istihdam
hem de ihracat yönünden basılıca sektörlerden biridir.
Bu sektörün ülke ekonomisindeki lokomotif görevini
sürdürebilmesi, dış pazarlarla rekabet edebilecek kalite
ve fiyatta üretimi yapabilmesine bağlıdır. Üretim
kalitesinin artırılması, organizasyon etkinliğinin yanı
sıra çalışma koşullarının iyileştirilmesi, çalışanların
motivasyonu ve eğitimlerinin artırılmasına bağlıdır.
Üretim maliyeti ise işletme ve yatırım maliyetlerinden
oluşur. İşletme maliyeti enerji ve işçilik kalemlerinden
meydana gelir. İşçilik maliyetinin ülkemizde, birçok
ülkeye göre daha düşük olması bu sektörün
sürdürülebilirliğinde önemli bir faktördür. [3]
Şekil 1: Tekstil Fabrikası İklimlendirmesi[4]
İklimlendirme şartları yalnızca üretimi
etkilemez aynı zamanda üretilen maddenin kalitesini de
etkiler. Örneğin dokuma fabrikasında nem %85 in
üzerinde olursa, çözgü üzerindeki haşılların
gevşemesine neden olur ve dolayısı ile çözgü iplerinin
mukavemeti azalır ve aynı zamanda çözgü ipleri kopar
ve randımanın düşmesine neden olur. Eğer nem %75 in
altında olursa, çözgü ipleri üzerindeki haşıl maddeleri
kurur ve iplik üzerinden tozarak kopar ve yine iplik
mukavemetinin azalmasına ve randımanın düşmesine
neden olur. Sonuç olarak nemin istenen değerden düşük
veya yüksek olması üretilen bezin kalitesini bozar,
mukavemetini düşürür, bez üzerinde uçlar, düğümler ve
istenmeyen artıklar meydana getirir. İplik üreten bir
tekstil fabrikasında nemin %45-55 olması gerekir.
Üretilen iplik kıvrımsız, yumuşak ve aynı derecede
elastiki olmalıdır. Bu ise ancak hava şartlarının istenen
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
975
değerde sabit tutulması ile mümkündür. Üretim kuru bir
havada yapıldığı zaman, ipliği teşkil eden lifler üzerinde
statik bir yük meydana gelir ve iplik pürüzleşmeye ve
kıvrılmaya müsait olur. Kopmalar sıklaşır ve randıman
düşer.[2]
2.Materyal ve Metot Yapılan bu çalışmada maket tekstil
fabrikasındaki nem miktarı tek fazlı asenkron motor
tarafından tahrik edilerek su pompasıyla kontrol
edilmektedir. Karar mekanizması PC bilgisayar
içerisinde Visual Basic programı ile oluşturulan ve
yapay sinir ağı algoritmasını içeren bilgisayar programı
ile oluşturulmuştur. Bilgisayarda elde edilen bilgi, DAQ
kartı yardımıyla inverter gönderilerek su pompasının
devir sayısı kontrol edilerek, sisteme istenilen değerde
nem verilmiştir. Nemlendirme odasındaki bağıl nem
miktarı; yaş ve kuru termometre sıcaklık sensörleri
tarafından algılanarak adams seti yardımıyla seri porttan
bilgisayar ortamına alınır. Program olması gereken bağıl
nem değeri ile ölçülen bağıl nem değerini karşılaştırarak
nemlendirme ihtiyacını belirler. Yapay Sinir Ağı
algoritması yardımıyla ihtiyaç olduğu kadar nem
uygulanır. Deney için kullanılan tekstil fabrikası maket
planı Şekil 2’de gösterilmektedir.
Şekil 2: Tekstil Fabrikası Maket Planı
Şekil 3: Tekstil Fabrikası Maket Fotoğrafı
Sıcaklık Algılayıcıları: Pt 100 sıcaklık
algılayıcıları kullanılmıştır. Sıcaklığa göre direnci lineer
olarak değişmektedir. –100 ile +100 oC arasında sıcaklık
ölçümü yapmaktadır.
Pt/RTD Giriş Modülü : Pt 100 ile ölçülen
sıcaklığı dijital bilgiye çevirmek için besleme voltajı
+10 - +30 V, örnekleme hızı : 10 Hz., doğruluk: ±%0.05
ve giriş direnci 2 Mohm olan Pt/RTD Giriş Modülü
olarak ADAM 4013 kullanılmıştır.
RS-422/485 den RS-232 ye Çevirici Modül:
Bu 4000 serisinin ana modülüdür. Bu modüle, seri
olarak 255 tane ölçüm modülü bağlanabilmektedir.
Kendisine bağlı modüllerden aldığı bilgileri, seri port
vasıtası ile bilgisayara aktarma işini yapar. Haberleşme
hızı ise bps olarak; 1200, 2400, 4800, 9600, 19200,
38400, 57600, 115200 olabilmektedir. RS-422/485 den
RS-232 ye Çevirici Modül olarak ADAM 4520
kullanılmıştır.
Bir Fazlı Asenkron Motor: LEYBOLD Marka
tek fazlı asenkron motor kullanılmıştır. 220 Volt, 50 Hz
şebekede çalışabilen ve senkron devir sayısı 3000 d/dak
olan kondansatörlü asenkron motorun devir sayısı
denetlenmiştir. Nominal devir sayısı 2850 d/dak ve
nominal çıkış gücü 300 wattır.
Frekans invertörü: DC uyartımla lineer olarak
V/f oranını sabit tutacak şekilde gerilim ve frekansı
birlikte artırıp azaltan gelişmiş bir frekans çeviricidir.
Giriş değerleri 220 Volt, 50 Hz ve 3 faz olup, çıkış
değerleri ise 0-220 Volt ve 0-50 Hz.’dır.
DAQ Kartı: DAQ (Data Acquisition=Veri
toplama) kartı bilgisayarın PCI veri yoluna takılmış
olup, bu kart yardımıyla dışardan bilgi almak ve
dışarıya bilgi vermek mümkündür. Bu kart yardımıyla
analog devir sayısı bilgisi, bilgisayara analog D.C.
Gerilim bilgisi İnvertöre gönderilmiştir. Kullanmış
olduğumuz DE LORENZO setinin DAQ kartı 8 bit veri
yoluna sahip olup, 8255 kontrol kartına sahiptir. Kart ile
Dijital veya analog bilgi alış verişi mümkündür.
Güç Kaynağı: Frekans invertörünün girişine
tek fazlı, 220 Volt verebilecek bir güç kaynağı
kullanıldı. Ayrıca opampları +12,-12 V DC besleyecek
ayarlı iki tane güç kaynağı kullanıldı. Mikroişlemci ve
yarı iletken teknolojisindeki gelişmeler invertörlerin
geniş sınırlar içerisinde devir sayısı ayarı yapmalarına
imkân vermiştir. Bir frekans invertöründe; motora
uygulanacak olan gerilim ilk önce bir doğrultucudan
geçirilerek DC gerilime çevrilir. DC gerilimin dengeli
bir şekilde yükselmesini ve sınır değerini geçmemesini
sağlamak amacıyla invertörde ara devre bobinleri, DC
gerilimin filtrelenmesi için ara devre kondansatörü
bulunmaktadır. DC gerilimden frekansı ve gerilimi
ayarlanabilen bir AC gerilim evirici sayesi ile elde
edilir. Evirici kontrolü kullanımı ile invertörün çıkış
gerilimi ve frekansı istenildiği oranda değiştirilir.
Fabrika maketi: Bir fazlı asenkron motor ile
tahrik edilen pompa yardımıyla su deposundan alınan
su, nemlendirme odasına basınçlı olarak, pülverize
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
976
edici özel fıskiye ile gönderilir. Suyun fazlası tahliye
kanalından tekrar depoya alınır. Ortamdaki su
zerreciklerinin kontrol edilen bölgeye doğrudan
ulaşmamaları için, nemli hava özel bir davlumbazdan
geçirilerek filtre edilmektedir. Fan yardımıyla nemli
havanın kanal içerisinde akışı sağlanmaktadır. Kontrol
bölgesindeki kirlenmiş nemli hava fan yardımıyla hava
çıkış kanallarına gönderilmektedir. Kontrol edilen
bölgedeki sıcaklık sensörleri yardımıyla ölçülen yaş ve
kuru sıcaklık bilgileri Bilgisayar yardımıyla nem olarak
hesaplanmaktadır
Yapılan bu çalışmada Dinvertör marka invertör
kullanılmıştır. Üç fazlı asenkron motor devir sayısı ayarı
için üretilen invertör 4 kW’a kadar olan motorlar için
kullanılabilir. Şekil 4’de Maketin Kontrol Şeması, Şekil
5’de ise nemlendirme ünitesinin blok şeması
gösterilmektedir.
Şekil 4: Maketin Kontrol Şeması
.
Şekil 4: Maketin Kontrol Şeması
3. Kullanılan Yapay Sinir Ağları
Sistemin gerçek çalışma blok diyagramı şekil
6. de verilmiştir. Sistemin çıkışı ve bir önceki değeri
YSA 'ına girilmekte, YSA 'ın çıkışı öğretici değerle
karşılaştırılmakta ve ağın ağırlıkları yeniden
belirlenmektedir. Oluşan hata ön bilgi bloğu ile
çarpılarak nemlendirme kontrol ünitesine
gönderilmektedir. Kontrol edilen bölgedeki sensörler
yardımıyla sistemin çıkışı bulunmaktadır. Şekil 7.de
Kullanılan YSA görülmektedir.
Şekil 6: Blok diyagramı
Şekil 7: Kullanılan YSA
Yapay Sinir Ağı yardımı ile su pompasının
sisteme gönderdiği su miktarı, tek fazlı kondansatörlü
asenkron motorun devir sayısı kontrol edilerek deneysel
çalışma yapılmıştır. Bilgisayar programı Visual Basic
ile gerçekleştirildi. Portlar ile haberleşmek için,
assembly program dili ile alt program oluşturuldu.
İstenen nem değeri ile YSA’nın çıkışı arasındaki hata
DAQ (veri toplama kartı) yardımı ile İnvertöre bilgi
olarak gönderildi ve motorun hızı bu değere göre
ayarlandı. Değişik nem değerleri ve ortam koşulları ile
sonuçlar alınarak kayıt edildi.
4.Bulgular ve Tartışma
%100 dış hava çalışılırken, değişik set değerleri
için elde edilen grafik şekil 8’ de gösterilmiştir. Bu
uygulamadaki hata grafiği ise şekil 9’ de gösterilmiştir.
Görüldüğü gibi sistem %57 den %70 nem değerine 2
dakikada ulaşılmıştır. Motorun devir sayısı, nemin set
değerine %1 kadar yaklaştıktan sonra yavaşlamaya
başlamaktadır. İstenen nem değerini %0,6 geçince
motor durmaktadır. Sistemin nem değeri %69,6-70,3
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
977
arası bir salınım ile devam etmektedir. Buradaki hata
%0,7 civarındadır. İstenen nem değiştirilince sistem
kendisini bu değere yaklaşmaya zorlamaktadır. %65
istenen değere 2 dakikada gelebilmiştir. Sistemin nem
değeri %64,9-65,9 arası bir salınım ile devam
etmektedir. Buradaki hata %1 civarındadır. Tekrar hedef
değiştirilmiş ve %75 nem olması istenmiştir. Yaklaşık 4
dakika sonra hedefe ulaşılmıştır. Sistemin nem değeri
%74.4-74.9 arası bir salınım ile devam etmektedir.
Buradaki hata %0,6 civarındadır.
Şekil 8: Sistemin %100 dış hava ile değişik set değerlerinde
elde edilen grafiği
Şekil 9:Sistemin %100 dış hava ile değişik set değerlerinde
elde edilen hata grafiği
Sistemin hatasının %1,8 olduğu görülmektedir.
7 inci dakikada sisteme bozucu etki olarak pencere
açılmıştır. Bunun sonucu olarak nem düşme eğilimi
göstermiş ve hata biraz daha az olarak devam etmiş.
Fakat YSA nın etkisi ile tekrar yükseltilerek %70-71.8
civarında tutulmuştur. 11 inci dakikada pencere tekrar
kapatılmıştır. Bunun sonucu olarak nem artma eğilimi
göstermiş ve hata %2 ye yükselmiş Fakat YSA nın
etkisi ile biraz düşürülerek %70-71,8 civarında
tutulmuştur.
Sistemin %100 dış hava ile bozucu etkiler
uygulandığındaki grafiği şekil 10 da ve Sistemin %100
dış hava ile bozucu etkiler uygulandığındaki hata grafiği
şekil 11 de verilmiştir.
Şekil 10: Sistemin %100 dış hava ile bozucu etkiler
uygulandığındaki grafiği
Şekil 11: Sistemin %100 dış hava ile bozucu etkiler
uygulandığındaki hata grafiği
Sisteme bozucu etki olarak bu kez ısıtıcı (75
W) uygulanmıştır. 13 üncü dakikada ısıtıcı açılmıştır.
Isıtıcının tam olarak ısınması 1 dakika kadar sürmüştür.
11 inci dakikada ısıtıcının etkisi ile nem düşme eğilimi
göstermiştir. Ama sistemin nemi istenen değerin
üzerinde gittiği için YSA bunu yükseltmemiştir. Hata
biraz daha az olarak %1,5 devam etmiştir. 17 inci
dakikada ısıtıcı kapatılmıştır. Isıtıcının soğuması
yaklaşık 1 dakika almıştır. Bunun etkisi sistemin nemi
yüksek olduğu için tam olarak görülememiştir.
İç hava çalışmada nemin artışı dış havanınkine
oranla hızlı olduğu için %70 in altındaki nem
değerlerine tam olarak yaklaşamamaktadır, %2 gibi bir
hata olmaktadır. Ama istenen nem değerleri %70 in
üzerine çıkarsa, be değerlere yaklaşma daha iyi
olmaktadır, hata %2 nin altına inmektedir.
Bozucu etki uygulamaları, sistemi ani olarak
etkilemediği için, sistemin nem eğrisinde fazla bir
sapma oluşturmamaktadır.
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12
Zaman (dak)
Ha
ta (
%)
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
978
Şekil 12 de Sistemin %100 iç hava ile değişik
set değerlerinde elde edilen grafiği, Şekil 13 de
Sistemin %100 iç hava ile değişik set değerlerinde elde
edilen hata grafiği ve şekil 14 Sistemin %100 iç hava ile
bozucu etkiler uygulandığındaki grafiği görülmektedir.
Şekil 12: Sistemin %100 iç hava ile değişik set değerlerinde
elde edilen grafiği
Şekil 13: Sistemin %100 iç hava ile değişik set değerlerinde
elde edilen hata grafiği
Şekil 14: Sistemin %100 iç hava ile bozucu etkiler
uygulandığındaki grafiği
Şekil 15 de Sistemin %100 dış hava ile değişik
set değerlerindeki görüntüsü, Şekil 16 da Sistemin dış
hava ile bozucu etki uygulandığı zamanki görüntüsü ve
Şekil 17 de Sistemin %100 iç hava ile değişik set
değerlerindeki görüntüsü görülmektedir.
Şekil 15: Sistemin %100 dış hava ile değişik set
değerlerindeki görüntüsü.
Şekil 16: Sistemin dış hava ile bozucu etki uygulandığı
zamanki görüntüsü.
Şekil 17: Sistemin %100 iç hava ile değişik set değerlerindeki
görüntüsü.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
979
6.Sonuç
Yapay Sinir Ağları ile Tekstil fabrikalarının
nem kontrolü başarı ile yapılabilmektedir. Fabrika
modeli üzerinde yapılan çalışmalarda istenilen nem
değerlerine sistemin elverdiği en kısa zamanda
ulaşılmaktadır. Ortamın nemi %56 iken istenilen nem
değeri %70 olarak seçildiği zaman, 125 saniye gibi kısa
bir zamanda kontrol edilen bölgenin nem oranı istenilen
değere ulaşmaktadır. Nem oranındaki değişme %0.5
sınırının altında kalmaktadır.
Çalışma esnasında istenilen nem değeri
değiştirilebilmektedir. İstenilen nem değerinin %65
olarak değiştirilmesi halinde sistem bu bilgiyi
değerlendirerek 110 saniye içerisinde nem oranını yeni
set değerine indirmektedir. Çalışma esnasında dış
ortamdaki sıcaklık değişiklikleri veya nemlendirme
odasındaki iç sıcaklığın değişimi istenilen nem değerini
etkilememektedir. Yapılan deneyler esnasında iç
sıcaklığı değiştirmek için, ısıtıcı kullanılmıştır. Nem
oranı %70 olarak kararlı hale geldikten sonra 75 W’lık
bir ısıtıcı çalıştırıldığı takdirde ortamın ısınmasıyla
birlikte nem değeri düşmeye eğilim göstermektedir.
Yapay Sinir Ağın etkisiyle nem tekrar kararlı hale
gelmektedir. Bozucu etki olarak pencere açık bırakılmış
ve yine başarı ile nemin sabit kaldığı gözlenmiştir.
Pompanın çalışması on/off olmadığı için ihtiyaç miktarı
kadar çalışmaktadır. Böylece hem enerji tasarrufu
olmakta hem de daha az hatalı sonuç elde edilmektedir.
Yapılan deneysel çalışmalarda kararlı bölge
için hatanın %0,5’in altında olduğu gözlenmiştir. Yapay
sinir ağını oluşturan PC bilgisayar yardımıyla nem
değerleri sürekli kaydedilebildiğinden geçmişe yönelik
istatistiksel bilgiler alınabilir. Farklı zamanlar için farklı
nem oranları önceden programlanabilir. Üretimin
değişik adımlarında farklı nem oranları uygulanabilir.
Yukarıda yapılan deneysel çalışmalar iç hava
içinde denenmiş ve başarılı sonuçlar alınmıştır. %57
nem oranı ile çalışmaya başlayan sistemde %70 nem
oranı istenmiş olup, yapılan %100 iç hava
çalışmalarında 80 saniye gibi kısa bir sürede istenilen
değere ulaştığı görülmüştür. Dolayısıyla iç hava
deneylerinde istenilen nem oranına daha çabuk
ulaşıldığı tespit edilmiştir. İç hava deneylerinde sistem
hızlı tepki verdiği için, karalı hale, dış hava ile
çalışmalara göre daha yavaş geldiği gözlenmiştir.
Yapılan deneysel çalışmalarda kullanılan
maketin nemlendirme odasının boyutları 60x60x110
cm’dir. Sistemin kullanılabilirliği hakkında fikir
vermesine rağmen, hacim olarak küçük olduğu için hızlı
tepki vermekte ve kontrolü güçleştirmektedir. Buna
rağmen birçok çalışma bölgesinde %0,5’lik nem
hatasıyla başarılı sonuçlar alınmıştır.
Sistemin maliyeti, diğer kontrol sistemlerine
göre yüksek görünmesine rağmen, bir tekstil
fabrikasındaki verimi artırıcı rolünden dolayı
ekonomiktir. Ayrıca bir Yapay Sinir Ağı ile birden fazla
bölge kontrol edilebilir. Fabrika otomasyonu ile entegre
çalışabilir.
7.Kaynakça
[1] Y. İzgi, “Eğitim Amaçlı Bir İklimlendirme Odasının
Yapay Zeka Teknikleri İle Modellenmesi ve Kontrolü”
Marmara Üniversitesi, Fen Bilimleri Enstitüsü Doktora
Tezi, 2007, İstanbul.
[2] O. Doğmuş, A. Onat, Ş. Yılmaz, Ş. Ergün, “Tekstil
Fabrikalarındaki Bağıl Nemin Yapay Sinir Ağları
Yöntemi ile Kontrolü”, KSÜ Fen ve Mühendislik Dergisi
8(1)-2005
[3] M. Z. Yılmazoğlu, “Bir Tekstil Fabrikasında Güneş
Destekli Çift Etkili Bir Absorpsiyonlu Soğutma Sisteminin
Uygulamasının Teknik ve Ekonomik Analizi”, Gazi
Üniversitesi, Fen Bilimleri Enstitüsü, Yüksek Lisans
Tezi, 2006, Ankara.
[4] http://www.detaymekanik.com/vrv-sistemleri.html
[5] G. Mustafaraja, G. Lowryb, J. Chena, “ Prediction of
room temperature and relative humidity by
autoregressive linear and nonlinear neural network
models for an open Office”, School of Engineering and
Design, Brunel University, UK, Engineering, Science and
the Built Environment, London South Bank University,
UK.
[6] Ning Li, Liang Xia, Xiangguo Xu, Ming-Yin Chan,
“Deng Shiming Dynamic modeling and control of a
direct expansion air conditioning system using artificial
neural network”, Department of Building Services
Engineering, The Hong Kong Polytechnic University,
Hong Kong SAR, 2012, China.
[7] F. Tekinşen, “Farklı Nem İçeriklerine Sahip
Pamuklarda, Çırçırlamanın, Kısa Lif Oranı, Tohum
Kabuğu Parçacığı, Nep ve Mote Sayısı Üzerine Etkisi”,
Yüksek Lisans Tezi, Kahramanmaraş Sütçü İmam
Üniversitesi, Fen Bilimleri Enstitüsü,2005,
Kahramanmaraş.
[8] M. Sinecen, “Klima Sistem Kontrolünün Bulanık mantık
İle Modellenmesi”, Yüksek Lisans Tezi, Pamukkale
Üniversitesi, Fen Bilimleri Enstitüsü,2002, Denizli
[9] E. Kaçmaz, “ PIC Mikro denetleyici Kullanarak Ağ
Bağlantılı Gömülü Sistem Tasarımı İklimlendirme Cihaz
Kontrol Ünitesi Uygulaması”, Yüksek Lisans Tezi,
Anadolu Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar
Mühendisliği Anabilim Dalı, 2007, Eskişehir.
[10] E. Yıldız, “PLC İle Isıtma Havalandırma Ve Soğutma
Sistemlerinin Optimum Denetlenmesi”, Fırat
Üniversitesi, Yüksek Lisans Tezi, Fen Bilimleri
Enstitüsü, 2006, Elazığ.
[11] U. Akyol, “İplik Bobininin Kurutulmasının Teorik
İncelenmesi”, Trakya Üniversitesi, Doktora Tezi, Fen
Bilimleri Enstitüsü, 2007, Edirne.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
980
Fotovoltaik Paneller için Radyal Tabanlı Yapay Sinir Ağları
Kullanan Etkin Bir Modelleme Yöntemi Önerisi
Hasan Rıza ÖZÇALIK1, Osman DOĞMUŞ
2, Şaban YILMAZ
2, Ahmet GANİ
1
1Elektrik-Elektronik Mühendisliği Bölümü
Kahramanmaraş Sütçü İmam Üniversitesi, Avşar Yerleşkesi, Kahramanmaraş [email protected]
[email protected] 2Kahramanmaraş Meslek Yüksekokulu
Kahramanmaraş Sütçü İmam Üniversitesi, Karacasu Yerleşkesi, Kahramanmaraş [email protected]
Özetçe
Fotovoltaik Sistemlerinin veriminin artması,
maliyetinin düşmesi ve çevreci olmaları nedeniyle
kullanımı gün geçtikçe artmaktadır. Fotovoltaik
sistemlerin optimum tarzda tasarlanabilmesi için güneş
pillerinin modellenmesi gerekmektedir. Güneş pillerinin
modellenmesinde diyot içeren eşdeğer devrelerin
kullanılması oldukça yaygın bir yöntemdir. Bu
çalışmada ise, fotovoltaik panellerin Radyal Tabanlı
Yapay Sinir Ağları (RBF) yardımıyla etkin bir tarzda
modellenmesini sağlayan bir yöntem önerilmektedir.
Kullanılan kesin uyarlamalı RBF yapısı gelişmiş bir eğri
uydurma aracı olarak çalışmaktadır. Modelleme, esas
olarak panelin üretici tarafından verilen gerçek akım-
gerilim karakteristiğinin öğrenilmesi tarzında
gelişmektedir. Modelleme işlemi panelle ilgili tüm
karakteristiklere uygulanabilir. Bu çalışmada Sharp
marka NT-S5E1U model güneş pili modellenmiştir.
1. Giriş
Bilindiği gibi enerji, hayat kalitesini iyileştiren,
ekonomik ve sosyal ilerlemeyi sağlayan en önemli
faktördür. Ancak, artan enerji fiyatları, küresel ısınma
ve iklim değişikliği, dünya enerji talebindeki artış, hızla
tükenmekte olan fosil yakıtlara bağımlılığın yakın
gelecekte devam edecek olması gerçeği, yeni enerji
teknolojileri alanındaki gelişmeler gibi faktörler ülkeleri
yeni arayışlara götürmektedir. Dünyanın enerji geleceği
ile ilgili raporlara bakıldığında; 2000-2100 yılları
arasında enerji ihtiyaçları ve kaynaklarındaki dağılıma
ait bilimsel ön görüler 2100 yılında petrolün iyice
azalacağı, kömürün nerdeyse hiç kalmayacağı, güneş
enerjisi kullanımının ise çok artacağı sonucuna
götürmektedir [1] .
Güneş pillerinin yaklaşık 60 yıllık gelişiminde,
özel ve kamu destekli araştırma ve geliştirme
çalışmaları esas olmuştur. Güneş pili hareketli parçaya
sahip olmamaları, sorunsuz olarak az bakımla 25- 30 yıl
kullanılabilmeleri ve çalışma süreleri boyunca doğaya
hiç bir kirletici atık bırakmamalarıdır. Bu nedenle güneş
pilleri ile ilgili birçok çalışma yapılmaktadır [2].
Fotovoltaik sistemler, güneş pilleri, bağlantı
elemanları, koruma elemanları, depolama elemanları ve
beslediği yükün karakteristiğine bağlı olarak bazı ilave
elemanlar içeren bir yapıya sahiptirler. Bu sistemlerin
en önemli elemanı olan güneş pilleri, ilk yatırım
maliyeti ve kullanılacak diğer elemanların nitelik ve
miktarlarını da belirleyici özelliğe sahiptir. Bu nedenle
ilk kurulum aşamasında güneş pillerinin en iyi şartlarda
ve en yüksek verimle çalışabilecekleri bir sistem
tasarlamak çok önemlidir [3].
Şekil 1’de radyal tabanlı yapay sinir ağının
temel mimarisi örneği görülmektedir.
Şekil 1: Radyal Tabanlı Yapay Sinir Ağının Temel
Mimarisi [4]
Radyal tabanlı fonksiyon ağlarının eğri
uydurma ve lineer olmayan problemleri sınıflandırma
başarısından dolayı son yıllarda popülerliği gittikçe
artmıştır. Böylece RBF ağları ile ilgili yapılan yazılım
çalışmaları bu tip ağlarla ilgili bilimsel gelişmelerle
paralellik arz etmektedir. Gauss fonksiyonu RBF
ağlarının gizli katmanında en yaygın olarak kullanılan
Gizli
Katmanı
Giriş Katmanı
Çıktı Katmanı
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
981
radyal tabanlı aktivasyon fonksiyonudur. Literatürde
çeşitli alanlarda kullanılmak üzere tasarlanmış
birbirinden farklı Gauss fonksiyon üreteci devreleri
mevcuttur. Matematiksel fonksiyonların Taylor serisine
açılımından faydalanılarak elde edilen Gauss eğrisi
devreleri de literatürde yer almaktadır [5].
Denetimli bir sinir ağı dizaynı için çok çeşitli
yollar izlenebilir. Çok katmanlı algılayıcı(denetimli
olarak) dizaynı için geri yayılım algoritması istatistikte
“stokastik yaklaşım” olarak bilinen bir optimizasyon
metodu uygulaması olarak değerlendirilebilir. Bir sinir
ağı dizaynı çok boyutlu uzayda “eğri-uydurma
problemi” olarak değerlendirildiğinde öğrenme, çok
boyutlu uzayda taşınan dataya en iyi uyumu sağlayan
bir yüzey bulma olgusu ile eşdeğerdir. Radyal temelli
fonksiyonlar (RBF) ilk defa çok değişkenli gerçek bir
interpolasyon probleminin çözümünde tanıtılmıştır [6].
2. Radyal Tabanlı Yapay Sinir Ağları
Radyal Tabanlı Yapay Sinir Ağları (RTYSA),
biyolojik sinir hücrelerinde görülen etki tepki
davranışlarından esinlenilerek 1988 yılında geliştirilmiş
ve filtreleme problemine uygulanarak YSA tarihine
girmiştir[7]. RTYSA modellerinin eğitimini çok boyutlu
uzayda eğri uydurma yaklaşımı olarak görmek
mümkündür[3,8]. Bu nedenle RTYSA modelinin eğitim
performansı, çıktı vektör uzayındaki verilere en uygun
yüzeyi bulma ve dolayısıyla bir interpolasyon
problemine dönüşmektedir.
Şekil 2:Radyal Tabanlı Yapay Sinir Ağlarının Yapısı
RTYSA modelleri genel YSA mimarisine
benzer şekilde giriş katmanı, gizli katman ve çıktı
katmanı olmak üzere üç katman halinde
tanımlanmaktadır (Şekil 2). Ancak, klasik YSA
yapılarından farklı olarak RTYSA’ larda, girdi
katmanından gizli katmanına geçişte radyal tabanlı
aktivasyon fonksiyonları ve doğrusal olmayan bir
kümeleme (cluster) analizi kullanılmaktadır. Gizli
katman ile çıktı katmanı arasındaki yapı ise ağırlıkların
atandığı ve hesaplanması için ilgili öğrenme
algoritmalarının kullanıldığı kısımdır [9].
Radyal temelli fonksiyonlar, sayısal analizde
çok değişkenli problemlerin çözümünde kullanılmış ve
YSA’ nın gelişmesi ile birlikte bu fonksiyonlardan YSA
tasarımında yararlanılmıştır. RBF, ileri beslemeli YSA
yapılarına benzer şekilde giriş, saklı ve çıkış
katmanından oluşur ancak, giriş katmanından saklı
katmana dönüşüm, radyal tabanlı aktivasyon
fonksiyonları ile doğrusal olmayan sabit bir
dönüşümdür. Saklı katmandan çıkış katmanına ise
doğrusal bir dönüşüm gerçekleştirilir. RBF de
uyarlanabilecek serbest parametreler; merkez vektörleri,
radyal fonksiyonların genişliği ve çıkış katman
ağırlıklarıdır. Burada verilen öğrenme yöntemi, sadece
ağırlıkların iteratif olmayan doğrudan matrisel çözüme
dayanan (off-line) bir yöntemle elde edilmesi esasına
dayanmaktadır. Bu yüzden bu ağ yapısına Kesin
Uyarlamalı Radyal Tabanlı Yapay Sinir Ağı olarak
bakılmaktadır. Bu tip ağ yapısı, statik karakterli grafik
ve desenlerin tanınması işleminde oldukça başarılıdır.
Öğrenmede kullanılan temel bağıntı,
( ) ∑
( ) ( )
Şeklinde yazılabilir[10]. Burada, wko bias giriş için
ağırlık katsayısıdır. Tüm p durumları için ( )
alınırsa (1) bağıntısı,
( ) ∑
( ) ( )
( ) ∑
(‖ ‖
) ( )
Şeklinde düzenlenebilir. Burada, k=1,2,..,K; çıkış
katmanı hücre sayısı; N gizli katmanda bulunan hücre
sayısı; M merkez sayısı (M=N); ağın girdi
vektörünü; ( ) radyal tabanlı aktivasyon
fonksiyonunu, giriş vektör uzayının bir alt
setinden seçilen radyal tabanlı merkezleri, ‖ ‖ girdi
vektörünün merkezden ne kadar uzak olduğunun bir
ölçütü olan Öklidyen normunu, çıkış katmanındaki
ağırlıkları göstermektedir. RTYSA modellerinde önem
arz eden elemanlar; hücre merkezleri, dikkatli bir
çalışma ile belirlenen varyans, çıktı katmanındaki
ağırlıklar ve kullanılan aktivasyon fonksiyonunun
yapısıdır.
RTYSA modellerinde aktivasyon fonksiyonu
olarak birçok fonksiyon tipi kullanılabilmektedir.
Doğrusal, kübik, Gauss, multi-kuadratik, ters multi-
kuadratik fonksiyonlar bunlardan bazıları olup bu
çalışmada Gauss fonksiyonu tercih edilmiştir. Gauss
fonksiyonunun matematiksel yapısı 4 nolu bağıntıda
gösterilmektedir [11].
Giriş
Katmanı
Gizli
Katmanı
Çıktı
Katmanı
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
982
( ) ∑ ( )
( )
Burada, i=1,2,..I giriş sayısı, xpi giriş vektörünü, cim
merkezleri, standart sapma değerini simgelemekte
olup YSA terminolojisinde RTYSA modelinin
performansını önemli ölçüde etkileyen dağılma (spread)
parametresi olarak rol oynamaktadır [8]. RTYSA
modellerinin eğitimi, hücre merkezlerinin bulunması ve
çıktı katmanındaki ağırlıkların optimize edilmesi olmak
üzere iki aşamada gerçekleşmektedir. Literatürde hücre
merkezlerini ve çıkış ağırlıklarını bulabilmek için farklı
yöntemler kullanılmaktadır. Hücre merkezlerini
bulabilmek için en sık kullanılan yöntem K ortalamalar
(K-means) ve Kohonen kümeleme yöntemleridir. Çıkış
ağırlıklarını bulmakta kullanılan yöntemler ise En
Küçük Ortalamalı Kareler (LMS) ve Moore-Penrose
Sözde Ters (Pseudo-inverse) yöntemleridir. Dağılma
parametresi ise genellikle bütün hücreler için sabit
alınmaktadır. RTYSA modellerinde dağılma
parametresi için yaklaşık denklikler olmakla birlikte, bu
parametre deneme-yanılma yöntemiyle de
belirlenebilmektedir [11].
3. Modellenen Güneş Pili
Sharp marka NT-S5E1U model güneş pilinin
etiket değerleri; Güç=185,0 W., Vmp=36,2 V., Imp=5,11
A., Voc=44,9 V., Isc=5,75 A., W=17,0 kg.,
1700x970x13(mm), mono-Si ‘dir. Şekil 3’ de Sharp
marka NT-S5E1U kodlu güneş pilinin kataloğunda
verilen farklı ışınım değerleri için elde edilmiş gerçek
akım-gerilim ve güç-gerilim karakteristikleri
görülmektedir.
Şekil 3: Modellenen Güneş Pilinin Karakteristikleri[12]
4. RBF ile Fotovoltaik Panelin Modellenmesi
Belirtilen fotovoltaik panelin modellenmesinde
kullanılan Radyal Tabanlı Yapay Sinir Ağının yapısı
esas olarak aşağıda gösterildiği gibidir.
Şekil 4:Kullanılan RBF Ağı
i : Giriş (X) sayısı (I = 1) [13-17]
m: merkez sayısı (M = 12)
K: Çıkış (Y) sayısı (K = 1)
Nöron sayısı=merkez sayısı
p: Pattern (X’lerin farklı değerleri) sayısı (p=20)
( ) ∑
( ) ( )
( )
( ) ∑
( ) ( )
( ) ∑ ( )
( )
{ } .
Bias giriş için alındı [17-22].
[
]
[
]
W’yi bulabilmek için G’nin tersi alınması
gerekir. G kare matris olmadığı için tersi normal yoldan
alınamaz. ( ) işlemi ile W ağırlık
matrisi bulunur. Merkez değerleri, şekil 3 deki
modellenen güneş pilinin 1000 W/m2, 25 °C çalışma
koşulları için katalog değerlerine ve eğrinin eğimine
göre seçilmiştir [23-30].
Ak
ım
[A]
Gerilim [V]
Gü
ç [
W]
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
983
C=[ 5 15 25 28 32 35 40 42 43 44 45 45,9]
Gauss fonksiyonu genişlik değerleri,
=[5 5 5 5 5 5 5 5 5 5 5] olarak seçildi.
Tablo 1: Ağı öğretmek için kullanılan x(gerilim), y (akım) ve
öğretim sonucu elde edilmiş ağırlık (W) vektörü değerleri
Şekil 5: RBF ile modellenen akım-gerilim karakteristiği
Tablo 1de Radyal Tabanlı Yapay Sinir Ağını
öğretmek için kullanılan x (Gerilim) ve y (Akım)
değerleri ve öğretim sonucu elde edilmiş W ağırlık
vektörü değerleri görülmektedir. Şekil 5 de RBF ile
modellenen fotovoltaik güneş pilinin akım-gerilim
karakteristiğinin model sonucuna göre çizimi
görülmektedir. Şekil 6 da gerçek akım-gerimim
karakteristiğinin değerleri ile RBF ile modellenen
fotovoltaik güneş pilinin akım-gerilim karakteristiğinin
değerlerinin farkının alınmasıyla elde edilen hata
değerlerinin yüzde değişimi görülmektedir. Buna göre
gerçek değerlerden sapmanın +%0,441 ile -%0,358
arasında olduğu görülmektedir. Karakteristiğinin
düzgün olduğu ilk bölümde fark en yüksek -%0,104
olmuştur. Şekil 7 de fotovoltaik panelin gerçek akım
değerleri ile RBF esaslı modelden elde edilen akım
değerlerinin farkları olan hatanın değişim grafiği
görülmektedir. En büyük hata değeri kıvrılma
bölgesinde 0,023 amper olarak ortaya çıkmıştır.
Şekil 6: Hatanın yüzde değişimi
6.Sonuç
Şekil 7: Hatanın Değişimi
5. Sonuç
Bu çalışmada, Radyal Tabanlı Yapay Sinir Ağı
ile Sharp Marka NT-S5E1U model güneş paneli
[1000 W/m2, 25 °C] değerleri ile verilen ortam
şartlarında modellenmiş ve panelin akım-gerilim
karakteristiğini sağlayan ağırlık matrisi elde edilmiştir.
Bu ağırlık değerleri dikkate alınarak ve öğrenmede
kullanılan verilerden çok daha fazla test değerleri
kullanılarak karakteristik yeniden çizdirilmiştir.
Gerilim [V]
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
984
Simülasyon çalışmaları sonunda Radyal Tabanlı Yapay
Sinir Ağı ile oluşturulan modelin çok başarılı olduğu
görülmüştür. Gerçek karakteristik ile modelin sağladığı
karakteristik karşılaştırıldığında yüzde olarak
maksimum hatanın 0,3-0,4 civarında olduğu
görülmüştür. Bu sonuçlar oldukça küçük hata
değerlerini ifade etmektedir. Bu durumda, fotovoltaik
panellerin modellenmesi için önerilen Kesin Uyarlamalı
Radyal Tabanlı Yapay Sinir Ağları temelli algoritmanın
oldukça yeterli olduğu söylenebilir.
6. Kaynakça
[1] M. Çetin, N. Eğrican, “Güneş Enerjisi: Ekonomiye ve İstihdama Katkısı”, Solar Future, 2010,İstanbul
[2] S. Rustemli, F. Dinçadam, M. Demirtaş, “Güneş Pilleri
İle Sıcak Su Elde Etme ve Sokak Aydınlatması”, V.
Yenilenebilir Enerji Kaynakları Sempozyum, 2009,
Diyarbakır
[3] N. Onat, S. Ersöz, “Fotovoltaik sistemlerde maksimum
güç noktası izleyici algoritmalarının karşılaştırılması”, V.
Yenilenebilir Enerji Kaynakları Sempozyum, 2009, Diyarbakır
[4] http://origin-ars.els-cdn.com/content/image/1-s2.0-
S0957417409008264-gr3.jpg
[5] Z. Koca, “Üç Fazlı Asenkron Motorların Yapay Sinir
Ağları İle Vektör Esaslı Hız Kontrolü”, Kahramanmaraş
Sütçü İmam Üniversitesi, Fen Bilimleri Enstitüsü,
Elektrik-Elektronik Mühendisliği Anabilim Dalı, Yüksek
Lisans Tezi, Kahramanmaraş
[6] G. Yazıcı, “Genetik algoritmalar ile radyal temelli
Fonksiyon ağlarının optimizasyonu”, Yıldız Teknik
Üniversitesi, Fen Bilimleri Enstitüsü, Elektrik-Elektronik
Mühendisliği Anabilim Dalı, Yüksek Lisans Tezi, İstanbul
[7] Broomhead, D., Lowe, D., Multivariable Functional
Interpolation and Adaptive Networks, Complex Systems, 2, 6, 568-576, 1988.
[8] Ham, F., Kostanic, I., Principles of Neurocomputing for Science and Engineering. Macgraw-Hill. USA, 2001
[9] U. Okkan, H.Y. Dalkılıç, “Radyal Tabanlı Yapay Sinir
Ağları ile Kemer Barajı Aylık Akımlarının
Modellenmesi”, İMO Teknik Dergi, 2012 5957-5966, Yazı 379
[10] C. Şenol, T. Yıldırım, “ Standart Ve Hibrid Yapılar
Kullanarak Yapay Sinir Ağları İle İmza Tanıma”, Kadir
Has Üniversitesi, Elektronik Mühendisliği Bölümü, 34230, Cibali, Fatih-İstanbul
[11] Ham, F., Kostanic, I., Principles of Neurocomputing for
Science and Engineering, Macgraw-Hill. USA, 2001.
[12] http://www.solarpanelstore.com/pdf/sharp-185.pdf
[13] R. Neruda, P. Kudov, “Learning methods for radial basis
function networks”, Institute of Computer Science,
Academy of Sciences of the Czech Republic, P.O. Box 5,
18207 Prague, Czech Republic, Available online 28 July
2004
[14] F. P. Harter , H. Fraga , C. Velho, “New approach to
applying neural network in nonlinear dynamic
model”,Instituto Nacional de Pesquisas Espaciais,
Laborato´ rio Associado de Computac¸a˜o e Matema´ tica Aplicada, Sa˜o Jose´ dos Campos, SP, Brazil
[15] D. S. Yeung , P.P.K. Chan, W. W.Y. Ng, “Radial Basis Function network learning using localized generalization
[16] error bound”, a School of Computer Science and
Engineering, South China University of Technology, Guangzhou 510006, China
[17] T. Andoa, S. Konishib, S. Imotoc, “Nonlinear regression
modeling via regularized radial basis function networks”,
Graduate School of Business Administration, Keio
University, 2-1-1 Hiyoshi-Honcho, Kohoku-ku, Yokohama 223-8523, Japan
[18] X.-Juan Wu , X.-Jian Zhu, G.-Yi Cao, H.-Yong Tu, “F
Modeling a SOFC stack based on GA-RBF neural
networks identification”, Institute of Fuel Cell, Shanghai Jiao Tong University, Shanghai 200030, China
[19] F. Schwenker, H. A. Kestler, G. Palm, “Three learning
phases for radial-basis-function networks” , Department
of Neural Information Processing, University of Ulm, D-
89069 Ulm, Germany
[20] F. F.Navarro, C. H. Martínez, P.A. Gutiérrez , M. C.Ruz,
“Evolutionary q-Gaussian radial basis function neural
networks for multiclassification”, Department of
Computer Science and Numerical Analysis, University of
Córdoba, Campus de Rabanales, Albert Einstein Building, 3rd floor, 14074 - Córdoba, Spain
[21] İ. H. Altaş, “Foto voltaj Güneş Pilleri: Eşdeğer Devre
Modelleri ve Günışığı ile Sıcaklığın Etkileri”, Karadeniz Teknik Üniversitesi,1998
[22] D. Wangn, X.-JunZeng,J. Keane,” A clustering algorithm
for radial basis function neural network initialization”,
School of Computer Science, University of Manchester, Manchester M601QD,UK
[23] R. V. Babu, S. Suresh , A. Makur , “Online adaptive
radial basis function networks for robust object tracking”, Exawind, Bangalore, India
[24] S. Kitayama · J. Srirat · M. Arakawa ·K. Yamazaki,
“Sequential approximate multi-objective optimization
using radial basis function network”,Springer-Verlag
Berlin Heidelberg 2013
[25] F. F. Navarro. H.-Martı´nez, P. A. Gutierrez,“
Generalised Gaussian radial basis function neural networks ”,Springer-Verlag Berlin Heidelberg 2013
[26] I.C.Yeh, C.C. Chen ,X. Zhang , C. Wu, K-C.Huang,
Adaptive radial basis function networks with kernel shape Parameters”, Springer-Verlag London, 2010
[27] H. Nishikawa, S. Ozawa, “Radial Basis Function
Network for Multitask Pattern Recognition” Springer
Science Business Media, LLC. 2011
[28] H. Khosravi, “A Novel Structure for Radial Basis
Function Networks—WRBF”, Springer Science Business
Media, LLC. 2011
[29] A. Brandstetter, A. Artusi, “Radial Basis Function
Networks GPU-Based Implementation”, IEEE
Transactions on Neural Networks, Vol. 19, NO. 12, December, 2008
[30] B. Doğan, M. Korürek,”EKG Vurularını Sınıflamada
Radyal Tabanlı Fonksiyon Yapay Sinir Ağının
Performans Degerlendirmesi, İstanbul Teknik Üniversitesi, Elektrik – Elektronik Fakültesi
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
985
Bilyeli Rulmanlarda Zaman Uzayında İstatistiksel Öznitelik
Çıkarımı ve Yapay Sinir Ağları Metodu ile Hata Boyutunun
Kestirimi
Samet Bayram, Kaplan Kaplan, Melih Kuncan, H.Metin Ertunç
Mekatronik Mühendisliği Bölümü
Kocaeli Üniversitesi, Umuttepe Yerleşkesi, İzmit, Kocaeli [email protected]
Özetçe
Dönel makinelerde yataklama elemanı olarak kullanılan
rulmanlarda meydana gelen arızalar, sistemin çalışmasını
aksatan veya durduran nedenlerdendir. Bu çalışmada, bir mil-
rulman sisteminde, belirli boyutlarda yapay hatalar
oluşturulmuş rulmanlardan titreşim sinyalleri elde edilmiştir.
Çalışmanın amacı, rulmanlarda meydana gelen arızaların
boyutunu, yapay sinir ağları modelini kullanarak teşhis
etmektir. Elde edilen titreşim verilerinin gerçek zamanda
özellikleri çıkarılarak belirli ağırlıklarla çarpılmış, oluşturulan
yapay sinir ağı modeline giriş olarak verilmiştir. Farklı arıza
boyutlarına sahip rulmanların gerçek zamanda istatistiki
özellikleri de farklı olmaktadır. Bu özellikler kullanılarak
geliştirilen yapay sinir ağı ile rulmanlarda meydana gelen
arızaların büyüklüğü, %100 bir başarı ile sınıflandırılırken,
gerçek hata değerinin ise, ortalama %2 hata ile kestirildiği gözlemlenmiştir.
1. Giriş
Günümüz endüstrisinde, dönel makine elemanlarına birçok
makinede sıklıkla karşılaşılmaktadır. Rulmanlar, farklı
mekanizmaların dönen millerine yataklık yapması için
kullanılan elemanlardır. Böylelikle sürtünme en aza
indirgenerek makinenin çalışması daha düzgün bir seviyeye
getirilmektedir. Rulmanlar, makinelerde tahrik elemanı olarak
kullanılan motor millerinde veya bunun dışında başka kritik
bölgelerde yataklama elemanı olarak görev yapmaktadır. Bu
elemanlarda meydana gelebilecek arızaların sisteme olumsuz
etkisi kaçınılmazdır. Sistemin rulmana göre çok fazla maliyetli
oluşu, otomasyon sisteminin dolayısıyla üretimin
durdurulması, bakım onarım masrafları gibi durumların
yanında rulmanlarda meydana gelen arızalar üretim kalitesini
de etkilemekte ve rulmanlarda arıza teşhisini zorunlu kılmaktadır [1].
Çalışan her makine titreşim meydana getirir.
Makinelerde çalışan parçalar arasındaki boşluğun artması,
parçalardaki sürtünmelerden kaynaklanan aşınmalar, çatlak
oluşması ve benzeri nedenler titreşime neden olurlar. Bunlara
sebep olan en önemli faktör ise makineye etki eden iç ve dış
kuvvetlerdir. Bu yüzden makineler tasarlanırken bu
kuvvetlerin mümkün olduğu kadar küçük olması istenir.
Düzgün bir şekilde üretilmiş bir makine bile çalışma esnasında
belli seviyede titreşim oluşturur. Bu durumun pratikte
önlenmesi çoğu zaman mümkün olmaz. Önemli olan bu
titreşim seviyesinin kabul edilebilir bir seviyede kalacak
şekilde kontrol altında tutulmasıdır. Uygun yöntemlerle
sistemden ve arızadan kaynaklanan titreşim bilgileri belirlenerek arıza teşhisi yapılabilir.
Literatür araştırıldığında, bu konu ile ilgili yapılmış birçok
çalışma görülmektedir. Zhang vd.[2] rulmandan alınan
mekanik titreşimleri dalgacık (wavelet analysis) yöntemi ve
olasılıksal sinir ağları (PNN) ile hatanın boyutunu tespit
ettikten sonra hatasız bir rulmandan aldıkları titreşim
verileriyle karşılaştırmışlardır. Mendel vd.[3] pompalardaki
rulmanlarda meydana gelebilecek hataları kurdukları sistemle
frekans analizi yöntemiyle bulmaya çalışmışlardır. Lacey [4]
titreşim verilerini zarf analizi yöntemini kullanarak işledikten
sonra frekans bölgelerindeki değişimleri gözlemlemiştir.
Yadav [5] rulmanlardaki hataları belirlemek için titreşim
verilerinin zaman uzayında analiz ettikten sonra bu sonuçları
yapay sinir ağları yöntemiyle analiz etmiş; rulmanlardaki hata
oranını yüzdeyle belirterek kategorize etmişlerdir. Rukhande
vd. [6] şok darbe izleme yöntemiyle rulmanlarda meydana
gelen hataların değişimini gözlemlemiştir. Shi vd. [7] dalgacık
enerji entropisi ve danışmansız öğrenme (SOM) yöntemleri ile
rulmanlarda arıza teşhisine yönelik analiz yapmışlardır. Zhang
vd. [8] ortak vektör yöntemiyle rulmanlarda meydana gelen
hataların meydana getirdiği titreşim verilerinin özniteliklerini
çıkararak, hatanın boyutunu ve oluştuğu frekansları
görüntülemiştir. Girondin vd. [9] helikopterlerde kullanılan
rulmanlarda meydana gelen hataları tespit etmek için frekans
analizi metodunu kullanmıştır.
Bu çalışmada ise, önceki çalışmalar [10,11] sonucu
tasarlanmış bir rulman test düzeneği üzerinde, lazerle yapay
olarak meydana getirilmiş ve değişik deney şartlarında testler
yapılmıştır. Farklı hata boyutlarına sahip rulmanlardan alınan
titreşim verileri, zaman uzayında öznitelik matrisi çıkarılarak
yapay sinir ağları yöntemiyle analiz edilmiş, rulmanlardaki
hata boyutu kestirilmeye çalışılmıştır.
2. Yapay Sinir Ağları
Yapay sinir ağları, biyolojik sinir sisteminin simülasyonu
olarak ortaya çıkmıştır. Bir bilgisayarın çalışma şekli beynin
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
986
çalışmasına benzetilerek yapay sinir ağları modeli
geliştirilmiştir. Yapay sinir ağları algoritmalarında öğrenme,
daha önce edinilen tecrübelere bağlıdır. Bir sistemin
özelliklerinin çıkarıldıktan sonra sistemin çözümüne dayalı bir
algoritma olmasa veya karmaşık bir çözüm algoritması olsa
dahi, yapay sinir ağları bu sisteme uygulanabilir. Yapay sinir
ağları nöronlardan oluşmaktadır. Bu nöronlar gerçek sinir
sistemindeki gibi bir birlerine çok karmaşık bir şekilde dahi
bağlanabilmektedirler. Her bir nöronun farklı ağırlıkta girişleri
ve bir tane çıkışı bulunmaktadır. Bu amaçla farklı ağırlıktaki girişlerin toplamı şu şekilde ifade edilir [12]:
1
P
i i
i
n w x b
(1)
Burada P giriş sayısı, w girişin ağırlığı, x giriş ve b biastır.
Ağırlıklandırılmış girişler ve her nöronun biasıyla beraber
toplamları, aktivasyon fonksiyonundan geçirilir ve bunun
sonucunda o nörona bağlı çıkış elde edilir. Aktivasyon fonksiyonunu "f" ile gösterirsek:
1
( ) ( )P
i i
i
f n f w x b
(2)
Şeklinde ifade edilir. Aktivasyon fonksiyonu sistemin yapısına
uygun olarak sigmoid fonksiyonu, eşik (treshold) fonksiyonu
veya hiperbolik tanjant fonksiyonu olabilir. Çıkış elde
edildikten sonra eğer sistem çok katmanlıysa, bir nöronun
çıkışı diğer bir nöronun girişi olabilir. Bu şekilde çok katmanlı bir yapay sinir ağı modeli oluşturulur [13].
Şekil 1: Sinir hücreleri ve katmanlar [1]
Yapay sinir ağları modeli genelde üç kısımdan oluşur:
giriş katmanı, saklı katman ve çıkış katmanı. Her katman çok
fazla nörondan oluşabilir. Bilgi giriş katmanından yapıldıktan
sonra aktivasyon fonksiyonlarından geçer. Giriş katmanın
çıkışları saklı katmanın girişleri olarak devam eder. Bu
aşamadan sonra sonuç katmanında son bir defa daha
aktivasyon fonksiyonları saklı katman çıkışlarını
değerlendirerek nihai çıkış elde edilir. Şekil 1'de giriş
katmanının girişleri xj, çıkışı hj ile gösterilmiştir. hj, aynı
zamanda saklı katmanın girişi olarak gösterilmiştir.
Yapay sinir ağlarında öğrenmenin ilk adımı aktivasyon
olarak nitelendirilebilir. Sinir hücresine giren sinyallerin
toplamı o hücreyi aktif hale getirebilecek bir değere sahip olup
olmamasına göre çıkış değeri değişmektedir. Eğer toplam
sinyal hücreyi ateşleyebilecek, eşik değerini atlatabilecek
kadar yüksek ise o hücre aktiftir, aksi durumda ise o hücre
pasiftir. Sinir hücresinin aktif veya pasif durumda olmasına
göre sınıflandırma yapıp yapamadığı sonucuna ulaşılmaktadır.
Örneğin, girdi örüntülerine 1 ya da 0 cevabini vererek
sınıflandırma yapabilen bir yapay sinir ağı hücresi, örüntüye 1
veya 0 değerini atayarak karar vermiş sayılmaktadır. “Karar
vermek” ve “sınıflandırmak”, öğrenme sürecinin temel yapı taşlarını oluşturmaktadır.[14]
3. Yöntem
3.1. Deney Düzeneği
Çalışmada kullanılan veriler, Şekil 2'de görülen bir AC servo motora bağlı rulman-mil düzeneğinden elde edilmiştir.
Şekil 2: Deney Düzeneği
Düzenekte veri toplamak için Matlab ile uyumlu National
Instruments 6211 veri toplama kartı(DAQ) kullanılmıştır.
Titreşimi, elektrik sinyallerine dönüştürmek için içerisinde
piezoelektrik malzeme bulunan titreşim sensörü (352C65)
tercih edilmiştir. Titreşim sensörü ile ilgili bilgiler Tablo 1’de
verilmiştir. Titreşim sinyallerini düzenleyip yükseltmek için
sensörle bağlantılı sinyal şartlandırıcılar da bulunmaktadır.
Tablo 1: Titreşim sensörünün özellikleri
Parametreler Değerler(SI)
Hassasiyet (±10 %) 10.2 mV/(m/s2)
Ölçüm aralığı ±491 m/s2 pk
Rezonans frekansı ≥35 KHz
Doğrusalsızlık ≤1%
Rulmanda hata boyutunu sınıflandırmak için belirli çaplarda
yapay hatalar oluşturulmuştur. Rulmanda yapay hatalar
dışında ekstra bir titreşimin olmaması için yapay hataların
özenle açılması gerekmektedir. Bunun için lazer delme
yöntemi ile mikron hassasiyetinde iç bileziğe, dış bileziğe ve
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
987
bilye üzerine 0.15 mm ve 0.9 mm çapında delikler açılmıştır.
Şekil 3'te lazerle oluşturulmuş yapay hatalar görülmektedir.
Şekil 3 : Lazerle oluşturulmuş yapay hatalar
3.2. Ham Titreşim Verisi ve Özellik Çıkarımı
Titreşim verileri 24 KHz örnekleme frekansında toplanmış,
1'er saniyelik kısımlara ayrılarak 20 adet veri paketi şeklinde
bilgisayar ortamında saklanmıştır. Şekil 4'te bir titreşim verisi
örneği görülmektedir.
Şekil 4: Ham titreşim verisi
Hata boyutu değiştikçe titreşim verisi üzerinde çeşitli
değişiklikler olacaktır. Bu değişiklikleri elde etmek için
titreşim verisinin zaman uzayında özellik çıkarımı yapılmıştır. Bu özellikler aşağıda verilmiştir.
RMS
Kurtosis
Standart sapma
Skewness
Maksimum
Minimum
Ortalama
Medyan
Crest faktör
Tablo 2'de küçük, orta ve büyük hatalı rulmanlardan alınmış birer titreşim verisinin örnek özellik çıkarımı görülmektedir.
Tablo 2: Zaman uzayında özellik çıkarımı ve ağırlıklar
HATA BOYUTU
ÖZELLİKLER KÜÇÜK ORTA BÜYÜK AĞIRLIK
Ortalama -0.0027 -0.0047 0.016 0.02
Maksimum 0.9364 1.4513 7.0941 0.2
Minimum -0.6598 -1.902 -4.4361 0.02
Standart Sapma 0.0994 0.1421 0.4088 0.2
Skewness 1.02 -0.05 0.974 0.01
Kurtosis 13.8513 25.1383 47.0916 0.39
Medyan -0.0047 -0.0051 -0.0048 0.01
RMS 0.0994 0.1421 0.4088 0.1
Crest faktör 9.4162 10.2113 17.3518 0.05
3.3. Yapay Sinir Ağı Modelinin oluşturulması
20'şer adet üç hata tipinde veri paketleri ve 9 adet zaman
uzayında istatistiksel özellikler ile beraber 9x60 boyutunda
özellik matrisi oluşturulmuştur Özellik çıkarımından sonra,
yapay sinir ağı modelinin girişleri için ağırlıklar belirlenmiştir.
Hatanın değişimine hangi özelliklerin tepkisi daha belirgin ise
o girişe ait ağırlık daha büyük belirlenmiştir. Örneğin; hata
miktarı arttıkça kurtosis özelliğinin belirgin bir şekilde arttığı
gözlenmiştir. Dolayısıyla bu girişe ait ağırlık büyük
seçilmiştir. Ağırlıklar deneme-yanılma yöntemiyle
bulunmuştur. Tablo 2'de, istatistiksel özelliklere ait ağırlıklar
gösterilmiştir. Tüm girişlere ait ağırlıklar bu şekilde
belirlendikten sonra yapay sinir ağı modeli Şekil 5'e benzer bir
şekilde oluşturulmuştur.
Şekil 5: Yapay sinir ağı modeli
Girişler belirlendikten sonra, hedef çıkış matrisi belirlenir.
9x60'lık giriş matrisine karşılık, 1x60'lık hedef çıkış matrisi
belirlenmiştir. Küçük boyutlu hatalar için 0.15, orta boyuttaki
hatalar için 0.5 ve büyük boyuttaki hatalar için 0.9 değeri
verilmiştir. Verilen bu değerler varsayımsal değerlerdir ve
arızanın büyüklüğünü belirtmek için verilmiştir. Rulmanlar
güvenilir bir yöntemle hata frekans genlikleri ölçülmüş ve hata
genliklerine göre sınıflandırılmıştır. Bu büyüklükleri ve hedef
çıkış matrisindeki karşılığını belirten değerler Tablo 3'te
gösterilmiştir.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
988
Tablo 3: Hata tipleri
Hata Tipi Hata Boyut Hedef Çıkış
Küçük 0-200 0.15
Orta 201-349 0.5
Büyük ≥350 0.9
3.4. Simülasyon
Yapay sinir ağı modeli Matlab üzerinde yazılan kodlarla
simüle edilmiştir. Simülasyon parametreleri Tablo 4’te
gösterilmiştir.
Tablo 4: Simülasyon parametreleri
YSA Parametreler Değerler(SI)
Transfer fonksiyonu Tansig, Purelin
Öğrenme oranı 0.55
Max Epochs 500
Hedef hata
Eğitim algoritması 1e-7
LM
Tanjant-Sigmoid (tansig) transfer fonksiyonu çok katmanlı
yapay sinir ağlarında kullanılan bir transfer fonksiyonudur. Bu
fonksiyon sistemde giriş katmanı ile saklı katman arasında
transfer fonksiyonu olarak kullanılmıştır. tansig fonksiyonu
sistemin çıkışını -1 ile +1 arasında düzenler.
Şekil 6: Tanjant-Sigmoid (tansig)Transfer Fonksiyonu
Purelin fonksiyonu, saklı katman ile çıkış katmanı arasında
kullanılan transfer fonksiyonudur. Bu transfer fonksiyonu ile
çıkış, -1 ile +1 arasında lineer olarak düzenlenir.
Şekil 7: Purelin Transfer Fonksiyonu
Öğrenme oranı, elde edilen en iyi sonuca göre 0.55 olarak
belirlenmiştir. Küçük, orta ve büyük hataya sahip
rulmanlardan alınan 20'şer adet titreşim verisi olmak üzere 60
adet titreşim verisi kullanılmıştır. Buna göre bu verilerin %55'i
yapay sinir ağımını eğitmek için, %45'i test için kullanılmıştır.
Yüzde oranları deneme-yanılma ile bulunmuş en iyi
değerlerdir.
4. Deneysel Sonuçlar
Şekil 8'de kestirilen değerlerin hedeflenen değerlere göre
dağılımı görülmektedir. Kestirilen değerler, 0.15(küçük hata),
0.5 (orta hata) ve 0.9 (büyük hata) civarında toplanmıştır.
Kestirilen değerlerin dağılımı ±%5 bandı içerisinde olması
hedeflenmiştir. Kestirim sonucunda ortalama hata ve
korelasyon değerleri hesaplanarak gösterilmiştir. Ortalama
hata ve korelasyon katsayısı formülleri Denklem 3 ve 4
verilmiştir.
Ortalama Hata(%)
1
1001 i i
ii
N pa
N a
(3)
Korelasyon, R(a,p)( , )
( , ) ( , )
Cov a p
Cov a a Cov p p (4)
a ve p değerleri, sırasıyla gerçek ve kestirilen değerlerdir.
Cov(a,p) ise a ile p arasındaki kovaryansı ifade eder. [13].
Öngörülen ve kestirilen değerler ±%5 lik bir bandın içerisinde
kalması arzulanmıştır. Şekil 8'de, %99.76'lık bir başarıyla
öngörünün gerçekleştiği görülmektedir.
Şekil 8: Hedeflenen ve kestirilen çıkışların dağılımı
Her seferinde verilerin %55 i rastgele olarak seçilmiş ve yapay
sinir ağı eğitilmiştir. Hedef çıkış ve kestirilen çıkışın beraber
çizdirildiğinde Şekil 9'daki sonuç ortaya çıkmaktadır. Eğitim
ve test için seçilen değerler rastgele olduğu için sonuç her
seferinde farklı ama Şekil 9'daki sonuca benzer çıkmaktadır.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
989
Şekil 9: Hedef çıkış ile kestirilen çıkış
Şekil 9'daki mavi değerler hedef çıkışı, kırmızı değerler ise
yapay sinir ağı modeli ile kestirilen sonuçları göstermektedir.
Grafiğe bakarak, hata boyutunun sınıflandırılması %100 lük
bir başarıyla gerçekleştiği görülmektedir. Grafikteki değerler
sadece test verileri içindir. Diğer bir ifadeyle, yapay sinir
ağının eğitimi aşamasında kullanılan veriler test aşamasında
kullanılmamıştır.
Şekil 10'da simülasyonun performans grafiği görülmektedir.
Hataların karelerinin ortalaması, belli bir değerin(10-7) altına
düştüğünde Matlab iterasyona son vermektedir.
Şekil 10:Performans grafiği (Hataların karelerinin
ortalaması)
5. Genel Sonuçlar
Bu çalışmada, küçük, orta ve büyük hata miktarlarına
sahip rulmanlardan elde edilen titreşim verilerinin zaman
uzayında istatistiksel öznitelikleri çıkartılmış, yapay sinir ağı
modeli oluşturulmuş ve hata boyutunun tespiti, sınıflandırma
olarak değerlendirildiğinde, %100 lük bir başarı sağlanmış ve
gerçek hata değerinin ise %2’lik bir ortalama hata ile
kestirildiği gözlemlenmiştir.
Yapay sinir ağları sayesinde, rulmanda meydana gelmiş
hatanın boyutu, titreşim sinyallerinden zaman uzayında elde
edilen özniteliklere dayanılarak kestirilmiştir.
Teşekkür
Bu çalışma Kocaeli Üniversitesi Mekatronik Mühendisliği
Bölümü Sensör Laboratuarında 106M208 kodlu Tübitak
projesi kapsamında altyapısı oluşturulan deney düzeneğinde
yapılmıştır. Bu bildirinin yazarları, hibe edilen rulmanlardan
dolayı Ortadoğu Rulman Sanayi'ne (ORS), rulmanlarda yapay
hataların oluşturulmasına katkılarından dolayı Lazer
Teknolojileri Araştırma ve Uygulama Merkezine (LATARUM) ve TÜBİTAK'a teşekkür ederler.
Kaynakça
[1] K. Al-Raheem," Wavelet Analysis and Neural
Networks for Bearing Fault Diagnosis," Caledonian College of Engineering, Oman.
[2] ZHANG Jingyi, WANG Lan, ZHU Meichen, ZHU
Yuanyuan, YANG Qing, "Fault diagnosis based on
wavelet packet energy and PNN analysis method for
rolling bearing", School of Information Science and
Engineering Shenyang Ligong University Shenyang 110159, China,2012
[3] E. Mendel, T. W. Rauber, F. M. Varejao and R. J.
Batista” Rolling Element bearing fault diagnosis in
rotating machines of oil extraction rigs”, 17th European Signal Processing Conference (EUSIPCO 2009)
[4] Dr. S. J. Lacey,” An Overview of Bearing Vibration
Analysis”, Nov / Dec 2008,maintenance & asset management vol 23 no 6
[5] Manish yadav, Dr. Sulochana wadhwani,”Vibration
analysis of bearing for fault detection using time domain
features and neural network”, International Journal of
Applied Research in Mechanical Engineering, Volume-1, Issue-1, 2011
[6] Sanjay Rukhande, Shamim Pathan, Pratik Lahane, Vijay
Patil, Devendra Mhatre, Ashish Gosavi, “Condition
Monitoring for Fault Diagnosis of Bearings”,
Proceedings of the NCNTE-2012, Third Biennial National Conference on
Nascent Technologies Fr. C. Rodrigues Institute of
Technology, Vashi, Navi Mumbai, Feb 24-25, 2012
[7] Shuai Shi, Laibin Zhang, Wei Liang,” Condition
Monitoring and Fault Diagnosis of Rolling Element
Bearings Based on Wavelet Energy Entropy and SOM “,College of Mechanical and Transportation Engineering
China University of Petroleum Beijing, China,2012
[8] BinZhang, GeorgiosGeorgoulas, MarcosOrchard,
AbhinavSaxena, DouglasBrown, GeorgeVachtsevanos,
StevenLiang,” Rolling Element Bearing Feature
Extraction and Anomaly Detection Basedon Vibration
Monitoring”, 16th Mediterranean Conference on Control and Automation
[9] Victor Girondina, Komi Midzodzi Pekpea, Herve
Morelb, Jean-Philippe Cassar," Bearings fault detection
in helicopters using frequency readjustment
andcyclostationary analysis", "Mechanical Systems and Signal Processing NA, NA (2013) NA
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
990
[10] H.Metin Ertunç, Hasan Ocak, Muhammet Merdoğlu,
Samet Bayram, Mesut Çavuş,"Vibration Analysis Based
Localized Bearing Fault Diagnosis Under Different Load
Conditions " 12.International Workshop on Research and Education in Mechatronics,2011,Kocaeli, Turkey
[11] Kaplan Kaplan, Samet Bayram, Mel h Kuncan, H.Met n
Ertunç,"Farklı Rulman Hatalarından Elde Ed len T treş m
S nyaller Üzer ndek Radyal Yükler n Etk s " Otomatı k
Kontrol Ulusal Toplantisi, TOK-2012, 11-13 Ekim 2012,
Niğde
[12] Haykin S (1994) Neural networks—a comprehensive foundation.
[13] H.Metin Ertunç, Hasan Ocak, Cüneyt Aliustaoğlu," ANN- and ANFIS-based multi-staged decision algorithm
for the detection and diagnosis of bearing faults" Neural Comput & Applic,2012
[14] Fausett L.," Fundamentals Of Neural Networks",1994
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
991
Chua Devresinin Kaotikliğinin YSA ile Kestirimi
Muhittin Bayram1, Ferhat Çıra
1
1Elektrik Elektronik Mühendisliği Bölümü
Dicle Üniversitesi, Mühendislik Fakültesi {muba,fcira}@dicle.edu.tr
Özetçe
Bu çalışmada Chua devresi, Yapay Sinir Ağları (YSA) ile
analiz edilmiştir. Öncelikle Chua devresinin zaman
dinamikleri elde edilmiş ve sonra bu dinamiklerin faz uzayları
oluşturularak faz uzay çekicileri incelenmiştir. Daha sonra bu
dinamiklere ait Lyapunov üstelleri elde edilerek, Chua
devresinin farklı başlangıç şartlarında aldığı değişik durumlar
görsel olarak incelenmiştir. Son olarak farklı başlangıç
durumundaki sinyallerin entropileri hesaplanmış ve elde
edilen öznitelik vektörleri YSA ile otomatize edilerek, Chua
devresinin hangi değerlerde kaotik özellikler gösterdiği
kestirilmiştir.
1. Giriş
Bu çalışmada, Literatürde popüler olan elektronik Chua
devresinin Lyapunov üstelleri ve YSA ile değerlendirilmesi
üzerinde durulmuştur. Yani Chua devresinin kaotikliği kaosu
nicel olarak tanımlayan Lyapunov üstelleri ile belirlenmiştir.
Chua devresi bize kaosu çağrıştırmaktadır. Basit bir devre
yapısına sahip olması, periyodik ve kaotik davranış
sergilemesi dolayısıyla Chua devresi, kaos ve kaotik işaret
uygulamalarında model devre olarak kabul edilmekte ve
yaygın olarak kullanılmaktadır [1-3].
Kaotik sistemler belirli şartlar altında kaotik özellikler
gösterirler. Yani kaotik sistemler her zaman kaotik değillerdir.
Chua devresi farklı giriş değerlerinde değişik karakteristikler
sergilediğinden hangi değerlerde ne tip karakteristikler
sergilediği bazı çalışmalarda önem arz etmektedir. Örneğin
Chua devresi güvenli haberleşme sistemlerinde sık
kullanılmaktadır [4-6]. Mesajın gizliliği için kaotik olması
istenmektedir. İşte burada Chua devresinin hangi değerlerde
kaotik olduğu önem arz etmektedir. Kaotiklik derecesinin
yükselmesi işaretin daha sonraki adımlarının görülmesini
olumsuz yönde etkilemektedir. Yani öngörüyü negatif yönde
etkilemektedir. Bu da güvenli mesaj iletimi için önem arz
etmektedir.
İşaretlerin kaotiklik davranışlarını zaman dinamiklerinde
görmek hiç de kolay değildir. Bunun için işaretleri faz uzayına
taşımak ve başlangıç koşullarına hassas bağlılıklarını ölçmek
için Lyapunov üstellerini incelemek gerekir. Çalışmamızda,
öncelikle Chua diferansiyel denklemleri gerçekleştirilmiş ve
sonra devredeki değişkenlerin zaman dinamikleri elde
edilmiştir. Sonra bu değişkenlerin birbirleriyle karşılaştırılması
yapılarak faz uzayları çizilmiştir. Daha sonra da farklı devre
parametrelerine göre zaman dinamiği, faz uzayı ve Lyapunov
üstel grafikleri elde edilerek karşılaştırılmaları yapılmıştır.
Farklı başlangıç değerleri ile oluşturulan (x,y,z) giriş
değerlerinin entropileri hesaplanarak öznitelik vektörleri
oluşturulmuştur. Bu öznitelik vektörleri YSA ile eğitilmiş ve
sonra test edilerek, Chua devresinin hangi başlangıç
değerlerinde kaotik özellik gösterdiği tespit edilmiştir.
Çalışmada, 10 adet periyodik ve 10 adet kaotik olmak
üzere toplam 20 adet Chua işaret kombinezonu kullanılmıştır.
İşaretlerden 10 tanesi YSA’nın eğitimi, 10 tanesi ise testi için
kullanılmıştır. Bu işaretlerin entropileri hesaplanmıştır. Her
bir işarete ait x, y, z dinamikleri için 3 öznitelik vektörü elde
edilmiş ve YSA girişleri 3 olarak alınmıştır. Periyodik ve
kaotik olmak üzere 2 çıkış oluşturulmuştur. Bu şekilde
yapılan sınıflandırmada % 100 başarım oranı elde edilmiştir.
2. Chua Devresi ve Lyapunov üstelleri
2.1. Chua Devresi
Chua devresi, kaotik dinamiklerin gösterilmesi açısından
oldukça popüler olan bir elektronik araçtır. Bu devrenin giriş
parametreleri değiştirilerek limit çevrim ve garip çeker elde
edilebilmektedir. Parametre değişikliğine göre devre farklı
kılıflara bürünmekte ve değişik dinamikler göstermektedir.
Chua devresinin diferansiyel modeli Denklem (1)’de
gösterilmiştir [7].
bydt
dz
zyxdt
dy
xgxyadt
dx
))((
(1)
Denklem (1)’deki “a” ve “b” boyutsuz parametrelerdir.
g(x) fonksiyonu denklem (2)’de gösterilmiştir. Denklem
(2)’deki “c” ve “d” ise katsayılardır.
)11)((2
1)( xxcdcxxg (2)
Chua devresinin farklı giriş koşulları altında nasıl
dinamikler gösterdiği aşağıda değişik örneklerle incelenmiştir.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
992
0 1000 2000 3000 4000 5000 6000-8
-6
-4
-2
0
2
4
6
8
t(zaman)
yy(0)=0.01 için y dinamiği
Şekil 1: Chua devresinin x(0)=0.01, y(0)=0.01, z(0)=0.01
için y dinamiği
0 1000 2000 3000 4000 5000 6000-20
-15
-10
-5
0
5
10
15
20
t(zaman)
y
y(0)=0.05 için y dinamiği
Şekil 2: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0.05
için y dinamiği.
0 200 400 600 800 1000 1200 1400 1600 1800 2000-1.5
-1
-0.5
0
0.5
1
t(zaman)
y
y(0)=0.05 için y dinamiği
Şekil 3: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0 için
y dinamiği.
Şekil 1’de görüldüğü gibi artan bir periyodik işaret,
Şekil 2’de azalan bir periyodik işaret ve Şekil 3’te ise kaotik
bir işaret elde edilmiştir. Tüm bu işaretler sadece başlangıç
değerlerinin değiştirilmesiyle sağlanmıştır. Bu dinamikler faz
uzayına taşındığı zaman daha anlamlı şekiller elde
edilmektedir.
2.2. Faz (Durum) Uzayı
Lyapunov üstel dinamiği için faz uzayının oluşturulması önem
arz etmektedir. Çünkü kaotik dinamiklerin hesaplanması için,
zaman serisinin faz uzayında yeniden oluşturulması
gerekmektedir. Faz uzayında aynı zaman diliminde iki veya
daha fazla fonksiyonun birbiriyle karşılaştırılması yapıldığı
için, durum uzayını yapılandırmak için en az iki fonksiyon
gereklidir. Takens [8], aynı değişkenin farklı anlardaki
değerlerini koordinat olarak kullandığı sahte (pseudo) faz
uzayını ortaya koymuştur. Bu uzayda genellikle bir koordinat
orijinal zaman serisinden, diğerleri de zaman serisinin
gecikmiş değerlerinden oluşur. Burada önemli olan en uygun
gecikme değerinin ve koordinat sayısının bulunmasıdır.
Takens’a (1981) göre yalnızca bir zaman serisi varsa, zaman
serisinin bir veya daha çok türevleri kullanılarak
Denklem(3)’deki gibi faz uzayı gerçekleştirilebilir.
))1((....)2()()( mtxtxtxtxX (3)
Denklem (3)’de kullanılan m yerleştirme boyutu, τ ise
zaman gecikmesidir. Yerleştirme boyutu m, en yakın yanlış
komşuluklar metodu ile zaman gecikmesi τ ise karşılıklı bilgi
fonksiyonun ilk yerel minimumundan hesaplanır. Yerleştirme
boyutu m hesaplanırken Denklem (4)’deki durum göz önünde
bulundurulmalıdır. Burada “d” faz uzayındaki çekicinin
boyutudur.
md 12 (4)
Zaman gecikmesi τ değeri küçük olduğu zaman çekici
doğrusallaşarak, büyük olduğu zaman ise faz uzayında
dağılarak özelliğini kaybeder [9].
Aşağıdaki Şekil 4, 5 ve 6’da, Şekil 1, 2 ve 3’te gösterilen
Chua zaman dinamiklerinin faz uzayları oluşturulmuştur.
-8 -6 -4 -2 0 2 4 6 8-0.02
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
0.02
y
z
(y,z) için faz uzayı
Şekil 4: Chua devresinin x(0)=0.01, y(0)=0.01, z(0)=0.01
için (y,z) faz uzayı.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
993
-20 -15 -10 -5 0 5 10 15 20-0.05
-0.04
-0.03
-0.02
-0.01
0
0.01
0.02
0.03
0.04
0.05
y
z
(y,z) için faz uzayı
Şekil 5: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0.05
için (y,z) faz uzayı.
-1.5 -1 -0.5 0 0.5 1-5
-4
-3
-2
-1
0
1
2
3
4
5x 10
-3
y
z
(y,z) faz uzayı
Şekil 6: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0 için
(y,z) faz uzayı.
Şekil 4’te gösterilen çekici Şekil 1’deki Chua zaman
dinamiğine aittir. Zaman dinamiği artan periyodik işaret
olduğundan faz uzayı da dışa doğru yoğunlaşan limit çevrim
halini almıştır. Şekil 5’te gösterilen çekici Şekil 2’deki Chua
zaman dinamiğine aittir. Zaman dinamiği azalan periyodik
işaret olduğundan faz uzayı da içe doğru yoğunlaşan limit
çevrim halini almıştır. Şekil 6’da verilen çekici ise Şekil 3’teki
zaman dinamiğine aittir. Zaman dinamiği kaotik olduğundan
faz uzayı da garip (kaotik) çekici halini almıştır.
2.3. Lyapunov Üstel Dinamiği
Lyapunov üstellerinin pozitif olması, başlangıç şartlarına
hassas bağımlılığın bir ölçüsü olarak kabul edilmektedir.
Lyapunov üstel dinamiğinin pozitif değer alması, faz
uzayındaki eğrilerin başlangıcının küçük değişikliklere
uğratılması ile tahmin edilemeyecek derecede sapmalarından
kaynaklıdır. Bu da kaotikliğin bir göstergesi olarak kabul
edilir. Deterministik sistemleri, tahmin edilemezlik zırhına
büründüren işte bu fizyolojik özelliktir.
Aşağıdaki Şekil 7, 8 ve 9’da farklı başlangıç koşulları için
değişik Lyapunov üstel dinamikleri gösterilmiştir.
0 10 20 30 40 50 60 70 80 90 100-4
-3
-2
-1
0
1
2Lyapunov Üstel Dinamiği
t(zaman)
Lyapunov Ü
ste
lleri
Şekil 7: Chua devresinin x(0)=0.01, y(0)=0.01, z(0)=0.01
için Lyapunov Üstel dinamikleri.
0 10 20 30 40 50 60 70 80 90 100-4
-3
-2
-1
0
1
2Lyapunov Üstel Dinamiği
t(zaman)
Lyapunov Ü
ste
lleri
Şekil 8: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0.05
için Lyapunov Üstel dinamikleri.
0 10 20 30 40 50 60 70 80 90 100-4
-3
-2
-1
0
1
2
3Lyapunov Üstel Dinamiği
t(zaman)
Lyapunov Ü
ste
lleri
Şekil 9: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0 için
Lyapunov Üstel dinamikleri.
Şekil 7 ve 8’de, sırasıyla artan ve azalan periyodik
işaretlerin Lyapunov üstelleri gösterilmiştir. Şekil 9’da ise
kaotik Chua devresinin Lyapunov üstelleri gösterilmiştir.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
994
Görüldüğü gibi Şekil 9’daki Lyapunov üstellerinden en az
birisi pozitif değere evrilmiştir. Bu da kaotiklik için gerekli
bir şarttır.
2.4. Yapay Sinir Ağları
YSA, karşılaştırma ve sınıflandırmalarda yaygın olarak
kullanılan bir araçtır. YSA’nın temelinde, zekâ gerektiren
işlemlerden oluşan bilgi işleme işlevi vardır. Bu sistem tek
yönlü işaret kanalları ile birbirine bağlanan işlem
elemanlarından oluşur. YSA ile insan beyninin fonksiyonları
arasında bir benzerlik de vardır. Bu yüzden YSA sistemine
insan beyninin modeli de denilebilir. YSA davranışları çevre
şartlarına göre şekillenebilir. Girişler ve istenen çıkışların
sisteme verilmesi ile kendisini farklı cevaplar verebilecek
şekilde ayarlayabilir. Tipik bir YSA, işlem elemanlarından
oluşan katmanların bileşimidir. En yaygın kullanılan YSA tipi,
geri beslemeli öğrenmeye sahip çok katmanlı algılayıcıdır.
Çok katmanlı algılayıcı, dışarıdan verileri alan giriş
katmanından, ağın çıktılarını dışarıya veren çıktı katmanından
ve bu ikisi arasında genellikle bir ve bazen de daha fazla gizli
katmandan meydana gelmektedir [10].
Farklı durumlar üzerinde çalışılarak, en başarılı sonucu
veren YSA modeli Şekil 4’te elde edilmiştir. Bu model 3 giriş,
6 nöronlu bir gizli katman ve 2 çıkıştan oluşmaktadır. Gizli ve
çıkış katmanları için log sigmoid transfer fonksiyonu, öğrenme
algoritması için de Levenberg-Marquardt algoritması
kullanılmıştır. Girişler x, y ve z Chua zaman dinamiklerine ait
entropiler olup sırasıyla entx, enty ve entz’dir.
Şekil 4: Çok katmanlı Yapay Sinir Ağları modeli.
Çıkış katmanı ise Chua devresinin kaotik ve artan mı
yoksa azalan mı olduğunu gözetmeksizin periyodik durumunu
göstermektedir.
3. Tartışma ve Sonuç
Bu çalışmada, yaygın olarak kullanılan Chua devresinin farklı
başlangıç koşullarında değişik zaman dinamikleri gösterdiği
gözlenmiştir. Bu farklılıklar faz uzayında da gözlenmiş ve
grafikler incelendiğinde zaman dinamiğinde periyodik olarak
görülen işaretlerin faz uzayında limit çevrim oluşturdukları
görülmektedir. Limit çevrim oluşturan dinamiklerin Lyapunov
üstelleri alındığında sıfıra yaklaştıkları gözlenmiştir (Şekil 7 -
8). Kaotik özellik gösteren Chua dinamiklerinin ise faz
uzayında garip çeker oluşturdukları, Lyapunov üstelleri
alındığında ise en az bir değerin pozitif değere evrildiği
görülmüştür (Şekil 9).
YSA’ya (x,y,z) giriş değerlerinin entropileri öznitelik vektörü
olarak uygulanmış ve farklı başlangıç değerlerinde periyodik
veya kaotik özellik gösterdiği görülmüştür. Rastgele verilen
giriş değerlerine göre yapılan testlerde tam başarım elde
edilmiştir.
4. Kaynakça
[1] R., Kılıç, F., Yıldırım, “CFOA-Tabanlı Kaotik Chua
Devresinin Tasarımı ve Yüksek Frekans Performansının
Deneysel Olarak Doğrulanması”, 11. Sinyal İşleme ve
İletişim Uygulamaları Kurultayı-SIU, s: 357-360, 2003.
[2] A., Gülten, M., Türk, “Examination of chaotic behaviours
using bond graph model”, Journal of the Franklin
Institute, 340 (6-7), p: 415-422, 2003.
[3] M. P., Kennedy, “Three Steps to Chaos-Part I:
Evolution”, IEEE Transaction on Circuits and Systems,
40(10), p: 640-656, 1993.
[4] T., Yang, L.O., Chua, “Secure Communication via
Chaotic Parameter Modulation”, IEEE Transactions on
Circuits and Systems-I:Fundamental Theory and
Applications, 43(9), p: 817-819, 1996.
[5] C., Cruz-Hernandez, “Synchronization of Time Delay
Chua’s Ossilator with Application to Secure
Communication”, Nonlinear Dynamics and Systems
Theory, 4(1), p:1-13,2004.
[6] M., Mamat, M., Sanjaya WS., D.S., Maulana, “Numerical
Simulation Chaotic Synchronization of Chua Circuit and
Its Application for Secure Communication”, Applied
Mathematical Sciences, 7(1), p:1-10, 2013.
[7] S., Lynch, “Dynamical Systems with Application using
Mathematica”, p: 160-161, Boston, 2007.
[8] F., Takens, “Detecting Strange Attractors in Turbulunce”,
Lecture Notes in Mathematics, p: 366-381, 1981.
[9] H., Acar, M., Bayram, “Epileptik Nöbetin Lyapunov
Üsteli, Dalgacık Entropi ve Yapay Sinir Ağları İle
Kestirimi”, 20. Sinyal İşleme ve İletişim Uygulamaları
Kurultayı, 18-20 Nisan 2012, Muğla.
[10] D. JC., MacKay, “Information Theory, Inference and
Learning Algorithms”, Cambridge University Press, 527,
UK, 2003.
Çıkış
Katmanı Gizli
Katman Giriş
Katmanı
.
.
.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
995
YSA ve Pencere Ortalamaları Kullanılarak Yüz Tanıma Sistemi
Ali Ötkün1, Bekir Karlık
1
1Bilgisayar Mühendisliği Bölümü
Selçuk Üniversitesi, Konya [email protected]
Özetçe
Son yıllarda en popüler biyometrik tanıma sistemlerinden
birisi de yüz tanıma sistemleridir. Şahsi hayatı ihlal etmeden
kişiyi uzaktan tanımlama amaçlı kullanılan yüz tanıma
sistemi, bir resmi ya da video görüntüsünü yüzün karakteristik
özelliklerini tanımlayan bir koda dönüştürülmesi esasına
dayanır. Bu çalışmada, pencere ortalama tabanlı öz nitelik
çıkartma algoritması ile yapay sinir ağları (YSA) sınıflandırıcı
kullanılarak etkin kullanımlı bir yüz tanıma yazılımı sunulmuştur. Yazılımda Java programlama dili kullanılmıştır.
1. Giriş
Eski çağlardan günümüze kimlik doğrulama ve
tanımlama insanoğlunun önemli problemlerindendir.
Bilgisayar bilimlerinin gelişimiyle birlikte kimlik denetimi
için geliştirilen yöntemler farklılaşmıştır. İlk başlarda şifre
gibi bilgi tabanlı kimlik denetimi yöntemleri geliştirilmiştir.
Ardından akıllı kartlar gibi anahtar temelli denetim yöntemleri
geliştirilmiştir. Fakat her iki yöntemde de unutulma, kaybolma
ve çalınma gibi sorunlar vardır. Bu nedenle kişinin sürekli
yanında taşıyacağı, başkasına vermeyeceği ve kaybetmeyeceği
bir yöntem olarak kişiye ait bir organın veya bir hareketin
denetim mekanizması olarak kullanılması fikri ortaya
çıkmıştır. Bu tür tanımlama ve doğrulama yöntemlerine de
biyometrik tanıma yöntemleri adı verilmiştir[1].
Biyometrik tanıma sistemleri, bir bireyin fiziksel veya
davranışsal benzersizliğini ölçen ve mevcut kayıtlarla
karşılaştırarak tanımlama ve doğrulama yapan otomatik
sistemlerdir. Biyometrik sistemler bir şifreyi aklında tutma
veya bir anahtarı yanında taşıma zorunluluklarını ortadan
kaldırır. Benzer biçimde unutma, çalınma veya kaybedilme
gibi sorunları ortadan kaldırır. Parmak izi, el geometrisi, yüz,
iris, retina, imza ve tuş vuruşu tanıma sistemleri biyometrik
tanıma sistemlerine birer örnektir.
Biyometrik tanıma sistemleri fiziksel ve davranışsal
olmak üzere iki kısım altında incelenmektedir. Fiziksel
biyometrik tanıma sistemleri bireyleri birbirinden ayırt etmek
için belirli organların şekilleri ile ilgilenirler. Yüz, parmak izi,
el, iris ve retina tanıma sistemleri bu tür biyometrik tanıma
sistemlerine güzel örneklerdir. En eski fizyolojik biyometrik
tanıma sistemi parmak izi tanımadır. Davranışsal biyometrik
tanıma sistemleri ise kişilerin davranışlarına, hareketlerine
bakılarak birbirinden ayırt etmeyi amaçlayan sistemlerdir. Bu
tür tanıma sistemlerine örnek olarak imza tanıma, yürüyüş
tanıma, tuş vuruşlarından tanıma gibi örnekler verebiliriz. Bu
yöntemin en eskisi ise imza tanımadır.
Yüz tanıma sistemi, bir fotoğraf veya bir videodaki yüzün
karakteristik özelliklerinin kullanılarak teşhis etme, kimlik
belirleme veya doğrulama işleminin yapıldığı biyometrik
tanıma sistemleridir.
İnsanın yüz özelliklerinin çıkartılması kolay
olmadığından yüz tanımanın gelişimi çok eskiye
dayanmamaktadır. Yüzümüzün içerdiği özelliklerin fazlalığı
bu özellikleri kullanacak yöntemlerin de sayısını arttırmıştır.
Değişik özellikleri kullanan değişik yöntemler ortaya
çıkmıştır[1]. Bu yöntemleri şekilsel ve renk özelliklerinden
yararlanılarak tanıma olmak üzere iki kısımda gruplamak
mümkündür. İnsan yüzünde yaklaşık olarak seksen tane
belirleyici nokta vardır. Genellikle bu noktalardan on ila yirmi
tanesi alınarak şekilsel verilerden tanıma yapılabilir. Veya
doğrudan resim işleme ve uygun dönüşümlerle renk verisi
kullanılarak tanıma işlemi yapılmaktadır.
Yüz tanıma alanında yapılan çalışmalardan ilki
sayılabilecek yöntem olan “eigenfaces” Sirovich ve Kirby [2]
tarafından ortaya atılmıştır. Daha sonra bu yöntem M. Turk ve
A. Pentland [3] tarafından kullanılmıştır.
Hua Yu*, Jie Yang[4] yaptıkları çalışmada doğrudan
Doğrusal Diskriminant Analizi(Linear Discriminant Analysis -
LDA) kullanmışlardır. Çalışmalarını ORL veri tabanını
kullanarak gerçekleştirmişlerdir. Çalışmalarında kullandıkları
yöntemde boyut indirgeme kullanmadan 90,8% tanıma
oranına ulaşmışlardır.
Kyungnam Kim[5] çalışmasında temel bileşen analizi
(Principle Component Analysis) yöntemini kullanarak AT&T
Laboratuvarları veri tabanını üzerinde yüz tanıma alanında
çalışmalar yapmıştır. Yapmış olduğu çalışmalarda yüz verisi
olmayan verileri de kullanmış başarılı sonuçlar elde etmiştir.
Meng Joo Er[6] ve arkadaşları ORL veri tabanı üzerinde
radyal tabanlı fonksiyon sinir ağı (Radial Basis Function
Neural Networks) kullanarak çalışmalar yapmışlardır. Öz
nitelik çıkarımı için eigenfaces ve temel bileşen analizi
kullanmışlardır. Çalışmalar sonucunda 1.92% hata oranıyla
tanıma yakalamışlardır.
Karlık ve Atamuradov[7] Temel Bileşenler Analizi
(Principle Companent Analysis-PCA) tabanlı Bayes
sınıflandırıcılı bir yüz tanıma sistemi sunmuşlardır. Tüm bu
çalışmalarda hazır veri tabanları kulanılarak doğrudan yüz
resimlerinden yararlanılmıştır. Tilki ve Karlık[8] yüze ait
temel özellikler alınarak altın oranların kullanıldığı bir veri
seti ile yüz tanıma sistemi üzerinde çalışmışlardır.
Bu çalışmada ise, Java programlama dili kullanılarak
insan yüz özniteliklerinin çıkarımı ve kişilerin tanınması
üzerine bir uygulama geliştirilmiştir. Öz nitelik vektörü
çıkarma işlemi için pencere ortalamaları kullanılmıştır.
Öznitelikleri elde edilen yüz verileri yapay sinir ağı
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
996
kullanılarak başarılı bir şekilde sınıflandırılmıştır. Yapılan
çalışmalar ORL veri tabanı[9] üzerinde test edilmiştir.
2. Kullanılan Materyaller Ve Yöntemler
Bu çalışmada iki boyutlu insan yüz resmi kullanılarak kişinin
tanınması ele alınmıştır. Yüz tanıma için ORL veri
tabanındaki yüz verileri ele alınmıştır. Uygulama Java
programlama dili SDK 1.7 ve Netbeans 7.3 IDE’si
kullanılarak geliştirilmiştir.
2.1. ORL Veri Tabanı
Yüz veri tabanı olarak ORL veri tabanı kullanılmıştır. ORL
veri tabanında s1, s2, s3, … , s40 olmak üzere 40 kişinin,
1.pgm, 2.pgm, … , 10.pgm olmak üzere 10’ar adet resmi
bulunmaktadır. Toplamda 400 adet resim vardır. Resimlerin
boyutları eşit ve Şekil 1’de gösterildiği gibi genişlikleri 92px,
yükseklikleri 112px’dir.
Şekil 1: ORL yüz veri tabanında s1 kişisinin 1.pgm resmi
2.2. Görüntü İşleme ve Öz Nitelik Çıkarımı
Veri tabanında bulunan resimler Pgm formatındadır. Pgm
resim formatı resimlerin gri seviye değerlerinin tutulduğu bir
resim dosyası şeklidir. Bu resimler sadece yüz resmi oldukları
ve gri tonda bulundukları için yüz tespiti ve grileştirme ön işlemleri yapılmamıştır.
Öz nitelik vektörü çıkarma yöntemi olarak pencere
ortalamaları yöntemi kullanılmıştır. Resim uygulamada
verilen genişlik ve yükseklikte pencerelere ayrılır. Sonra bu
pencerelerin ortalaması bulunduktan sonra en büyük gri piksel
değeri 255 ‘e bölünerek normalleştirme yapılır. Elde edilen öz nitelik vektörü genişlik * yükseklik boyutundadır.
2.3. Yapay Sinir Ağları (YSA)
Beynin bir işlevi yerine getirme yöntemini modellemek için
tasarlanan bir sistem olarak tanımlanabilir. Yapay sinir ağları,
beynin bilgi işleme yöntemine uygun olarak bir öğrenme
sürecinden sonra bilgi toplama, hücreler arası bağlantı
ağırlıkları ile bu bilgiyi saklama, genelleme ve çıkarım
kabiliyetlerine sahip paralel dağıtılmış sistemdir. YSA’da
öğrenme süreci, arzu edilen amaca ulaşmak için ağ
ağırlıklarının yenilenmesini (güncellenmesini) sağlayan
öğrenme algoritmalarının çalıştırılmasını ihtiva eder.
Uygulamalarda en çok kullanılan YSA mimarisi, çok katman
içeren bir mimari olup genelde hatanın geriye yayılımı (Error Back-propagation) algoritmasını kullanmaktadır[10].
YSA ağ yapısında, verilen bir girdi setine karşılık çıktı
değerleri verilerek belirtilen öğrenme kuralına göre ağırlık
değerleri otomatik olarak değiştirilmektedir. Eğitim verisinin
tamamlanmasından sonra eğitilmiş olan ağ, ağırlık
değerlerinin son durumuna göre, verilen herhangi bir veri
setinin sonucunu tahmin edebilmektedir[11]. Bu çalışmada da
Çok Katmanlı İdrak (Multi Layer Perceptron-MLP) mimarisi
kullanılmıştır. İleri beslemeli geri yayılımlı bir Çok Katmanlı Ağ Modeli Şekil 2' de gösterilmiştir.
Şekil 2: Çok katmanlı idrak modeli
3. Biyometrik Yüz Tanıma Sistemi
Bu çalışmada insan yüz resminden kişi tanıma sistemi
gerçekleştirilmiştir. Yüz veri tabanından alınan yüz
resimlerinin sınıflandırılması için kullanılan öznitelik vektörü
çıkarma algoritmaları belirlenmiştir. İleri yönlü geri beslemeli
çok katmanlı bir yapay sinir ağı geliştirilerek elde edilen
öznitelik verileri ağa girdi olarak verilmiş ve ağın eğitiminden sonra çıkışta başarılı bir şekilde sınıflandırılmıştır.
Geliştirilmiş olan uygulamada resimler gerçek zamanlı
bir kameradan değil doğrudan bir veri tabanından elde
edilmiştir. Bu sebeple yüz tespiti ve kameradan yüz verisi elde
etme işlemleri gerçekleştirilmemiştir. Ayrıca veri tabanındaki
resimlerin boyutları aynı ve tamamı gri seviye olduğu için grileştirme ve boyutlandırma gibi ön işlemler yapılmamıştır.
Gerçek zamanlı yüz tanıma sistemlerinin genel yapısı
Şekil 3’te gösterildiği gibi bir yüz tespiti ve elde edilen yüz
verisinin belirli bir ön işlem sürecinden geçirilmesi şeklindedir.
Eşik(Bias)
Giriş Katmanı Gizli Katmanlar Çıkış Katmanı
Eşik(Bias)
G
i r
i
ş l
e r
Ç
ı k
ı
ş l
a
r
Hatanın geri yayılımı yönü
İleri besleme yönü
92 px
112 px
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
997
Şekil 3: Gerçek zamanlı yüz tanıma sistemi blok diyagramı
Bir kameradan, bir videodan veya bir resim veri
tabanından elde edilen resimler yüz bölgesi tespiti için
hazırlanır. Örneğin elde edilen resimde gürültü varsa
temizlenir. Elde edilen resim üzerinde yüz tespiti algoritmaları
çalıştırılarak yüz kesiti alınır. Elde edilen yüz kesiti öz nitelik
vektörü çıkarma işlemi için yüz resimlerini aynı boyuta
getirme, gri seviyeye dönüştürme gibi bir ön işlemden
geçirilir. Bütün ön işlemler bittikten sonra eldeki yüz
resimleri belirli algoritmalar kullanılarak öz nitelik çıkartılır.
Elde edilen öz nitelik vektörleri bir sınıflandırıcı ile sınıflandırılarak tanıma yapılır.
Bu çalışmada resimler bir kameradan, bir videodan veya
işlenmemiş geniş bir resim üzerinden elde edilmeyip, bir veri
tabanından hazır alınmış ve bunun üzerine çalışma yapılmıştır.
Bu sebeple yapmış olduğumuz uygulamanın blok diyagramı
Şekil 3’ten biraz daha farklıdır. Geliştirilen uygulamanın
diyagramı Şekil 4’teki gibidir.
Şekil 4: Uygulama blok diyagramı
Görüldüğü üzere gerçek zamanlı yüz tanıma sisteminden
farklı olarak bazı ön işleme adımlarına ihtiyaç duyulmamıştır. Bu adımlar detaylı bir şekilde anlatılacaktır.
3.1. Veri Tabanından Resmin Okunması
Veri tabanından resmin okunması bu çalışmanın ilk adımını
teşkil etmektedir. Kullanıcı ORL veri tabanının bulunduğu
yeri uygulamaya gösterir. ORL veri tabanındaki resimler daha
önce de belirtildiği gibi pgm formatındadır. Pgm formatı
resimlerin gri seviye değerlerin tutulduğu resim formatıdır.
Veri tabanında 40 kişinin 10’ar adet olmak üzere toplamda
400 adet resim vardır. Kişi isimleri yerine kişilerin bulunduğu
klasör isimleri kullanılmıştır.
3.2. Öz Nitelik Vektörü Çıkarma
Bu aşama genel olarak biyometrik tanıma sistemlerinin en
önemli aşamasıdır. Bu sebeple yüz tanımanın da en önemli
adımıdır. Burada yapılacak olan işlem elimizdeki yüz verisinin bir nevi imzasının çıkarılması işlemidir.
Öznitelik vektörü çıkartmanın iki amacı vardır. İlki
sınıflandırıcı için eldeki büyük resim verisini küçültmek.
İkincisi ise elimizdeki verinin önemli noktalarını bularak aynı
kişinin farklı resimlerindeki küçük değişikliklerden sistemin
etkilenmesinin önüne geçmektir.
İnsan yüzü çok sayıda nitelik içermesi bakımından bu
aşamada birçok yöntem geliştirilmiştir. Bu yöntemler genel
olarak iki kısım altında incelenebilir. Birinci kısım doğrudan
yüz resmi üzerinde işlemler yapılarak resmin önemli
noktalarının tespit edilmesi ve bu şekilde öz nitelik
vektörünün elde edilmesidir. Eigenfaces, PCA, ICA, LDA,
LBP ve pencere ortalamaları gibi yöntemler bu tür öz nitelik
çıkarımına verilebilecek örneklerdir. İkinci kısım öz nitelik
vektörü çıkarma yöntemi ise yüz üzerinde bulunan seksene
yakın önemli noktanın bir takım resim işleme ve örüntü
tanıma yöntemleri kullanılarak bulunmasıdır. Kullanımda
genel olarak bu seksen noktadan on ila yirmi tanesi bulunur ve
bir öz nitelik vektörü elde edilir.
Bu çalışmada, öz nitelik vektörü çıkarma yöntemi olarak
pencere ortalamaları yöntemi kullanılmıştır. Yüz resmi
uygulamada verilen genişlik ve yükseklikte pencerelere ayrılır.
Sonra bu pencerelerin piksel değerlerinin aritmetik ortalaması
bulunduktan sonra en büyük gri piksel değeri 255 ‘e bölünerek
normalleştirme yapılır. Oluşan vektör genişlik*yükseklik
boyutundadır. Şekil 5’te görülen örnekte genişlik 8 ve
yükseklik 8 olarak verilmiştir. Dolayısıyla öz nitelik
vektörlerimizin boyutları 64’tür. Genişlik ve yükseklik örnekte
verildiği gibi olduğu zaman bir pencerenin genişliği 92/8= 11px ve yüksekliği 112/8=14px olmaktadır.
Şekil 5: 8 x 8 pencereye bölünmüş resim
Şekil 6’da görüldüğü resim genişliği 8’e bölündüğü
zaman 4 px kalan oluşmaktadır. Bu durumda karşımıza iki
seçenek çıkar. Bunlardan ilki bu kalan değerleri hesaba
katmadan işlemlere devam etmek olabilir. Aynı durum
yükseklik pikselleri içinde geçerlidir. İkinci seçenek olarak bu
kalan piksellerin bir şekilde değerlendirilmesi söz konusu
olabilir. Bunun için birçok yöntem geliştirilebilir. Pikseller
sabit bir renk genişlik ve yükseklik oranına bölünecek şekilde
tamamlanabilir. Veya en yakın dolu değerini kopyalama
şeklinde olabilir. Ayrıca bu yöntemler ikiye bölünüp genişlik
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
998
için hem sağa hem sola, yükseklik için hem yukarıya hem aşağıya olacak şekilde eşit olarak dağıtılabilir.
Uygulamada kalan pikseller Şekil’6 de olduğu gibi 0x00
ile genişlik oranına bölünecek şekilde (örneğimizde genişlik 8
olduğu için 96 ya) yukarıya tamamlanmıştır. Bu sayede tüm
piksellerin kullanılması sağlanmıştır.
Şekil 6: Kalan pikseller 0x00 ile tamamlanmıştır
Bu işlemin çalışmaya oldukça katkısının olduğu
gözlenmiştir. Tanıma oranının %3-4 oranında artmasına ve
eğitimdeki döngü sayısının neredeyse yarıya düşmesine vesile
olmuştur. Bunun sebebi de bu kalan piksellerde bazen kişinin
kulağı, gözü, burnu ve ağzı gibi belirleyici özelliklerinin
bulunmasıdır. Şekil 7’de uygulamanın öz nitelik çıkarma ekranı gösterilmektedir.
Şekil 7: Öznitelik vektörü çıkarma ekranı
3.3. Sınıflandırma
Uygulamada sınıflandırıcı olarak geri beslemeli yapay sinir
ağı kullanılmıştır. Ağın giriş değerleri resmin öz nitelik
vektörüdür. Giriş düğüm sayısı öz nitelik çıkarmada belirtilen
genişlik * yükseklik kadardır. Örneğimizde bu değer 8*8
olduğu için 64’tür. Çıkış düğüm sayısı ise her kişi için doğru
bir çıkış olacak şekilde düşünülmüştür. ORL veri tabanında 40
kişi olduğu için ağın çıkış düğüm sayısı da 40’tır. Her kişi için
doğru bir çıkış olacak şekilde beklenen değer kişinin indeksine
eşit olduğu çıkış düğümü 0.9 diğer düğümler 0.1 şeklindedir.
Gizli katmandaki düğüm sayısı ise giriş ve çıkış katman
düğüm sayılarından hangisi fazla ise o kadardır. Kullanılan
çok katmanlı idrak ağı (Multi Layer Perceptron - MLP) yapısı
64:64:40 biçimindedir. Uygulanan ağ modeli Şekil 8’de gösterilmiştir.
Şekil 8: Uygulamada kullanılan yapay sinir ağı yapısı
Uygulamanın ikinci adımı yapay sinir ağının
eğitilmesidir. Şekil 9’da görüldüğü üzere yapay sinir ağının
parametreleri ayarlanabilmektedir. Durma kriteri olarak hata
oranı çok küçük verilirse döngü kriteri ile duracaktır. Hata
kriteri normal verilip durma kriteri çok yüksek verilirse bu
durumda hata kriterine göre sonlanma olacaktır. Her iki
durumda eğitim sonunda ulaşılan minimum hata, döngü sayısı ve işlem süresi ekrana basılır.
Şekil 9: Yapay sinir ağının eğitim ekranı
Eğitim verileri olarak hangi resimlerin verileceği
ekrandan seçilir. Uygulamada genellikle eğitim verisi olarak
tek sayı numaralı resimler verilmiş, çift sayı numaralı veriler
test için ayrılmıştır. Eğitim verileri yapay sinir ağına
gösterilirken önce bir kişinin seçilen resimlerinin tümü, sonra
ikinci kişinin resimlerinin tümü ve bu şekilde bütün kişilerin
seçilen eğitim resimlerinin tümü gösterilmiştir. Bu durumda
ağ öğrenme yapmamış ezberleme yapmıştır. Farklı resimler
gösterildiği zaman bütün kişiler için tek bir sonuç döndürecek
şekilde çalışmıştır. Daha sonra eğitimde örneklerin gösterilme
sırası değiştirilmiş, önce tüm kişilerin seçilen ilk resimleri,
sonra tüm kişilerin seçilen ikinci resimleri ve bu şekilde tüm
kişilerin seçilen resimleri kişi sırasına göre değil resim sırasına
göre ağa gösterilmiştir. Bu sayede ağ öğrenmiş ve doğru sonuç
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
999
üretmeye başlamıştır. Hata kriteri olarak ortalama karesel hata (Mean Square Error - MSE) kullanılmıştır.
Uygulamanın son adımı yapay sinir ağının test edilmesi
aşamasıdır. Burada kullanıcı isterse önce eğitim verisinde
kullanmış olduğu resimleri seçerek ağın doğru öğrenip
öğrenmediğini doğrulayabilir. İsterse eğitim esnasında
göstermediği verileri seçip ağdan tanımasını isteyebilir. Bu
çoklu testte kullanılmış olan test setindeki resim sayısı, doğru
tanıma sayısı, yanlış tanıma sayısı ve doğru tanıma oranı
ekranda gösterilir. Ayrıca yanlış tanınmış olan resimler ve bu
resimlerin kimlere ait olduğu ile kim olarak tanındığı ekrana
yazdırılır. İstenirse tek bir resim seçilerek de doğrulama ve
test işlemi yapılabilir. Bu işlemlerin yapıldığı test ekranı şekil
10’da gösterilmiştir.
Şekil 10: Yapay sinir ağının test edilmesi
Uygulama test sonucu ekranında hangi resimlerin hatalı
tanındığı gösterilmiştir.
4. Sonuçlar ve Tartışma
Bu çalışmada, pencere ortalamaları ve yapay sinir ağları
kullanılarak Java tabanlı bir yüz tanıma yazılımı
gerçekleştirilmiştir. Geliştirilen yazılımın performansını
görmek için literatürde sıkça kullanılan ORL veri tabanından
yararlanılmıştır. Çalışma sonucunda 96% ila 97% oranında bir
tanıma yüzdesi gözlemlenmiştir. Bu sonuç, J. Er ve
diğerlerinin[6] çalışmasından sonra en iyi tanıma
yüzdelerinden birine sahip olmaktadır. Uygulamada
sınıflandırıcının yanlış tanımladığı kişiler incelendiği zaman
bu kişilerin gerçekte de birbirlerine benzedikleri görülmüştür.
Bunu ayırt edebilecek daha iyi bir öz nitelik vektörü çıkarımı
denenmelidir. Ayrıca çalışmada sadece bir veri tabanı
kullanılmıştır. Diğer veri tabanları da kullanılarak performans ölçümü yapılmalıdır.
Uygulama ile öz nitelik vektörü çıkarma yönteminin
biyometrik tanıma sistemlerinde ne kadar önemli olduğunun
farkına varılmıştır. İleriki çalışmalarda öz nitelik vektörü
çıkarma yöntemlerinde bahsi geçen tamamlama yöntemleri
denenecektir. Kullanılabilecek farklı özellik çıkarma ve hibrid
sınıflandırıcı yöntemleri ile tanıma yüzdesi arttırılabilir.
5. Kaynakça
[1] Kakıcı, A. (2008), “Biyometrik Tanıma Sistemleri”;
http://www.ahmetkakici.com/genel/biyometrik-
tanimasistemleri/, (Erişme tarihi: 13.06.2013).
[2] L. Sirovich and M. Kirby (1987). "Low-dimensional
procedure for the characterization of human faces".
Journal of the Optical Society of America A 4 (3):
519–524. doi:10.1364/JOSAA.4.000519.
[3] M. Turk and A. Pentland (1991). "Face recognition
using eigenfaces". Proc. IEEE Conference on
Computer Vision and Pattern Recognition. pp. 586–
591.
[4] Hua Yu, Jie Yang, “A Direct LDA Algorithm for
High-Dimensional Data With Application to Face
Recognition. Pattern Recognition” 34(10), 2001, pp.
2067-2070
[5] Lee, S. J., Yung, S. B., Kwon, J. W. & Hong, S. H.
(1999). “Face Detection and Recognition Using
PCA”. IEEE TENCON: 84-87.
[6] M. J. Er, S. Wu, J.Lu, and H. L. Toh “Face
Recognition With Radial Basis Function (RBF)
Neural Networks”, IEEE Trans. On Neural
Networks, Vol. 13, No. 3, May 2002
[7] Karlık B. and Atamuradov V., “Principles
Component Analysis (PCA) Based Face
Recognition by Bayesian Classifier”, International
Conference on Inductive Modelling, pp. 55-62,
May, 16-22, 2010, Yevpatoriya, Ukraine
[8] Tilki B. and Karlık B., “Face Recognition by Using
Face Dimensions and Artificial Neural Networks”,
The 4th International Conferences on Information
Security and Cryptology (ISC '10), pp. 355-359, 6-8
May, 2010, Ankara, Turkey
[9] Uğur, A. C. Kınacı, "Yapay Zeka Teknikleri ve
Yapay Sinir Ağları Kullanılarak Web Sayfalarının
Sınıflandırılması", XI. Türkiye' de İnternet
Konferansı (inet-tr'06), Ankara, 1-4, 2006.
[10] Karlık B. ve Cemel Ş.Ş., “Yapay Sinir Ağları ile
Ağız Kokusundan Diyabet Tanısı”, Turkiye
Klinikleri, cilt:32(2), sayfa:331-336, 2012.
[11] Karlık B. and Olgaç A.V., “Performance Analysis of
Various Activation Functions in Generalized MLP
Architectures of Neural Networks, International
Journal of Artificial Intelligence and Expert
Systems, vol: 1(4), pp: 111-122, 2011.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
1000
Yapay Sinir Ağları ile Banka Pazarlama Kampanyalarının
Performans Tahmini
Mücella ÖZBAY KARAKUŞ1, Cemil ALTIN2, Orhan ER2
1Bilgisayar Mühendisliği Bölümü
Bozok Üniversitesi, Yozgat [email protected]
2Elektrik-Elektronik Mühendisliği Bölümü
Bozok Üniversitesi, Yozgat [email protected], [email protected]
Özetçe
20. yüzyılın ikinci yarısında temelleri atılan ve günümüzde büyük bir kitlenin üzerinde çalıştığı yapay sinir ağları, pek çok problemin analizinde ve çözümünde başarı ile kullanılmış ve artan bir hızla kullanılmaya devam etmektedir. Đlk kullanıldığı yıllarda tıp alanında ve askeri alandaki çalışmalar veya kontrol problemleri gibi farklı amaçlar için geliştirilen bu teknik günümüzde ekonomi, iktisat, endüstri mühendisliği, otomasyon, elektronik ve bilgisayar mühendisliği, elektronik devre tasarımı, çeşitli zeka problemlerinin çözümü ve optik algılama gibi hemen her disiplinde kullanılır olmuştur. Bu bağlamda bir bankanın pazarlama kampanyası dahilinde elde ettiği, şahıslara ait verilerden oluşturulan eğitim ve test setleri ile yapılandırılan yapay sinir ağının eğitilmesi sonucunda bankanın pazarlama kampanyaları için bu kişilerin belirli özellikleri baz alınarak bankada vadeli mevduat hesabı açtırma ya da açtırmama durumları incelenmiştir. Bu amaç doğrultusunda çok katmanlı yapay sinir ağı (multi-layer neural network) kullanılmış olup % 94,22 oranında bir doğrulukla tahmin edilmiştir. Anahtar Kelimeler: Banka Pazarlama Kampanyası, Yapay Sinir Ağları.
1. Giriş
Bankalar, hizmet sektörü içinde yer alan finansal aracılardır. Bankacılık halkla ilişkiler faaliyetlerinin en gelişkin olduğu işkollarından biridir ve teknolojik gelişmeleri anında uygulamaya sokan bankacılık işkolu, bu alanda değişime öncülük etmektedir [1]. Gelişen teknoloji sayesinde kullanıma giren ve etkisini gittikçe arttıran kitle iletişim araçları aynı anda milyonlarca insana ulaşıp mesajlarını aktarmakta, kamuoyunu yönlendirmekte ve insanların tutum ve davranışlarında köklü değişimlere neden olmaktadır. Yatırımcıların giderek zorlaşan rekabet ortamında var olma çabaları, yeni arayışları ve buluşları beraberinde getirmektedir [2]. Bu bağlamda kitle iletişim araçlarından biri olan telefonun banka uygulamalarındaki etkisini incelemek amacıyla hazırlanmış olan bir çalışmada bir Portekiz bankasının kendi çağrı merkezi tarafından yürütülen pazarlama kampanyası
tanıtımları incelenmiştir. 45211 kişiyle yapılan telefon görüşmeleri sırasında kişilere bazı sorular sorulmuş, o dönem geçerli olan kampanya tanıtılarak bankada mevduat hesabı açtırmaları için ikna edilmeye çalışılmışlardır. Çalışma; 2008 yılının Mayıs ayından 2010 yılının Kasım ayına kadar yapılmış olan toplam 17 kampanya için düzenlenmiştir. Elde edilen verilerden faydalanılarak kişilerin, yapılan görüşmeler sonucunda bankada mevduat hesabı açtırma ya da açtırmama ihtimallerinin tahmin edilmesine yönelik incelemelerde bulunmuşlardır.
Bu çalışma kapsamında alınan veri seti ile daha önce denenmemiş olan yapay sinir ağı modeli kullanılarak müşterilerin, bankada vadeli mevduat hesabı açıp açmamaları konusunda ön tahmin yapılması amaçlanmıştır.
2. Literatür Çalışması
Yapay sinir ağları günümüzde birçok alanda yer aldığı gibi banka kredileri alanında da yaygın bir şekilde kullanılmaktadır. Bu çalışmada kullanılan veri seti oluşturulurken, uluslararası veritabanı [3] kaynak alınarak; kişilerin çeşitli özellikleri göz önünde bulundurulmuş ve belirli kampanyalar dahilinde bankada mevduat hesabı açtırıp açtırmayacakları konusunda bir tahmin yapılması hedeflenmiştir. Bu konu ile ilgili az sayıda çalışma bulunmaktadır. Ref [4] farklı veriler ile yaptığı çalışmada yapay sinir ağlarını kullanmış olup elde ettiği sonuçlara göre kredi ölçümü için kullanılan yapay sinir ağı modelleri içerisinde PNN ve MLP’nin diğer modellerden daha iyi performans sağladığını belirtmiştir. Ref [5] ise yaptıkları çalışmada, bu çalışmada kullanılmış olan veriler için veri madenciliği (DM) yaklaşımı uygulamış ve DM modeli sonuçlarını ayarlamak için dalgalı veri madenciliği (CRISP-DM) yaklaşımını üç iterasyon süresince çalıştırmıştır. Çalışma kapsamında sınıflandırmada kullanılan SVM (Support Vector Machine- Destek vektörü) ile ROC (Receiver Operating Characteristic - işlem karakteristik eğrisi) gibi iki istatistiksel yaklaşımın karşılaştırılması söz konusudur. Sonuç olarak CRISP-DM’nin her iterasyon sonunda daha iyi sonuç verdiğini açıklamışlar ve
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
1001
en iyi sonuç olarak SVM ile elde edilen yüksek öngörü performansını kaydetmişlerdir. Çalışmada adı geçen yöntemlerin uygulanmasıyla elde edilen bulgular ışığında en yüksek performans değerinin SVM için kaldırma eğrisi (ALIFT) altında kalan alana göre %88,7 ve ROC (AUC - Area Under Curve) altında kalan alana göre ise %93,8 olduğu Tablo 3’de görülmektedir.
Tablo 1: DM ve CRISP-DM algoritmaları için her iterasyon sonunda elde edilen performanslar [5].
CRISP-DM Iteration 1nd 2nd 3nd
Instances X Attributes (Nr. Possible Results)
79354 X
59(12)
55817 X
53 (2)
45211 X
29 (2)
Algorithm NB NB DT NB DT SVM
Number of executions (runs) 1 20 20 20 20 20
AUC (Area Under the ROC Curve) 0.776 0.823 0.764 0.870 0.868 0.938
ALIFT (Area Under the LIFT Curve) 0.687 0.790 0.591 0.827 0.790 0.887
Daha önceki çalışmalarda kullanılmış olan yöntemlerden biri olan ROC eğrisi; istatistik karar teorisine dayanır [6]. ROC eğrisi; testin ayırt etme gücünün belirlenmesine, çeşitli testlerin etkinliklerinin kıyaslanmasına, uygun pozitiflik eşiğinin belirlenmesine, laboratuar sonuçlarının kalitesinin izlenmesine, uygulayıcının gelişiminin izlenmesine ve farklı uygulayıcıların tanı etkinliklerinin kıyaslanmasına olanak sağlar [7]. En yaygın kullanılan ölçüm ise, ROC eğrisinin altında kalan alandır. AUC ne kadar büyükse sonucun tahmin edilmesinde test o kadar iyi olur. Bir diğer yöntem olan Destek Vektör Makineleri (SVM) ise Weston ve Watkins [8] tarafından bulunan istatistiksel bir yöntemdir. SVM yapısal risk en küçükleme ilkesi etrafında formüle edilmiştir. Temelde SVM iki sınıflı problemlerle ilgilenir. Bu çalışma dahilinde istatistiksel herhangi bir yönteme yer verilmemiştir.
3. Veri Seti
Bu çalışmada kullanılan veri seti, uluslararası veritabanı (UCI-Irvine Machine Learning Repository) [3]’ den temin edilmiştir. Bu veri seti hazırlanırken 45211 kişiye, bir Portekiz bankasının pazarlama kampanyaları, kendi çağrı merkezi tarafından yapılan telefon görüşmeleriyle tanıtılmıştır. Uygulamada özellik olarak kullanılan parametreler şunlardır: kişinin; yaşı, mesleği, medeni hali, eğitim durumu, kredi geçmişi, yıllık ortalama gelir düzeyi (euro bazında), ev ve ihtiyaç kredisi olup olmadığı, iletişim bilgisi, son görüşme tarihi, görüşme sayısı, kampanya hakkındaki bilgisi, başka bir kampanya kapsamında görüşme yapılan gün ve önceki pazarlama kampanyası sonuçlarıdır. Bu özelliklerin geçerliliği uzman görüşlerine dayandırılmıştır. Kullanılan toplam veri 45211 olup, 31648 adedi (tüm verinin yaklaşık %70’i) eğitim verisi, 13563 adedi (tüm verinin yaklaşık %30’u) ise test verisi olacak şekilde ve 16 giriş, 2 gizli katman ve 1 çıkış katmanlı (multi-layer) yapay sinir ağının eğitiminde kullanılmış olup yukarıda bahsi geçen özelliklere bağlı olarak pazarlama kampanyaları için kişilerin bankada vadeli mevduat hesabı açtırma ihtimallerinin tahmin edilmesine çalışılmıştır.
4. Metot
Bu çalışma kapsamında kullanılan yapay sinir ağı yapısı; ağırlıkların geri yayılma algoritması kullanılarak gerçekleştirilen, iki gizli katmanlı, MLNN ağıdır (1 giriş katmanı, iki gizli katman, bir çıkış katmanı). Gizli katman sinirleri (birinci katman için 10, ikinci katman için 5 adet) ve çıkış katman sinirleri için nonlineer sigmoid aktivasyon fonksiyonu kullanılmıştır. Bu kriterler en iyi sonucu üretecek şekilde deneme-yanılma yoluyla elde edilmiştir. Bu sistem 16 adet özellik (girdi vektörünü oluşturan durum sayısı) ve 2 adet durum sınıflandırılması (Mevduat hesabı açtırmak ve açtırmamak) içermektedir. Literatürde sınıflandırma için yapılan çalışmalarda sıklıkla PNN ağının daha başarılı sonuçlar ürettiği görülmesine [9-10] rağmen bu çalışmada kullanılan veri sayısı çok fazla olduğundan PNN ağı beklenen performansta başarı göstermediğinden çalışma MLNN ağıyla denenmiş ve başarılı sonuçlar elde edilmiştir.
En genel anlamda yapay sinir ağları ileri beslemeli ve geri beslemeli ağlar şeklinde iki ana grupta düşünülebilir. Đleri beslemeli ağlarda bilgi, girdi katmanından çıktı katmanına doğru ilerler. Buna aktivasyon yönü de denir. Bu tür yapay sinir ağına örnek olarak tek ve çok katmanlı perseptron verilebilir. Bu tür ağlar denetimli öğrenme teknikleriyle eğitilir [11]. Şekil 1’ de bir nöronun matematiksel modeli gösterilmektedir [12]:
Şekil 1: Nöronun Matematik Modeli (Mathematics Model of Neuron) [12].
(1)
(2)
Yukarıdaki (1) ve (2) denklemlerinde S; Toplam fonksiyonu,
ui; giriş fonksiyonu, wi; ağırlıklandırma faktörü, ᵩ; çıkış fonksiyonu, ᴪ(s); aktivasyon fonksiyonu ve θ ise eşik değeridir. (1) denkleminde ağırlıklı toplamın oluşturulması, (2) denkleminde ise nöron çıkışının hesaplanması verilmektedir [12]. Bu çalışmada geri beslemeli ağla çalışan çok katmanlı perseptron modeli tercih edilmiştir. Basit bir perseptron, sistem tanımlamasında başarı ile kullanılabilirken birçok gerçek uygulama lineer olmayan özellikler içerdiği için basit perseptron modelleri yetersiz kalabilir. Basit perseptronların lineer olarak araştırılamayan fonksiyonları gerçekleştirmekteki
θθ −=−+++= ∑=1
3322111 .........i
iinn WuWuWuWuWuS
)(Sψϕ =
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
1002
yetersizliği çok katmanlı perseptronlarda (MLP) geçerli değildir [13]. MLP ağları, algılayıcı birimlerin bir araya gelerek oluşturduğu bir ağ yapısıdır. MLP'de de üç temel katman vardır. Bunlar giriş katmanı, gizli katman ve çıkış katmanıdır. Giriş ve çıkış katmanı dışındaki tüm katmanlar gizli katman olarak adlandırılır ve bir veya daha fazla sayıda bulunabilir. Bu yapı Şekil 2’de görüldüğü biçimde sıralanır.
Şekil 2: Çok Katmanlı Ağ Yapısı (Multi Layer Neural Network)
Genelde MLP ağlarının eğitiminde kullanılan en yaygın yöntem hatanın geriye yayılım algoritmasıdır [14]. Günümüzde bu algoritma, ses tanıma problemlerinden doğrusal olmayan sistem problemlerine kadar yapay sinir ağları ile çözüm üretilen birçok alanda başarı ile kullanılmaktadır [15]. Uygulamalarda nöron cevabının, girdilerin sürekli bir fonksiyonu olmasını gerektiren durumlarda sigmoid tipi aktivasyon fonksiyonu kullanılır. Geriye yayma modeli her yerde diferansiyeli alınabilen bir aktivasyon fonksiyonu gerektirir [16]. Grafiği aşağıda verilen sigmoid tipi aktivasyon fonksiyonu türevi alınabilir ve sürekli problemlerin çözümünde kullanılmaktadır. Sigmoid tipi aktivasyon fonksiyonunun denklemi aşağıdaki gibidir [12].
(3)
(3)
Şekil 3: Sigmoid Tipi Aktivasyon Fonksiyonu (Sigmoid Activation Function) [12].
5. Sonuç
Bu konuda yapılan çalışmaların az olması münasebeti ile yapay sinir ağları da denenmiş olup bu amaç doğrultusunda uluslararası veri tabanından alınan veriler işlenmiştir. Ayrıca bu çalışma ile pazarlama kampanyaları için kişilerin bankada vadeli mevduat hesabı açtırma ihtimallerinin tahmin edilmesine yönelik uygulama sonucunda MLNN ağlarının kullanılmasıyla elde edilen doğruluk oranları ile bu konuda literatüre geçmiş olan çalışmaya [5] ait sonuçlar Tablo 1’de karşılaştırmalı olarak verilmiştir. Çalışmada kullanılan 45211 veriden 31648 (tüm verinin yaklaşık %70’i) adedi eğitim verisi, 13563 adedi (tüm verinin yaklaşık %30’u) ise test verisi olarak yapay sinir ağının oluşturulması için kullanılmış ve bankanın pazarlama kampanyaları için kişilerin bankada vadeli mevduat hesabı açtırma ya da açtırmama durumları % 94,22 oranında bir doğrulukla tahmin edilmiştir.
Tablo 2: Bu çalışmada elde edilen doğruluk oranlarının literatüre geçmiş çalışmalar ile karşılaştırılması.
Çalışmalar Yapay Sinir Ağları Sınıflandırma Doğruluğu (%)
Referans [5] ROC-AUC 93,8
Referans [5] SVM-ALIFT 88,7
Bu çalışma Đki Gizli Katmanlı MLNN
94,22
Elde edilen sonuçlar literatür çalışmalarıyla karşılaştırıldığında sonuçların birbirine çok yakın olmasına rağmen MLNN ağı kullanılmasının sonucun doğruluğunda pozitif bir etki yarattığı yadsınamayacak bir gerçektir. Ayrıca yapay sinir ağlarının uygulanmasının kolay ve anlaşılır olması ve yaygın kullanım alanlarının bulunması nedeni ile tercih sebebi olmuştur. Sonuçta istatistiksel yöntemlere karşın yapay sinir ağının daha başarılı bir sonuç elde edilmesini sağladığı görülmüştür. Bu yöntemin bankalar ve aynı zamanda pazarlama çalışmaları bulunan her kuruluş tarafından aktif bir şekilde faydalanılabileceği düşünülmektedir.
SeS
−+=
1
1)(ψ
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
1003
Đlerleyen çalışmalarda veri sayısının fazla olmasından dolayı anlamlı sonuçlar alınamayan YSA yöntemlerinde, bu sorunların kaynakları belirlenerek yöntemin geliştirilmesi ya da yeni yöntemler oluşturulması amaçlı çalışmalar yapılabilir.
Kaynakça
[1] Tolon, M., “Ticari Bankalarda Pazarlama Stratejilerinin Uygulanması ve Türkiye"deki Ticari Bankalar Üzerine Bir Araştırma”, Verimlilik Dergisi, No 4, 63-88, 2004.
[2] Baybars B., “Türkiye’de Banka Reklamcılığı”, Đstanbul Üniversitesi Đletişim Fakültesi Dergisi, 177-180, 1996.
[3] (UCI-Irvine Machine Learning Repository) Uluslar arası
veri tabanı web sitesi: http://archive.ics.uci.edu/ml/datasets/Bank+Marketing [Son Erişim: 19.02.2013)
[4] Bahrammirzaee A., “A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems”, Neural Comput & Applications, Vol 19, Issue 8, 1165–1195, 2010.
[5] S. Moro, R. Laureano and P. Cortez. , “Using Data
Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology”, Proceedings of the European Simulation and Modelling Conference - ESM'2011, 117-121, Guimarães, Portugal, October, 2011.
[6] Tomak L., Bek Y., “Đşlem karakteristik eğrisi analizi ve
eğri altında kalan alanların karşılaştırılması”, Journal of Experimental and Clinical Medicine-Deneysel ve Klinik Tıp Dergisi, Vol 27, No 2, 58-61, ,Samsun, 2010.
[7] Dirican A., “Tanı testi performansının değerlendirilmesi
ve kıyaslanması”. Cerrahpaşa Tıp Dergisi, 32, 25-30, 2001.
[8] Weston J., Watkins C., “Support veclor machines for
multiclass”, Proceedings of ESANN.99, Belgium. 1999. [9] Bolat B. , Küçük Ü. , Yıldırım T. , “Aktif Öğrenen PNN
ile Konuşma/Müzik Sınıflandırma” . Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu, 187-189, 2004.
[10] Bolat B. , “Recognition of The Reed Instrument
Sounds By Using Statistical Neural Networks”. Journal of Engineering and Natural Sciences- Mühendislik ve Fen Bilimleri Dergisi, 2005/2, 36-42, 2005.
[11] Civalek Ö., “Dairesel Plakların Nöro-Fuzzy Tekniği ile
Analizi”, DEÜ Mühendislik Fakültesi Fen ve Mühendislik Dergisi, Cilt. 1, No 2, 13-31, 1999.
[12] Güngör M., Fırat M., “Askı Madde Konsantrasyonu ve
Miktarının Yapay Sinir Ağları ile Belirlenmesi”, ĐMO Teknik Dergi, 3267-3282, Yazı 219, 2004.
[13] Montague, G. A., Willis M. J., Tham M. T., Morris A. J.,
“ Artificial Neural Network Based Multivariable Predictive Control”, Second InternationalConference on Artificial Neural Networks, Newcastle, UK, 119-123, 1991.
[14] Bakırcı U., Yıldırım T., “Đleri Beslemeli Ağlarla SPECT
Görüntülerinden Kardiyak Problemlerin Teşhisi”, 0-7803-8318-4104/$20.00© 2004 IEEE, 103-105, 2004
[15] Özel Y., “Farklı Kömür Yakıtları ile Elektrik Enerjisi
Üretimi Ve Yakıt Performansının Yapay Zeka Yöntemi Kullanılarak Saptanması”, Doktora Tezi, Marmara Üniversitesi, Elektrik Eğitimi, Đstanbul, 2006.
[16] Kang, H.T., Yoon, C.J., “Neural Network Approaches to
Aid Simple Truss Design Problems”, Microcomputers in Civil Engineering, Vol 9, 211-218, 1994.
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
1004