09 wavelet (dalgacik dÖnÜŞÜmÜ) abdülkadir Şengür Ödendi 3 syf 36 38

Upload: abdurrahman-hazer

Post on 07-Jan-2016

21 views

Category:

Documents


0 download

DESCRIPTION

dalgacık

TRANSCRIPT

WAVELET (DALGACIK DNM) VE YAPAY SNR AI KULLANARAK SES SNYALNDEN KONUMACI TESPT

166

PAGE 166PAGE Dou Anadolu Blgesi Aratrmalar; 2007 Murat KZ ve dierleri

WAVELET (DALGACIK DNM) VE YAPAY SNR AI KULLANARAK SES SNYALLERNDEN KONUMACI TESPT

*Murat KZ, *Mehmet AKIN, *Bahattin KURT, *Hseyin ACAR*Dicle niversitesi, Mhendislik Mimarlk Fak. Elektrik Elektronik Mhendislii Bl.-DYARBAKIR [email protected] , [email protected] , [email protected], [email protected]__________________________________________________________________________________________________________________________________________________ZETBu almada amalanan, mikrofon yardm ile kayt edilen ses sinyallerinden wavelet dnm ve yapay sinir a yardm ile konumac kimliinin tespit edilmesidir. Bu ama dorultusunda ses sinyalleri PC ortamna mikrofon yardm ile alnd, n ileme ve grltden temizleme Wavepad ve Wave Flow program-lar ile yapld. Matlab tabanl hazrlanan model yardm ile hazrlanan ses dosyalarndan veriler paracklara ayrtrlmtr ve hazrlanan YSA program ile snflandrma ilemi gerekletirilmitir.

Anahtar Kelimeler : Wavelet, YSA, Konumac Tanma, Ses leme__________________________________________________________________________________________________________________________________________________RECOGNATION THE SPEAKER IDENTY BY MEANS OF WAVELET ANALYSIS AND NEURAL NETWORKABSTRACTThe purpose of this project is to recognize the speaker identy by means of wavelet analysis and neural network aproach. After sampling the voice signal generated from 10 different person (6 males and 4 females) , we use Waveflow and Wavepad shareware programs to denoise the signals. With the help of a Matlab Simulink model we generated the useable data from this voice signals. We use this data as an input signal for Matlab based neural network. The neural network classified the voice data for different speakers.

Keywords: Wavelet, Neural Network, Speaker Recognition, Voice Processing__________________________________________________________________________________________________________________________________________________1. GRKonumann temeli ierdii sesli ifadelerdir. Ancak sesli ifadenin etki snrlar ortamla kstl ol-duundan sesli ifadenin elektriksel sinyallere dn-trlmesi gereklidir. Bu amaca ynelik ilk gerek-letirim telefon ile salanmtr. Telefon seslerin elektriksel sinyallere dntrlmesine dayanr. Te-lefonun icad iletiimin tarihsel geliimi iinde en nemli admdr. Sesli ifade zerinde aratrmalar telefonun icad ile balamtr. Bu aratrmalar sonu-cunda ilk sesli ifade kodlama teknii olarak 1938de Genlik kodlamas modlasyon (PCM, Pulse Code Modulation) teknii bulunmutur. Bu yntemle sesli ifade rneksel olarak kodlanmaktadr. 1960dan sonra saysal elektronik devrelerin ve bilgisayarlarn gelimesiyle sesli ifadenin saysal olarak kodlanma-s da mmkn olabilmitir. Sesli ifade tanma, bir sesli ifade sinyalinin snrl sayda simgelerle ifade edilmesi olarak tanmlanabilir. Ama ses sinyalinin yazl edeerinin bulunmasdr. Sesli ifadenin yazl karlnn bulunmas insan-bilgisayar aras iletii-mi ok daha kolay bir hale getireceinden, bilgisa-yarn daha kullanl bir duruma gelmesini salar. Yani insan-bilgisayar aras iletiim doal bir olay haline gelir. Bu nedenle, bu konu ok rabet gr-mtr [4], [5], [8], [11], [12].Tez almas konusu olarak ele alnan ses ta-nma, ses ilemenin bir alt basama olarak dn-lebilir. Ses ileme ve ses tanma konularn dzen-leyen tipik bir snflandrma ekil 1de verilmitir [7], [8], [11].nsanlarn ses retme ve sesi alglama sistem-lerindeki organlarn yaplarndan kaynaklanan baz snrlamalardan dolay, ses dalga eklinde deiime sebep olan yaplarn pozisyonlarnn ksa zaman ara-lklarnda deimedii farz edilebilir [7]. Konuma grtlan, titreen ses telleri tarafndan rettii hava vurularyla tahrik edilmesi sonucu oluur. Ses telle-ri periyodik salnmlar oluturur ve bu salnmlarn frekanslarna temel frekans ad verilir [1]. Konuma reten ve kodlayan sistemler bu karakteristik mo-delleri gz nnde bulundurarak hazrlanrlar.

ekil 1. Ses lemenin Snflandrlmas2. YNTEM

2.1.SESLERN DOSYALARA KAYDEDLME-SBilgisayar ve sound blaster pro 16 bit stereo ses kart ve dinamik mikrofon yardm ile sesler mo-no olarak kaydedilmitir. Mono olarak kaydedilme-sinin nedeni kayt dosyalarnn daha az yer tutmas iindir. Kayt frekans 11025 Hz olarak kullanlm-tr.

Wavepad ve Waveflow programlar yardm ile ses dosyalar grltden temizlenmi ve kayt ol-mayan bo ksmlar kaytlardan karlmtr. Sesle-rin kayt ortam normal ev ortamdr. Tamamyla olmasa bile bilgisayar fannn sesi hari sessiz kabul edilebilir. Grltden arndrma ilemi esnasnda %5 eik deeri kullanlmtr. %5 eik deeri dene-meler sonunda yeterli olarak grlmtr.

Her konumacya ait ard arda seslendirilen 10 szck ieren esas ses kayd iin ses kaydnn ilk harfinden itibaren ayrm iin gerekli olan kadar ve seslendirilen szck kullanlarak ses dosyalarnn adlar oluturulmutur. 10 adet szck ieren her bir dosya tekrar 10 dosya olacak ekilde yine ayn program yardm ile kesimlenmitir.2.2. SES DOSYALARINDAN VER DOSYALA-RININ ELDE EDLMES :Dosyalanm ve rneklenmi ses bilgisinin YSA ile tanma ilemine geilebilmesi iin veri ha-line dntrlmesi gerekir[4]. Windows altnda ka-yt yaplan ses rnekleri .wav uzantl dosyalar hali-ne gelmitir. Daha sonra bu dosyalar Matlab progra-m yardm ile veri dosyalar haline dntrl-mtr.Veri gruplar oluturulmadan nce Matlab Wavelet Toolbox yardm ile ses sinyalinde analiz almalar yaplm ve orijinal sinyali en iyi temsil eden sinyalin Db2 ve 10ncu seviye yaklam oldu-u grlmtr. Analiz almas esnasnda sesler kiilere gre ve ayr gruplar halinde incelenmi ve en uygun ayrtrma parametresi ve seviyesi tespit edilmeye allmtr [13].Ses rneklerine ait Db2 ve a10 (Level 10 Approximation) sinyalinin seslerin karakteristii ta-d ve konumac tanmada ses karakteristii ola-rak kullanlabileceini sylemek teorik olarak mm-kn grlmtr. Bu n almalardan yola karak tm ses rnekleri iin Db2 a10 sinyali ses rnekle-rinden elde edilmi, 2nci seviye ayrm ile 4 alt bant elde edilmi ve bu 4 alt banda ayrtrlmtr. Verinin son hali almada snflandrc olarak kul-lanlacak YSAnn giri sinyalleri olarak kullanl-mtr.

2.3.YSANIN ETLMESHata geri yaylml yapay sinir ann eitim srecindeki renme iterasyonlarna gre sistem hatasnn deiimi ekil 1.2de gsterilmitir. An eitim sresince herhangi bir kararszlk ve prz olmamtr.

ekil 2. 1770 Blt in Hata Karelerinin ve renme Orannn DeiimiEitim Parametreleri aada olduu gibidir ;

df=100; % tekrar sayisi

sse=0.005; % minimum hata

mitr=80000; % maksimum iterasyon

lr=0.05; % grenme orani (0.01,....,1----- 0.005)

lr_inc=1.05; % grenme oraninin artirimi(1.05 )

lr_dec=0.005; % grenme oraninin azaltimi( 0.005)

mr=0.95; % momentum katsayisi (0....1)

er=1.04; % hata orani -adaptif lr iin gerekli- 1.043. BULGULAR VE TARTIMA

Tablo 1. Test-1 Grubuna Ait Baar Yzdeleri

10 kiiye ait 10 farkl ses iaretleri YSAnn eitimi iin giri olarak uygulanmtr. Bu grup iin-den Test-1 grubundaki iaretler YSAya test iin uygulanarak Tablo-1deki sonu elde edilmitir. Bu sonular neticesinde YSAnn konumaclarn test iin kullanlan gruptaki DENEME kelimesi temel alnarak eitilmesi sonucunda, iaret baml bir ortam baars % 99,30 olarak olutu.Tablo 2. Test-2 Grubuna Ait Baar Yzdeleri

Kelimeden bamsz olarak YSAnn baar yzdesinin test edilebilmesi iin oluturulan Test-2 grubu veri YSA nn giriine veri olarak uyguland. Sonular Tablo 2de gsterilmitir. Tablo 2 esas al-narak kelimeden bamsz olarak YSAnn baar yzdesi % 85.41 olarak bulunmutur.Tablo 3. Test Veri Grubuna Dahil Olmayan in YSAnn Baar Yzdeleri

Hem eitime hem de test gruplarna katlma-yan Konumac-1, Konumac-2,. Konumac-3den DENEME kelimesini seslendirmeleri istenmitir. Bu konumaclara ait ses rneklerinden elde edilen veri-ler YSAa giri olarak uygulanm ve sonular Tab-lo 3de verilmitir. Tablo 3den kan sonu; YSA nn kii baml sistemler iin uygun sonular re-tebildiidir. Kii bamsz olarak deerlendirildiin-de kan sonularn deerlendirilemeyecek seviyede ktlar olduu gzlenmitir.

4. SONU

Tm bu almalar insan sesinin ses oluu-munda etkin rol olan grtlak ve ses yolu yapsnn farkl olduunu ve kii iin zaman zaman eitli ne-denlerden dolay (hastalk gibi) yapsnda deiiklik olsa bile esas itibar ile deimedii ve her kii iin ifade edilebilecek bir karakter taddr. Bu sonular neticesinde YSAnn, konuma-clarn DENEME kelimesi temel alnarak eitilmesi sonucunda, iarete baml bir ortam baars % 99,30 olarak olumutur. Kelimeden bamsz ola-rak YSAnn baar yzdesi % 85.41 olarak bulun-mutur.

Tablo 3den kan sonu, almada kullan-lan YSAnn kii baml sistemler iin uygun so-nular retebildiidir. Kii bamsz olarak deer-lendirildiinde kan sonularn deerlendirileme-yecek seviyede ktlar olduu gzlenmitir.

Yaplan bu alma ile olduka baarl bir oranda Wavelet ve YSA kullanarak ses sinyallerin-den konumac kimliinin tespit edilmesi salanm-tr.5. KAYNAKLAR1. DEMR, H, 2000,Wavelet Dnm ve aret leme Uygulamalar, Yksek Lisans Tezi, s-tanbul niversitesi.2. ELMAS, ., 2003, Yapay Sinir Alar Kuram, Mimari,Uygulama), Sekin Yaynlar.3. ERDEM, T, Yapay Sinir Alar Kullanarak Konumac Tanma Uygulamas, Yksek Li-sans Tezi, Nide niversitesi.4. FURUI, S., 1989. Digital Speech Processing, Synthesis, and Recognition. Marcel Dekker Inc.5. NAL, M, 2001, Yapay Sinir Alar Tabanl Konumac Tanma, Doktora Tezi, Kocaeli niversitesi.6. KOHONEN, T., 1988. An introduction to neural computing. Neural Networks, vol 1, pp.3-167. MENGOLU, E., 1999 Bir Tke Sesli fade Tanma Sisteminin Kural Tabanl Tasar-m ve Gerekletirimi, Master Tezi, Hacettepe niversitesi.8. PICONE, J., W., 1993. Signal modelling techniques in speech recognition. Proceedings of the IEEE, vol. 81, no. 9, pp. 1215-1247.9. RABINER, L., R,. Schafer, R., W., 1978. Digi-tal processing of speech signals. Prentice Hall Inc.10. RABINER L. R., JUANG B. H., 1993, Funda-mentals of Speech Recognition, Prentice Hall, Englewood Cliffs.11. ROBINSON, T., 1995. Speech Analysis. Lec-ture Notes.12. SYDRAL A., BENNETT R., GREENSPAN S., 1995, Applied Speech Technology, CRC Press.13. TEBELSKIS, J., 1995, Speech Recognition Using Neural Networks, PhD. Thesis, Carne-gie Mellon University, Pittsburgh Pennsylvania.14. YCETRK, A. C., 2000, Yapay Sinir Alar Kullanlarak rnt Snflandrma ve Tanma, Doktora Tezi, Ege niversitesi.

PAGE 36